AWS上传文件设置MIME Content Type问题

最近发现上传到AWS S3服务器上的文件(PDF或者图片)有个问题，在浏览器粘贴资源地址，有的文件直接在浏览器里预览，有的则是直接下载的。用curl -I 查看了下不同文件的http响应头，显示的content type一种是application/otcet-stream(有的显示application/x-download)，另一种则是application/pdf。OK，找到原因了，响应头里content type为application/otcet-stream或application/x-download的文件，浏览器直接当作文件流直接下载下来，content type为application/pdf的文件，如果浏览器设置了pdf预览，则以预览形式打开。

检查了下自己写的上传文件的代码，发现并没有显示设置content type的值，会不会是由于没有设置content type导致S3服务器分配了个默认的类型。测试了下，随意上传了个pdf，结果S3服务器上显示的http响应头里， content type显示是application/pdf，看来有可能是aws java sdk帮忙做了这件事。

一步步跟进代码,发现的确是sdk帮忙设置了content type，代码片段见com.amazonaws.services.s3.AmazonS3Client类的public PutObjectResult putObject(PutObjectRequest putObjectRequest) 方法

public PutObjectResult putObject(PutObjectRequest putObjectRequest) throws AmazonClientException, AmazonServiceException {
    ...
    // Only set the content type if it hasn't already been set
    if (metadata.getContentType() == null) {
        metadata.setContentType(Mimetypes.getInstance().getMimetype(file));
    }
    ...
}

但是感觉Mimetypes为单例，将file对象传入单例对象的方法会导致file对象无法被垃圾回收器回收吧。。。所以尽量自己设置content type避免此类情况。

目前已知1.10.67版本以上的aws java sdk里会对未显示设置的Content Type进行文件类型判断。另外一个同事用aws js sdk(版本不晓)没有显示设置content type则会被默认设置为application/otcet-stream。

更多推荐

AWS上传文件设置MIME Content Type问题