最近发现上传到AWS S3服务器上的文件(PDF或者图片)有个问题,在浏览器粘贴资源地址,有的文件直接在浏览器里预览,有的则是直接下载的。用curl -I 查看了下不同文件的http响应头,显示的content type一种是application/otcet-stream(有的显示application/x-download),另一种则是application/pdf。OK,找到原因了,响应头里content type为application/otcet-stream或application/x-download的文件,浏览器直接当作文件流直接下载下来,content type为application/pdf的文件,如果浏览器设置了pdf预览,则以预览形式打开。

检查了下自己写的上传文件的代码,发现并没有显示设置content type的值,会不会是由于没有设置content type导致S3服务器分配了个默认的类型。测试了下,随意上传了个pdf,结果S3服务器上显示的http响应头里, content type显示是application/pdf,看来有可能是aws java sdk帮忙做了这件事。

一步步跟进代码,发现的确是sdk帮忙设置了content type,代码片段见com.amazonaws.services.s3.AmazonS3Client类的public PutObjectResult putObject(PutObjectRequest putObjectRequest) 方法

public PutObjectResult putObject(PutObjectRequest putObjectRequest) throws AmazonClientException, AmazonServiceException {
    ...
    // Only set the content type if it hasn't already been set
    if (metadata.getContentType() == null) {
        metadata.setContentType(Mimetypes.getInstance().getMimetype(file));
    }
    ...
}

但是感觉Mimetypes为单例,将file对象传入单例对象的方法会导致file对象无法被垃圾回收器回收吧。。。所以尽量自己设置content type避免此类情况。

目前已知1.10.67版本以上的aws java sdk里会对未显示设置的Content Type进行文件类型判断。另外一个同事用aws js sdk(版本不晓)没有显示设置content type则会被默认设置为application/otcet-stream。

更多推荐

AWS上传文件设置MIME Content Type问题