之前写爬虫大多是爬网页中的url,然后将url保存下来就可以了,倒还没有想过要获取真的图片到本地。

网络上有很多方法,但是很多都是本地,或者其他:

方法一:使用urllib.urlretrieve()

之前其实偶尔看到这个函数,但一直记不住它是做什么的,主要是没在实战中用上,这是最简单的方法:

import urllib

# 网络上图片的地址
img_src = 'https://img-my.csdn/uploads/201212/25/1356422284_1112.jpg'

# 将远程数据下载到本地,第二个参数就是要保存到本地的文件名
urllib.urlretrieve(img_src,'D:/1.jpg')

关于urllib.urlretrieve()的解释,来源:http://www.nowamagic/academy/detail/1302861

方法二:通过requests:

使用open

将图片流通过以二进制写模式打开文件并写入

import requests

img_src = 'https://xxx.jpg'
response = requests.get(img_src)
with open('D:/tmp.jpg','wb') as file_obj:
    file_obj.write(response.content)
使用PIL:

当项目里使用到PIL的时候,需要结合io.BytesIO()将图片流写入文件。它是用来操作二进制数据的,图片就是二进制数据了,和它相对的自然是StringIO,这是用来存str的。他们的区别就好似python读写普通文件和二进制文件。

import requests
from PIL import Image
from io import BytesIO

img_src = 'https://xxx.jpg'
response = requests.get(img_src)
image = Image.open(BytesIO(response.content))
image.save('D:/9.jpg')

更多推荐

python如何获取网络上的图片并将其保存在本地