图片爬取

在爬得书本数据后,不是有一个图片的img地址嘛~

我们还可以把他保存至本地,本次就教大家将网上的图片,批量拉进自己的电脑

1 库与数据的导入

1
2
3
4
import pandas as pd
import requests
import time
data = pd.read_csv("book_data_2.csv")

其中国data.iloc[0][4]为图片地址

类似:

1
'https://img2.doubanio.com/view/subject/s/public/s34327482.jpg'

2 爬取并转换为二进制保存

1
2
3
4
5
6
7
8
9
for i in range (0,len(data)):
url = data.iloc[i][4]
r = requests.get(url)
time.sleep(0.2) # 防止被捕
path = "./image/" + str(data.iloc[i][0]) + ".jpg" # 名字与地址
with open(path,'wb') as f:
f.write(r.content)##二进制形式
f.close()
continue