今天小千來(lái)發(fā)福利了,教大家如何從網(wǎng)上爬取美女街拍圖片,然后批量插入到word里面,沒(méi)事的時(shí)候可以拿出來(lái)養(yǎng)養(yǎng)眼不是,看下去文末附源碼獲取方式:
本文涉及知識(shí)主要包括Ajax動(dòng)態(tài)加載網(wǎng)頁(yè)爬取、requests保存網(wǎng)頁(yè)圖片以及word批量插入圖片。
第一步:分析圖片數(shù)據(jù)接口打開(kāi)今日頭條主頁(yè),搜索街拍,會(huì)出現(xiàn)好多街拍圖片
一直往下拉,圖片會(huì)一直加載,但是網(wǎng)頁(yè)url未變化,這時(shí)我們要打開(kāi)流量分析工具。以火狐瀏覽器為例,依次右鍵-查看元素-網(wǎng)絡(luò),然后點(diǎn)擊左上角清除按鈕
下拉網(wǎng)頁(yè):
出現(xiàn)一大堆加載數(shù)據(jù),這時(shí)我們打開(kāi)第一個(gè)的json文件的響應(yīng)窗口:
發(fā)現(xiàn)這返回的就是街拍圖片信息,每次返回20條,再看看它的請(qǐng)求參數(shù):
經(jīng)過(guò)試驗(yàn)發(fā)現(xiàn),timestamp和_signature是變化參數(shù),但是可以舍棄,最后以offset的變化來(lái)改變換頁(yè)(0代表第1頁(yè),20代表第2頁(yè),依次類推...)
第二步:python下載圖片準(zhǔn)備下載20頁(yè)的數(shù)據(jù)
1.首先構(gòu)造url
2.模擬請(qǐng)求數(shù)據(jù),并將返回?cái)?shù)據(jù)轉(zhuǎn)換成json格式
一定要帶上登錄后的cookie數(shù)據(jù),否則無(wú)法返回圖片信息
3.從返回?cái)?shù)據(jù)中取出標(biāo)題和圖片url
4.requests下載圖片,并以標(biāo)題命名
5.圖片效果展示
第三步:word批量插入圖片安裝docx和PIL模塊,直接pip安裝即可
1.導(dǎo)入相關(guān)模塊
2.遍歷該文件夾下所有圖片名
3.獲取每張圖片像素大小
主要是因?yàn)榻峙膱D片像素差別較大,想按原像素大小導(dǎo)入word中,img.size為元組類型數(shù)據(jù),這里用list將其轉(zhuǎn)化為列表
4.將圖片按原像素添加至word中
5.最終效果
看完了,是不是想試一試了,想要源碼的同學(xué)可以添加我們的Python技術(shù)交流qq群:790693323,加群找群管理要學(xué)習(xí)資料和項(xiàng)目代碼即可,還在等什么,等你來(lái)哦~~~~