免费可以看的无遮挡av无码|国产在线拍揄自揄视频网站|在线无码精品视频播放在|欧美亚洲国产成人精品,国产成人久久77777精品,亚洲欧美视频在线观看,色偷偷色噜噜狠狠网站久久

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁(yè)  >  技術(shù)干貨  > ?Python簡(jiǎn)單兩步實(shí)現(xiàn)天氣爬蟲(chóng)采集器

?Python簡(jiǎn)單兩步實(shí)現(xiàn)天氣爬蟲(chóng)采集器

來(lái)源:千鋒教育
發(fā)布人:xqq
時(shí)間: 2023-11-06 03:54:15 1699214055

說(shuō)道爬蟲(chóng)大家或許感覺(jué)非常神秘,其實(shí)它沒(méi)有我們想象的那么神奇(當(dāng)然,google和baidu的爬蟲(chóng)是一場(chǎng)復(fù)雜和強(qiáng)大的,它的強(qiáng)大不是爬蟲(chóng)本身強(qiáng)大,而是后臺(tái)的數(shù)據(jù)處理和數(shù)據(jù)挖掘算法非常強(qiáng)大),今天我們就來(lái)揭開(kāi)它神秘的面紗。呵呵,簡(jiǎn)單兩步就可以實(shí)現(xiàn)一個(gè)網(wǎng)頁(yè)天氣爬蟲(chóng)程序。。。

爬蟲(chóng)簡(jiǎn)單說(shuō)來(lái)包括兩個(gè)部分:1.獲得網(wǎng)頁(yè)文本信息。2.數(shù)據(jù)分析,獲取其中我們想要的數(shù)據(jù)。

1、獲得網(wǎng)頁(yè)文本信息。

python在獲取html方面十分方便,有了urllib庫(kù)的幫助,只需要幾行代碼就可以實(shí)現(xiàn)我們需要的功能。

#引入urllib庫(kù)

importurllib

defgetHtml(url):

page=urllib.urlopen(url)

html=page.read()

page.close()

returnhtml

這里返回的就是網(wǎng)頁(yè)的源代碼,也就是html代碼。

那我們?nèi)绾螐闹械玫轿覀兿胍男畔⒛?那就需要用到在網(wǎng)頁(yè)分析里面最最常用的工具-正則表達(dá)式了。

2、根據(jù)正則表達(dá)式等獲得需要的內(nèi)容。

使用正則表達(dá)式時(shí)需要仔細(xì)觀察該網(wǎng)頁(yè)信息的結(jié)構(gòu),并寫(xiě)出正確的正則表達(dá)式。

python正則表達(dá)式的使用也很簡(jiǎn)潔:

#引入正則表達(dá)式庫(kù)

importre

defgetWeather(html):

reg='(.*?).*?(.*?).*?(.*?)'

weatherList=re.compile(reg).findall(html)

returnweatherList

說(shuō)明:

其中reg是正則表達(dá)式,html是第一步獲得的文本。findall的作用是找到html中所有符合正則匹配的字符串并存放到weatherList中。之后再枚舉weatheList中的數(shù)據(jù)輸出即可。

這里的正則表達(dá)式reg有兩個(gè)地方要注意。

一個(gè)是“(.*?)”。只要是()中的內(nèi)容都是我們將要獲得的內(nèi)容,如果有多個(gè)括號(hào),那么findall的每個(gè)結(jié)果就都包含這幾個(gè)括號(hào)中的內(nèi)容。上面有三個(gè)括號(hào),分別對(duì)應(yīng)城市、最低溫和最高溫。

另一個(gè)是“.*?”。python的正則匹配默認(rèn)是貪婪的,即默認(rèn)盡可能多地匹配字符串。如果在末尾加上問(wèn)號(hào),則表示非貪婪模式,即盡可能少地匹配字符串。在這里,由于有多個(gè)城市的信息需要匹配,所以需要使用非貪婪模式,否則匹配結(jié)果只剩下一個(gè),且是不正確的。

以上內(nèi)容為大家介紹了Python簡(jiǎn)單兩步實(shí)現(xiàn)天氣爬蟲(chóng)采集器,希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。http://www.em-kal.com/

聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請(qǐng)您保持通訊暢通,專(zhuān)屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
Python標(biāo)準(zhǔn)庫(kù)中自帶的單元測(cè)試框架

Unittest是Python標(biāo)準(zhǔn)庫(kù)中自帶的單元測(cè)試框架,支持自動(dòng)化測(cè)試,測(cè)試用例的初始化和關(guān)閉測(cè)試用例的聚合等功能。有一些類(lèi)似于Java中的Junit單元...詳情>>

2023-11-06 06:57:52
有Java基礎(chǔ)的學(xué)習(xí)python應(yīng)該注意些什么

首先,對(duì)于具有Java編程基礎(chǔ)的人來(lái)說(shuō),學(xué)習(xí)Python的初期并不會(huì)遇到太大的障礙,但是要結(jié)合自己的發(fā)展規(guī)劃來(lái)制定學(xué)習(xí)規(guī)劃,尤其要重視學(xué)習(xí)方向的...詳情>>

2023-11-06 06:25:27
Python 定時(shí)修改數(shù)據(jù)庫(kù)

當(dāng)需要定時(shí)修改數(shù)據(jù)庫(kù)時(shí),一般我們都選擇起一個(gè)定時(shí)進(jìn)程去改庫(kù)。如果將這種定時(shí)任務(wù)寫(xiě)入業(yè)務(wù)中,寫(xiě)成一個(gè)接口呢,定時(shí)進(jìn)程顯得有些不太合適?如...詳情>>

2023-11-06 06:03:51
Python有哪些常用函數(shù)?

Python常用函數(shù)有哪些?我想大家都比較好奇這個(gè)問(wèn)題,今天小編特地整理了一篇有關(guān)Python常用函數(shù)的相關(guān)內(nèi)容,接下來(lái)我們一起來(lái)看看具體的內(nèi)容介...詳情>>

2023-11-06 05:49:27
Python常用的三大開(kāi)源框架

眾所周知,Python是一種腳本語(yǔ)言,具有易學(xué)、語(yǔ)法清晰、易維護(hù)等優(yōu)點(diǎn),而且具有豐富和強(qiáng)大的庫(kù),被稱(chēng)作為膠水語(yǔ)言。Python語(yǔ)言誕生較早,經(jīng)過(guò)多...詳情>>

2023-11-06 05:35:03
快速通道