新聞中心
創(chuàng)新互聯(lián)www.cdcxhl.cn八線動(dòng)態(tài)BGP香港云服務(wù)器提供商,新人活動(dòng)買多久送多久,劃算不套路!
這篇文章將為大家詳細(xì)講解有關(guān)Python3爬蟲中Beautiful Soup庫的安裝方法是什么,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
Beautiful Soup是Python的一個(gè)HTML或XML的解析庫,我們可以用它來方便地從網(wǎng)頁中提取數(shù)據(jù)。它擁有強(qiáng)大的API和多樣的解析方式,本節(jié)就來了解下它的安裝方式。
1. 相關(guān)鏈接
官方文檔:https://www.crummy.com/software/BeautifulSoup/bs4/doc
中文文檔:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh
PyPI:https://pypi.python.org/pypi/beautifulsoup4
2. 準(zhǔn)備工作
Beautiful Soup的HTML和XML解析器是依賴于lxml庫的,所以在此之前請(qǐng)確保已經(jīng)成功安裝好了lxml庫,具體的安裝方式參見上節(jié)。
3. pip安裝
目前,Beautiful Soup的最新版本是4.x版本,之前的版本已經(jīng)停止開發(fā)了。這里推薦使用pip來安裝,安裝命令如下:
pip3 install beautifulsoup4
命令執(zhí)行完畢之后即可完成安裝。
4. wheel安裝
當(dāng)然,我們也可以從PyPI下載wheel文件安裝,鏈接如下:https://pypi.python.org/pypi/beautifulsoup4
然后使用pip安裝wheel文件即可。
5. 驗(yàn)證安裝
安裝完成之后,可以運(yùn)行下面的代碼驗(yàn)證一下:
from bs4 import BeautifulSoup soup = BeautifulSoup('Hello
', 'lxml') print(soup.p.string)
運(yùn)行結(jié)果如下:
Hello
如果運(yùn)行結(jié)果一致,則證明安裝成功。
注意,這里我們雖然安裝的是beautifulsoup4這個(gè)包,但是在引入的時(shí)候卻是bs4。這是因?yàn)檫@個(gè)包源代碼本身的庫文件夾名稱就是bs4,所以安裝完成之后,這個(gè)庫文件夾就被移入到本機(jī)Python3的lib庫里,所以識(shí)別到的庫文件名就叫作bs4。
因此,包本身的名稱和我們使用時(shí)導(dǎo)入的包的名稱并不一定是一致的。
關(guān)于Python3爬蟲中Beautiful Soup庫的安裝方法是什么就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。
文章題目:Python3爬蟲中BeautifulSoup庫的安裝方法是什么-創(chuàng)新互聯(lián)
文章路徑:http://www.ef60e0e.cn/article/dgsoej.html