文章詳情頁(yè)

Python爬蟲(chóng)如何爬取span和span中間的內(nèi)容并分別存入字典里？

瀏覽：223日期：2022-07-15 16:32:54

問(wèn)題描述

我想把房屋概況分別抓出來(lái)并分別作為獨(dú)立的列存儲(chǔ)進(jìn)字典里，但是行內(nèi)元素沒(méi)有辦法直接用for循環(huán)摳出來(lái)。這是我的代碼：

soup.select(’.house-info li’)[1].text.strip()

這是網(wǎng)頁(yè)html代碼：

問(wèn)題解答

回答1：

其實(shí)還是很有簡(jiǎn)單的，你看這個(gè)還是有規(guī)律的，規(guī)律在于有分隔符|，我寫(xiě)了個(gè)DEMO

通過(guò)get_text()得到內(nèi)在所有內(nèi)容，然后去除空格。后面你就用split進(jìn)行分割吧，后面的不寫(xiě)了。如果有問(wèn)題再交流。

回答2：我感覺(jué)這個(gè)html代碼寫(xiě)錯(cuò)了呢,標(biāo)簽的內(nèi)容文本在標(biāo)簽外面

Python爬蟲(chóng)如何爬取span和span中間的內(nèi)容并分別存入字典里？

正確的標(biāo)簽內(nèi)容就兩個(gè):

房屋概況：

46m2

回答3：

innerText

回答4：

你這種情況，我覺(jué)得用 for 循環(huán)加上正則表達(dá)式是最方便的，如果所有模版都是這樣固定的話(huà)

回答5：

用pyquery吧

from pyquery import PyQuery as Q

Q(text).find(’.house-info li’).text()

Python 編程

上一條：python文檔怎么查看？下一條：python class嵌套怎么訪問(wèn)父類(lèi)

相關(guān)文章：

1. mac里的docker如何命令行開(kāi)啟呢？2. 關(guān)docker hub上有些鏡像的tag被標(biāo)記““This image has vulnerabilities””3. docker - 各位電腦上有多少個(gè)容器啊？容器一多，自己都搞混了，咋辦呢？4. 關(guān)于docker下的nginx壓力測(cè)試5. docker容器呢SSH為什么連不通呢？6. nignx - docker內(nèi)nginx 80端口被占用7. 如何解決Centos下Docker服務(wù)啟動(dòng)無(wú)響應(yīng)，且輸入docker命令無(wú)響應(yīng)？8. docker 下面創(chuàng)建的IMAGE 他們的 ID 一樣？這個(gè)是怎么回事？？？？9. angular.js使用$resource服務(wù)把數(shù)據(jù)存入mongodb的問(wèn)題。10. docker start -a dockername 老是卡住，什么情況？

排行榜

					
					關(guān)于docker下的nginx壓力測(cè)試
nignx - docker內(nèi)nginx 80端口被占用
關(guān)docker hub上有些鏡像的tag被標(biāo)記““This image has vulnerabilities””
docker容器呢SSH為什么連不通呢？
docker - 各位電腦上有多少個(gè)容器啊？容器一多，自己都搞混了，咋辦呢？
mac里的docker如何命令行開(kāi)啟呢？
dockerfile - 我用docker build的時(shí)候出現(xiàn)下邊問(wèn)題  麻煩幫我看一下
macos - mac下docker如何設(shè)置代理
angular.js使用$resource服務(wù)把數(shù)據(jù)存入mongodb的問(wèn)題。
docker鏡像push報(bào)錯(cuò)
docker api 開(kāi)發(fā)的端口怎么獲取？
				

日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

Python爬蟲(chóng)如何爬取span和span中間的內(nèi)容并分別存入字典里？