日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

Python爬蟲必備之XPath解析庫

瀏覽:33日期:2022-06-17 09:45:54
目錄一、簡介二、安裝三、節點3.1 選取節點3.2 選取未知節點3.3 節點關系四、XPath實例一、簡介

XPath 是一門在 XML 文檔中查找信息的語言。XPath 可用來在 XML 文檔中對元素和屬性進行遍歷。XPath 是 W3C XSLT 標準的主要元素,并且 XQuery 和 XPointer 都構建于 XPath 表達之上。

Xpath解析庫介紹:數據解析的過程中使用過正則表達式, 但正則表達式想要進準匹配難度較高, 一旦正則表達式書寫錯誤, 匹配的數據也會出錯。

網頁由三部分組成: HTML, Css, JavaScript, HTML頁面標簽存在層級關系, 即DOM樹, 在獲取目標數據時可以根據網頁層次關系定位標簽, 在獲取標簽的文本或屬性。

二、安裝

pip install lxml三、節點3.1 選取節點

XPath 使用路徑表達式在 XML 文檔中選取節點。節點是通過沿著路徑或者 step 來選取的。 下面列出了最有用的路徑表達式:

表達式 描述 nodename 選取此節點的所有子節點。 / 從根節點選取。 // 從匹配選擇的當前節點選擇文檔中的節點,而不考慮它們的位置。 … 選取當前節點的父節點。 . 選取當前節點。 @ 選取屬性。 3.2 選取未知節點

XPath 通配符可用來選取未知的 XML 元素。

通配符 描述 * 匹配任何元素節點。 @* 匹配任何屬性節點。 node() 匹配任何類型的節點。

在下面的表格中,我們列出了一些路徑表達式,以及這些表達式的結果:

路徑表達式 結果 /bookstore/* 選取 bookstore 元素的所有子元素。 //* 選取文檔中的所有元素。 //title[@*] 選取所有帶有屬性的 title 元素。 3.3 節點關系

父(Parent)

每個元素以及屬性都有一個父。在下面的例子中,book 元素是 title、author、year 以及 price 元素的父:

<book> <title>Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price></book>

子(Children)

元素節點可有零個、一個或多個子。在下面的例子中,title、author、year 以及 price 元素都是 book 元素的子:

<book> <title>Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price></book>

同胞(Sibling)

擁有相同的父的節點在下面的例子中,title、author、year 以及 price 元素都是同胞:

<book> <title>Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price></book>

先輩(Ancestor)

某節點的父、父的父,等等。在下面的例子中,title 元素的先輩是 book 元素和 bookstore 元素:

<bookstore><book> <title>Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price></book></bookstore>

后代(Descendant)

某個節點的子,子的子,等等。在下面的例子中,bookstore 的后代是 book、title、author、year 以及 price 元素:

<bookstore><book> <title>Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price></book></bookstore>四、XPath實例

爬取糗事百科

import requests# 導包from lxml import etreeimport osbase_url = ’https://www.qiushibaike.com/video/’headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36’}res = requests.get(url=base_url, headers=headers)html = res.content.decode(’utf-8’)# xpath解析tree = etree.HTML(html)# 標題content = tree.xpath(’//*/a/div[@class='content']/span/text()’)# 視頻video_list = tree.xpath(’//*/video[@controls='controls']/source/@src’)index = 0for i in video_list: # 獲取視頻二進制流 video_content = requests.get(url= ’https:’ + i,headers=headers).content # 標題 title_1 = content[0].strip(’n’) # 將視頻二進制寫入文件 with open(f’Video/{title_1}.mp4’,’wb’) as f:f.write(video_content) index += 1

到此這篇關于Python爬蟲必備之XPath解析庫的文章就介紹到這了,更多相關XPath解析庫內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
久久国产日韩欧美精品| 日韩欧美一区二区三区免费看| 日韩精品国产欧美| 一区在线视频观看| 国产综合亚洲精品一区二| 亚洲性色av| 国产综合婷婷| 亚洲高清成人| 日韩天堂在线| 欧美高清一区| 国产精品毛片一区二区在线看| 久久精品一区二区国产| 午夜精品亚洲| 亚洲精品伊人| 欧美成人精品一级| 亚洲1234区| 国产手机视频一区二区| 日韩va亚洲va欧美va久久| 国产精品伊人| 成人午夜毛片| 红桃视频国产精品| 亚洲不卡视频| 精品久久亚洲| 日韩视频一区| 亚洲精品动态| 国产乱码精品一区二区亚洲| av免费不卡国产观看| 欧美1区2区3区| 激情五月综合网| 日韩午夜av在线| 国产视频网站一区二区三区| 夜夜嗨网站十八久久| 日韩中出av| 日韩精选在线| 国产精品亚洲产品| 久久99久久人婷婷精品综合| 国产精品99精品一区二区三区∴| 国产精品美女久久久久久不卡| 欧美a级一区二区| 极品av在线| 麻豆理论在线观看| 亚洲香蕉网站| 羞羞答答国产精品www一本| 亚洲精品一级| 欧美日本不卡| 国产精品调教视频| 国产成人免费视频网站视频社区| 99精品美女| 亚洲日本久久| 精品黄色一级片| 99tv成人| 亚洲免费专区| 国产成人调教视频在线观看| 日韩欧美网址| 久久福利一区| 国产亚洲福利| 首页欧美精品中文字幕| 丝袜诱惑制服诱惑色一区在线观看| 蜜桃传媒麻豆第一区在线观看 | 午夜久久一区| 日韩精品三区四区| 中文字幕在线视频久| 亚洲精选av| 欧美xxxx中国| 日韩一区网站| 日本一二区不卡| 日韩免费福利视频| 日韩精品高清不卡| 亚洲激情不卡| 国产精品传媒麻豆hd| 蘑菇福利视频一区播放| 欧美极品一区二区三区| 综合激情五月婷婷| 激情黄产视频在线免费观看| 欧美中文日韩| 国产成人精品一区二区三区免费| 国产综合色区在线观看| 国产一卡不卡| 天堂а√在线最新版中文在线| 日韩中文字幕视频网| 色天使综合视频| 国产亚洲人成a在线v网站| 激情欧美日韩一区| 国产成人精品一区二区三区免费| 在线亚洲欧美| 日韩成人亚洲| 欧美精品三级在线| 黄色亚洲精品| 欧美激情另类| 欧美日韩精品一区二区三区在线观看| 亚洲高清激情| 国语精品一区| 亚洲欧美在线综合| 午夜av一区| 秋霞影院一区二区三区| 精品视频久久| 国产精品s色| 日韩精品三级| 免费观看久久久4p| 成人av三级| 国产精品一线天粉嫩av| 免费精品视频在线| 欧美日韩国产一区二区三区不卡| 久久久男人天堂| 欧美成人高清| av资源亚洲| 里番精品3d一二三区| 日本一区免费网站| 亚洲激精日韩激精欧美精品| 激情黄产视频在线免费观看| 麻豆一区二区99久久久久| 天堂俺去俺来也www久久婷婷| 国产一区白浆| 亚洲精品va| 日韩欧美精品一区| 97国产成人高清在线观看| 国产福利一区二区精品秒拍| 欧美日韩亚洲一区二区三区在线 | 久久av网站| 欧美日韩va| 久久国产免费看| 亚洲美女91| 日本va欧美va精品| 日韩亚洲精品在线观看| 综合一区在线| 蜜臀va亚洲va欧美va天堂| 欧美日韩三区| 激情丁香综合| 图片区亚洲欧美小说区| 午夜久久免费观看| 丝袜av一区| 精品视频国产| 国产精品一二| 国产精品亚洲片在线播放| 亚洲精品伊人| 日韩精品亚洲专区在线观看| 久久成人国产| 日韩一级精品| 欧美日韩国产高清电影| 蜜桃久久av一区| 日韩欧美2区| 国产精品亚洲人成在99www| 亚洲18在线| 国产精品久久久久久妇女 | 国产精品天天看天天狠| 久久精品国产成人一区二区三区| 国产成人免费| 欧美日韩国产高清电影| 亚洲日本欧美| 国产精品黄网站| 免费国产亚洲视频| 日韩午夜视频在线| 麻豆精品在线观看| 久久久水蜜桃av免费网站| 一本色道精品久久一区二区三区| 国产农村妇女精品一二区 | 日韩成人精品一区| 蜜臀91精品国产高清在线观看| 88久久精品| 精品国产a一区二区三区v免费| 日韩免费福利视频| 噜噜噜躁狠狠躁狠狠精品视频| 久久国产欧美日韩精品| 国产自产自拍视频在线观看| 日韩一级不卡| 国产欧美69| 天堂中文在线播放| 蜜桃av一区二区| 久久不见久久见国语| 国产传媒在线观看| 久久xxxx| 国产美女久久| 四虎884aa成人精品最新| 尹人成人综合网| 国产欧美一区二区三区国产幕精品| 国产福利片在线观看| 午夜一级在线看亚洲| 91精品日本| 免费看av不卡| 日韩免费精品| 香蕉人人精品| 国产精品香蕉| 伊人久久婷婷| 精品国产一区二| 国产精品av久久久久久麻豆网| 亚洲区第一页| 日韩.com| 综合激情一区| 日本在线精品| 国产欧美日本| 亚洲综合二区| 色综合五月天| 国产九一精品| 亚洲欧美日韩国产综合精品二区| 久久一区亚洲| 天使萌一区二区三区免费观看| 日韩有码av| 亚洲欧洲午夜| 黄色aa久久| 日韩影片在线观看|