文章詳情頁

python - 如何爬取跳轉(zhuǎn)網(wǎng)站的數(shù)據(jù)

瀏覽：175日期：2022-06-30 14:37:44

問題描述

目前在學習一些爬蟲的知識，對于一些復雜的網(wǎng)站使用selenium進行爬取。碰到一個問題，我需要爬取的工單網(wǎng)站（不知道密碼）需要先通過登錄一個鑒權(quán)系統(tǒng)，然后鑒權(quán)系統(tǒng)頁面點擊其中的工單系統(tǒng)連接，就會自動免登錄跳轉(zhuǎn)到工單系統(tǒng)網(wǎng)站，這種系統(tǒng)的數(shù)據(jù)我該如何使用爬蟲進行抓取？以下是鑒權(quán)系統(tǒng)selenium拿到關于工單系統(tǒng)的html

問題解答

回答1：

用firefox的擴展selenium ide錄制一遍操作。然后導出為python文件。改改運行就可以了。

建議你去讀讀蟲師寫的書。

回答2：

例如使用requests庫作為爬蟲的話，先創(chuàng)建session()，A登錄，B是跳轉(zhuǎn)的頁面即可。

T=requests.session()A=T.post(url=url,data=data)B=T.get(url=url)

創(chuàng)建的T就代表存儲的cookie，會一直保留

Python 編程

上一條：python如何獲得一個url地址對應的跳轉(zhuǎn)后的最終網(wǎng)址下一條：python - Django如何在View中發(fā)送異步HTTP請求？

相關文章：

1. docker綁定了nginx端口外部訪問不到2. 前端 - html5 audio不能播放3. javascript - 最近用echarts做統(tǒng)計圖時遇到兩個問題！！4. javascript - 深夜被問題困擾求解惑，rn的API之PermissionsAndroidd的問題5. mysql - 我的myeclipse一直連顯示數(shù)據(jù)庫連接失敗，不知道為什么6. redis sentinel怎么跑守護進程以及日志記錄位置的？7. android權(quán)限被第三方安全軟件禁止，如何獲取該權(quán)限狀態(tài)8. android - 優(yōu)酷的安卓及蘋果app還在使用flash技術嗎？9. 利用百度地圖API定位及附件商家信息服務10. nginx - ssl加密訪問證書不受信任

排行榜

					
					javascript - 深夜被問題困擾求解惑，rn的API之PermissionsAndroidd的問題
前端 - html5 audio不能播放
javascript - 最近用echarts做統(tǒng)計圖時遇到兩個問題！！
docker綁定了nginx端口 外部訪問不到
mysql - 我的myeclipse一直連顯示數(shù)據(jù)庫連接失敗，不知道為什么
android權(quán)限被第三方安全軟件禁止，如何獲取該權(quán)限狀態(tài)
redis sentinel怎么跑守護進程以及日志記錄位置的？
android - 優(yōu)酷的安卓及蘋果app還在使用flash技術嗎？
git - webstorm窗口中左側(cè)列表的文件名顏色怎么修改
利用百度地圖API定位及附件商家信息服務
nginx - ssl加密訪問證書不受信任
				

熱門標簽

日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

python - 如何爬取跳轉(zhuǎn)網(wǎng)站的數(shù)據(jù)