日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

python使用selenium爬蟲知乎的方法示例

瀏覽:229日期:2022-07-06 18:50:26

說起爬蟲一般想到的情況是,使用 python 中都通過 requests 庫獲取網頁內容,然后通過 beautifulSoup 進行篩選文檔中的標簽和內容。但是這樣有個問題就是,容易被反扒機制所攔住。

反扒機制有很多種,例如知乎:剛開始只加載幾個問題,當你往下滾動時才會繼續往下面加載,而且在往下滾動一段距離時就會出來一個登陸的彈框。

這樣的機制對于通過獲取服務器返回內容的爬蟲方式進行了限制,我們只能獲得前幾個回答,而沒辦法或許后面的回答。

所以需要使用 selenium 模擬真實瀏覽器進行操作。

最終實現效果如下:

python使用selenium爬蟲知乎的方法示例

前提是需要自行搜索教程安裝:

chromeDriver selenium 庫

想要使用下面代碼的可以直接修改 driver.get() 里的地址,然后爬取結果最終會存在message.txt文件中

代碼如下:

from selenium import webdriver # 從selenium導入webdriverfrom selenium.webdriver.common.by import By # 內置定位器策略集from selenium.webdriver.support.wait import WebDriverWait # 用于實例化一個Driver的顯式等待from selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.common.action_chains import ActionChainsimport timeoption = webdriver.ChromeOptions()option.add_argument('headless')driver = webdriver.Chrome() # chrome_options=option 這個參數設置之后可以隱藏瀏覽器driver.get(’https://www.zhihu.com/question/22110581’) #修改這里的地址file = open('./messages.txt', 'w')def waitFun(): js = ''' let equalNum = 0; window.checkBottom = false; window.height = 0; window.intervalId = setInterval(()=>{ let currentHeight = document.body.scrollHeight; if(currentHeight === window.height){ equalNum++; if(equalNum === 2){clearInterval(window.intervalId);window.checkBottom = true; } }else{ window.height = currentHeight; window.scrollTo(0,window.height); window.scrollTo(0,window.height-1000); } },1500)''' # 這個暫停一下是因為要等待頁面將下面的內容加載出,這個 1500 可以根據自己的網絡快慢進行適當的調節 # 這里需要往上移動一下,因為不往上移動一下發現不會加載。 driver.execute_script(js)# selenium 可以獲取 瀏覽器中 js 的變量。調用的js returndef getHeight(nice): # 這里獲取 js 中的 checkBottom 變量,作為到底部時進行停止。 js = ''' return window.checkBottom; ''' return driver.execute_script(js)try: # 先觸發登陸彈窗。 WebDriverWait(driver, 40, 1).until(EC.presence_of_all_elements_located( (By.CLASS_NAME, ’Modal-backdrop’)), waitFun()) # 點擊空白關閉登陸窗口 ActionChains(driver).move_by_offset(200, 100).click().perform() # 當滾動到底部時 WebDriverWait(driver, 40, 3).until(getHeight, waitFun()) # 獲取回答 answerElementArr = driver.find_elements_by_css_selector(’.RichContent-inner’) for answer in answerElementArr: file.write(’==================================================================================’) file.write(’n’) file.write(answer.text) file.write(’n’) print(’爬取成功 ’+ str(len(answerElementArr)) +’ 條,存入到 message.txt 文件內’)finally: driver.close() #close the driver

這套代碼實現了打開知乎,然后自動向下滑動,當彈出登陸框時,自動點擊左上角關閉登陸框。然后繼續向下滑動,加載頁面,直到滑動到底部。然后將內容寫在 message.txt 文件里面。

selenium 功能非常強大, 可以模擬人為在瀏覽器的操作,進行輸入、點擊、滑動、播放、暫停等等操作,因此也可以用來寫一些腳本,用來刷學時,搶課等等。

到此這篇關于python使用selenium爬蟲知乎的方法示例的文章就介紹到這了,更多相關python selenium爬蟲知乎內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: python
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
xxxxx性欧美特大| 911亚洲精品| 亚洲久久在线| 美女少妇全过程你懂的久久| 99精品电影| 视频一区国产视频| 日本欧美一区二区| 欧美天堂在线| 国产精品片aa在线观看| 男女男精品视频网| 亚洲有吗中文字幕| 亚洲免费激情| 久久精品xxxxx| 亚洲欧美日韩国产综合精品二区 | 国产精品嫩草影院在线看| 日韩欧美一区二区三区在线视频 | 久久国际精品| 麻豆9191精品国产| 久久亚洲国产精品一区二区| 日韩中文影院| 米奇777超碰欧美日韩亚洲| 国产欧美日韩在线一区二区| 久久99影视| 日韩久久一区| av资源中文在线天堂| 捆绑调教日本一区二区三区| 久久一区亚洲| 久久国产精品免费一区二区三区| 免费看黄色91| 91久久在线| 亚洲精品三级| 午夜电影一区| 国产精品日本一区二区三区在线 | 国产精品麻豆久久| 国产一区二区三区四区五区| 日韩精品亚洲专区| 久久国产尿小便嘘嘘| 国产成人精品福利| 免费视频一区三区| 免费在线观看精品| 国产精品久久| 激情欧美国产欧美| 日韩一区精品| 综合日韩av| 免费在线视频一区| 久久尤物视频| 日韩一级不卡| 久久av日韩| 久久精品国内一区二区三区水蜜桃| 国产资源在线观看入口av| 午夜av一区| 国产精品一区亚洲| 午夜精品影院| 日本不卡视频在线| 亚洲成人不卡| 欧美啪啪一区| 久久久水蜜桃av免费网站| 午夜电影一区| av亚洲一区二区三区| 日韩一区二区三区在线看| 水蜜桃久久夜色精品一区| 中文无码日韩欧| 91视频一区| 日韩亚洲国产欧美| 国产日韩免费| 亚洲国产一区二区三区在线播放| 欧美日韩18| 欧美亚洲国产精品久久| 国产精品成人自拍| 久久福利毛片| 欧美aa在线观看| 国产亚洲精aa在线看| 亚洲电影在线一区二区三区| 国产麻豆精品| 日韩影院在线观看| 热三久草你在线| 欧美日韩一区二区三区四区在线观看 | 日韩国产在线观看| 日本精品影院| 国产精品亚洲综合久久| 亚洲女人av| 中文字幕人成乱码在线观看| 日韩三级视频| 欧美日韩国产传媒| 久久中文字幕一区二区三区| 99精品视频在线| 亚洲欧美视频一区二区三区| 在线日韩欧美| 亚洲精品高潮| 国产精品99一区二区三区| 好吊视频一区二区三区四区| 国产欧美日韩在线一区二区 | 日日摸夜夜添夜夜添国产精品| 国产黄色精品| 国产视频一区在线观看一区免费| 国产精品原创| 欧美激情日韩| 一区二区三区四区日韩| 欧美一级精品| 亚洲综合电影| 国产精品传媒麻豆hd| 亚洲精品美女| 久久国产精品久久w女人spa| 久久久久久久久99精品大| 国产高清精品二区| 欧美在线精品一区| 亚洲tv在线| 视频一区中文字幕国产| 精精国产xxxx视频在线播放| 麻豆精品在线播放| 欧美精品国产| 日韩高清二区| 蜜桃一区二区三区在线| 精品日韩毛片| 亚洲精品国产偷自在线观看| 99久精品视频在线观看视频| 中文字幕在线高清| 四虎8848精品成人免费网站| 美腿丝袜亚洲三区| 91亚洲精品在看在线观看高清| 亚洲精品福利| 蜜桃91丨九色丨蝌蚪91桃色| 中文久久精品| 一区在线免费| 欧美特黄一级| 一本色道精品久久一区二区三区| 亚洲女同中文字幕| 国产精品日本欧美一区二区三区| 欧美日韩国产高清电影| 免费观看久久av| 日韩一级不卡| 综合国产在线| 日本成人一区二区| 国产一区 二区| 久久只有精品| 中文字幕色婷婷在线视频| 色综合www| 国产综合激情| 99国产精品99久久久久久粉嫩| 欧美特黄一区| 亚洲+小说+欧美+激情+另类| 日韩av中文字幕一区二区| 日本午夜精品| 精品国产精品国产偷麻豆| 日韩av在线中文字幕| 日韩高清中文字幕一区二区| 欧美午夜不卡影院在线观看完整版免费| 久久国产精品亚洲77777| 一区二区电影在线观看| 奇米色欧美一区二区三区| 欧美激情麻豆| 欧美天堂视频| 国产精品呻吟| 亚洲精品看片| 欧美日韩一区二区三区不卡视频| 国产高清日韩| 91精品一区二区三区综合| 午夜在线观看免费一区| 日韩手机在线| 国产一区二区三区亚洲综合| 天堂资源在线亚洲| 亚洲三级网站| 欧美激情综合| 久久亚洲精品中文字幕蜜潮电影| 免费中文字幕日韩欧美| 久久精品 人人爱| 神马久久午夜| 亚洲涩涩av| 久久影院一区二区三区| 天堂日韩电影| 亚洲精品进入| caoporn视频在线| 国产麻豆综合| 欧美精品成人| 日韩亚洲在线| 国产精品hd| 欧美日韩一二| 日韩精品亚洲专区| 国产 日韩 欧美一区| 国产精品婷婷| 欧美激情综合| 99视频一区| 国产精品久久亚洲不卡| 免费成人性网站| 国产精品久久久久久久久久齐齐| 日韩精选在线| 色网在线免费观看| 深夜福利亚洲| 色一区二区三区| 亚洲精品第一| 日韩88av| 亚洲精品欧美| 亚洲1234区| 欧美亚洲tv| 免费视频国产一区| 国产精品日韩精品在线播放| 欧美精品一区二区三区精品| 国产精选久久| 亚洲欧美日韩综合国产aⅴ| 国产欧美日韩亚洲一区二区三区|