日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

python爬蟲之利用Selenium+Requests爬取拉勾網

瀏覽:30日期:2022-06-21 16:41:32
一、前言

利用selenium+requests訪問頁面爬取拉勾網招聘信息

二、分析url

觀察頁面可知,頁面數據屬于動態加載 所以現在我們通過抓包工具,獲取數據包

python爬蟲之利用Selenium+Requests爬取拉勾網

觀察其url和參數

url='https://www.lagou.com/jobs/positionAjax.json?px=default&needAddtionalResult=false'參數:city=%E5%8C%97%E4%BA%AC ==》城市first=true ==》無用pn=1 ==》頁數kd=%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90 ==》商品關鍵詞

所以我們要想實現全站爬取,需要有city和頁數

三、獲取所有城市和頁數

我們打開拉勾網,觀察后發現,他的數據并不是完全展示的,比如說 在城市篩選選擇全國 僅僅只顯示30頁 但總頁數是遠遠大于30頁的;我又選擇北京發現是30頁又選擇北京下的海淀區又是30頁,可能我們無法把數據全部的爬取,但我們可以盡可能的將數據多的爬取

python爬蟲之利用Selenium+Requests爬取拉勾網python爬蟲之利用Selenium+Requests爬取拉勾網

我們為了獲取全站數據,必然離不開的有兩個參數 一個是城市一個是頁數,所以我們利用selenium自動化去獲取所有城市和對應頁數

def City_Page(self): City_Page={} url='https://www.lagou.com/jobs/allCity.html?keyword=%s&px=default&companyNum=0&isCompanySelected=false&labelWords='%(self.keyword) self.bro.get(url=url) sleep(30) print('開始獲取城市及其最大頁數') if '驗證系統' in self.bro.page_source:sleep(40) html = etree.HTML(self.bro.page_source) city_urls = html.xpath(’//table[@class='word_list']//li/input/@value’) for city_url in city_urls:try: self.bro.get(city_url) if '驗證系統' in self.bro.page_source:sleep(40) city=self.bro.find_element_by_xpath(’//a[@class='current_city current']’).text page=self.bro.find_element_by_xpath(’//span[@class='span totalNum']’).text City_Page[city]=page sleep(0.5)except: pass self.bro.quit() data = json.dumps(City_Page) with open('city_page.json', ’w’, encoding='utf-8')as f:f.write(data) return City_Page四、生成params參數

我們有了每個城市對應的最大頁數,就可以生成訪問頁面所需的參數

def Params_List(self): with open('city_page.json', 'r')as f:data = json.loads(f.read()) Params_List = [] for a, b in zip(data.keys(), data.values()):for i in range(1, int(b) + 1): params = {’city’: a,’pn’: i,’kd’: self.keyword } Params_List.append(params) return Params_List五、獲取數據

最后我們可以通過添加請求頭和使用params url來訪問頁面獲取數據

def Parse_Data(self,params): url = 'https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false' header={’referer’: ’https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90?labelWords=&fromSearch=true&suginput=’,’user-agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36’,’cookie’:’’ } try:text = requests.get(url=url, headers=header, params=params).textif '頻繁' in text: print('操作頻繁,已被發現 當前為第%d個params'%(i))data=json.loads(text)result=data['content']['positionResult']['result']for res in result: with open('.//lagou1.csv', 'a',encoding='utf-8') as f:writer = csv.DictWriter(f, res.keys())writer.writerow(res)sleep(1) except Exception as e:print(e)pass六、總結

盡管數據只顯示前30頁,但數據還是未完全獲取

在利用selenium獲取城市最大頁數時 應手動登錄拉勾網,并且其在訪問過程中可能會出現驗證系統需要驗證

利用requests訪問頁面獲取數據時 盡量sleep時間長一點,操作頻繁會封IP

到此這篇關于python爬蟲之利用Selenium+Requests爬取拉勾網的文章就介紹到這了,更多相關Selenium+Requests爬取拉勾網內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
日韩在线卡一卡二| 色爱av综合网| 一区二区三区四区在线观看国产日韩| 好看的亚洲午夜视频在线| 国产精品女主播一区二区三区| 美女福利一区二区三区| 丝袜av一区| 免费一区二区视频| 国产精品一区二区中文字幕| 欧美激情五月| 久久精品国产亚洲夜色av网站| 在线亚洲激情| 欧美日一区二区三区在线观看国产免 | 欧美日韩一区二区三区在线电影| 国产精品一站二站| 日韩在线看片| 亚洲综合另类| 日韩高清电影免费| 国产一区二区久久久久| 亚洲夜间福利| 日韩av午夜在线观看| 国产精品久久久久久久免费观看 | 人人爱人人干婷婷丁香亚洲| 精品国产中文字幕第一页| 一本大道色婷婷在线| 黑丝一区二区三区| 国产精品久一| 国产一区清纯| 久久国产日韩欧美精品| 日韩中文在线电影| 日韩中文字幕91| 精品女同一区二区三区在线观看| 狠狠操综合网| 国产精品一页| 日韩亚洲国产欧美| 欧美激情一区| 免费看的黄色欧美网站| 精品国产中文字幕第一页| 亚洲精品网址| 狂野欧美性猛交xxxx| 欧美日韩精品免费观看视完整| 欧美网站在线| 国产专区精品| 亚洲综合色婷婷在线观看| 久久免费福利| 综合欧美精品| 99久久精品费精品国产| 国产欧美一区二区三区米奇| 九九综合九九| 吉吉日韩欧美| 欧美精品国产白浆久久久久| 欧美日韩国产高清电影| 乱一区二区av| 日韩免费精品| 亚洲精品1区2区| 精品九九久久| 日本久久二区| 久久福利影视| 91精品久久久久久久久久不卡| 青青伊人久久| 丝袜诱惑制服诱惑色一区在线观看| 成人一区而且| 国产精品久久久久77777丨 | 欧美中文一区二区| 美女久久99| 日韩精品亚洲一区二区三区免费| 在线日韩中文| 成人亚洲一区二区| 欧美日韩网址| 日韩欧美中文字幕电影| 欧美日韩精品一本二本三本| 福利精品一区| 卡一卡二国产精品| 欧美日韩伊人| 日韩av字幕| 蜜桃久久久久久| av不卡在线看| 亚洲精品电影| 九色精品91| 午夜久久黄色| 欧美日韩少妇| 亚洲综合丁香| 丝瓜av网站精品一区二区| 婷婷激情综合| 欧美精品自拍| 欧美日韩国产一区精品一区| 不卡在线一区二区| 亚洲午夜电影| 亚洲精品97| 性色一区二区| 亚洲精品中文字幕99999| 蜜臀av一区二区在线免费观看| 视频一区二区三区入口| 免费在线欧美视频| 四虎在线精品| 欧美精品中文| 精品欧美视频| 久久久久国产精品一区三寸| 在线一区视频观看| 亚洲国产日韩欧美在线| 水蜜桃久久夜色精品一区的特点 | 色综合五月天| 亚洲成人av观看| 欧美日韩精品一本二本三本| 老牛影视一区二区三区| 中文字幕av一区二区三区四区| 日本一区福利在线| 青草国产精品久久久久久| 欧美自拍一区| 国产精品亚洲综合在线观看| 你懂的网址国产 欧美| 精品一区二区三区视频在线播放| 福利一区视频| 日本在线精品| 丝袜美腿一区二区三区| 欧美日韩 国产精品| 欧美黑人巨大videos精品| 国产a久久精品一区二区三区| 私拍精品福利视频在线一区| 99视频+国产日韩欧美| 日欧美一区二区| 麻豆视频久久| 国产精品字幕| 亚洲精品日本| 国产精品男女| 亚洲精品国产嫩草在线观看| 女同性一区二区三区人了人一| 日韩在线电影| 国产粉嫩在线观看| 亚洲二区三区不卡| 日本午夜精品| 成人va天堂| 婷婷精品在线| 日韩高清欧美| 亚洲不卡视频| 日韩成人综合| 蜜桃av一区二区在线观看| 国产精品白丝久久av网站 | 亚洲黄色网址| 久久先锋影音| 国产精品天天看天天狠| 久久九九国产| 欧美日韩亚洲一区三区| 久久久久99| 国产探花在线精品一区二区| 国产超碰精品| 日本午夜精品久久久| 亚洲电影有码| 国产亚洲一区| 黄色不卡一区| 精品理论电影在线| 久久电影一区| 在线一区av| 亚洲婷婷丁香| 亚洲1234区| 国产欧美二区| 日韩制服丝袜av| 欧美亚洲国产激情| 精品国产乱码久久久| 亚洲精品系列| 好吊视频一区二区三区四区| 精品一区二区三区中文字幕视频 | 日韩毛片视频| 国产区精品区| 在线亚洲观看| 国际精品欧美精品| 日韩国产在线观看| 国产精品丝袜xxxxxxx| 美女视频一区在线观看| 日韩影院免费视频| 秋霞影院一区二区三区| 国产精品亚洲欧美一级在线| 亚洲免费影院| 欧美日韩视频网站| 国产精品欧美三级在线观看 | 老司机免费视频一区二区| 亚洲视频二区| 成人在线超碰| 国产精品美女午夜爽爽| 日本在线观看不卡视频| 中文精品视频| 国产综合婷婷| 国产一区二区三区四区大秀| 91亚洲无吗| 亚洲午夜国产成人| 欧美99久久| 蜜桃av在线播放| 精品香蕉视频| 国产精品极品国产中出| 欧美亚洲专区| 欧美在线看片| 日韩国产高清在线| 视频一区视频二区中文| 性欧美69xoxoxoxo| 成人精品天堂一区二区三区| 国产一区二区三区黄网站| 麻豆久久一区二区| 久久丁香四色| 国产精品国产三级在线观看| 国产精品中文字幕制服诱惑|