日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

python爬取新聞門戶網(wǎng)站的示例

瀏覽:162日期:2022-06-21 10:53:43
項(xiàng)目地址:

https://github.com/Python3Spiders/AllNewsSpider

如何使用

每個(gè)文件夾下的代碼就是對(duì)應(yīng)平臺(tái)的新聞爬蟲

py 文件直接運(yùn)行 pyd 文件需要,假設(shè)為 pengpai_news_spider.pyd

將 pyd 文件下載到本地,新建項(xiàng)目,把 pyd 文件放進(jìn)去

項(xiàng)目根目錄下新建 runner.py,寫入以下代碼即可運(yùn)行并抓取

import pengpai_news_spiderpengpai_news_spider.main()示例代碼

百度新聞

# -*- coding: utf-8 -*-# 文件備注信息 如果遇到打不開的情況,可以先在瀏覽器打開一下百度搜索引擎import requestsfrom datetime import datetime, timedeltafrom lxml import etreeimport csvimport osfrom time import sleepfrom random import randintdef parseTime(unformatedTime): if ’分鐘’ in unformatedTime:minute = unformatedTime[:unformatedTime.find(’分鐘’)]minute = timedelta(minutes=int(minute))return (datetime.now() -minute).strftime(’%Y-%m-%d %H:%M’) elif ’小時(shí)’ in unformatedTime:hour = unformatedTime[:unformatedTime.find(’小時(shí)’)]hour = timedelta(hours=int(hour))return (datetime.now() -hour).strftime(’%Y-%m-%d %H:%M’) else:return unformatedTimedef dealHtml(html): results = html.xpath(’//div[@class='result-op c-container xpath-log new-pmd']’) saveData = [] for result in results:title = result.xpath(’.//h3/a’)[0]title = title.xpath(’string(.)’).strip()summary = result.xpath(’.//span[@class='c-font-normal c-color-text']’)[0]summary = summary.xpath(’string(.)’).strip()# ./ 是直接下級(jí),.// 是直接/間接下級(jí)infos = result.xpath(’.//div[@class='news-source']’)[0]source, dateTime = infos.xpath('.//span[last()-1]/text()')[0], infos.xpath('.//span[last()]/text()')[0]dateTime = parseTime(dateTime)print(’標(biāo)題’, title)print(’來源’, source)print(’時(shí)間’, dateTime)print(’概要’, summary)print(’n’)saveData.append({ ’title’: title, ’source’: source, ’time’: dateTime, ’summary’: summary}) with open(fileName, ’a+’, encoding=’utf-8-sig’, newline=’’) as f:writer = csv.writer(f)for row in saveData: writer.writerow([row[’title’], row[’source’], row[’time’], row[’summary’]])headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36’, ’Referer’: ’https://www.baidu.com/s?rtt=1&bsst=1&cl=2&tn=news&word=%B0%D9%B6%C8%D0%C2%CE%C5&fr=zhidao’}url = ’https://www.baidu.com/s’params = { ’ie’: ’utf-8’, ’medium’: 0, # rtt=4 按時(shí)間排序 rtt=1 按焦點(diǎn)排序 ’rtt’: 1, ’bsst’: 1, ’rsv_dl’: ’news_t_sk’, ’cl’: 2, ’tn’: ’news’, ’rsv_bp’: 1, ’oq’: ’’, ’rsv_btype’: ’t’, ’f’: 8,}def doSpider(keyword, sortBy = ’focus’): ’’’ :param keyword: 搜索關(guān)鍵詞 :param sortBy: 排序規(guī)則,可選:focus(按焦點(diǎn)排序),time(按時(shí)間排序),默認(rèn) focus :return: ’’’ global fileName fileName = ’{}.csv’.format(keyword) if not os.path.exists(fileName):with open(fileName, ’w+’, encoding=’utf-8-sig’, newline=’’) as f: writer = csv.writer(f) writer.writerow([’title’, ’source’, ’time’, ’summary’]) params[’wd’] = keyword if sortBy == ’time’:params[’rtt’] = 4 response = requests.get(url=url, params=params, headers=headers) html = etree.HTML(response.text) dealHtml(html) total = html.xpath(’//div[@id='header_top_bar']/span/text()’)[0] total = total.replace(’,’, ’’) total = int(total[7:-1]) pageNum = total // 10 for page in range(1, pageNum):print(’第 {} 頁nn’.format(page))headers[’Referer’] = response.urlparams[’pn’] = page * 10response = requests.get(url=url, headers=headers, params=params)html = etree.HTML(response.text)dealHtml(html)sleep(randint(2, 4)) ...if __name__ == '__main__': doSpider(keyword = ’馬保國’, sortBy=’focus’)

以上就是python爬取新聞門戶網(wǎng)站的示例的詳細(xì)內(nèi)容,更多關(guān)于python爬取新聞門戶網(wǎng)站的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: Python 編程
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
欧美日韩夜夜| 蜜桃久久久久| 日韩精品一卡二卡三卡四卡无卡| 日韩成人一级| 日韩av免费大片| 亚洲香蕉网站| 日本成人一区二区| 99久久婷婷这里只有精品| 国产一精品一av一免费爽爽| 午夜日韩福利| 成人三级高清视频在线看| 亚洲激情中文| 91欧美在线| 国产麻豆一区| 日韩高清国产一区在线| 久久亚洲视频| 黄色成人91| 日韩午夜免费| 国产美女一区| 极品裸体白嫩激情啪啪国产精品| 国产乱码精品一区二区三区四区| 久久国产精品毛片| 亚洲免费播放| 亚洲国产一区二区三区在线播放 | 亚洲欧美久久久| 国产乱论精品| 日韩av在线播放网址| 久久99性xxx老妇胖精品| 久久国产精品色av免费看| 韩国久久久久久| 在线亚洲观看| 国产日韩视频| 亚洲一级二级| 亚洲免费观看高清完整版在线观| 欧美 日韩 国产一区二区在线视频| 免费精品国产| 青草久久视频| 国产盗摄——sm在线视频| 国产一区日韩一区| 一区二区不卡| 国产高清精品二区| 亚洲一区免费| 麻豆91小视频| 亚洲欧美视频| 日韩精品永久网址| 国产精东传媒成人av电影| 亚洲一区黄色| 精品丝袜久久| 久久国产福利| 91欧美国产| 亚洲综合不卡| 欧美丰满日韩| 国产精品成人自拍| 丝袜国产日韩另类美女| 在线日韩av| **爰片久久毛片| 久久久人人人| 精品视频亚洲| 国产剧情在线观看一区| 久久亚洲在线| 四虎8848精品成人免费网站| 日本色综合中文字幕| 亚洲va中文在线播放免费| 国产精品久久久一区二区| 日韩有吗在线观看| 久久激情五月婷婷| 热久久免费视频| 国产亚洲字幕| 日本在线精品| 一区二区三区国产在线| 日本不卡不码高清免费观看| 青青草91久久久久久久久| 欧美黄页在线免费观看| 欧美三级精品| 亚洲精品欧洲| 国产成年精品| 伊人久久大香线蕉av超碰演员| 亚洲18在线| 精品国产黄a∨片高清在线| 伊人久久大香线蕉av超碰演员| 国产剧情在线观看一区| 日韩一级欧洲| 精品在线播放| 91精品国产成人观看| 久久精品伊人| 亚洲欧美网站在线观看| 欧美日韩国产在线观看网站| 精品视频自拍| 国产精品伦理久久久久久| 久久中文在线| 韩国女主播一区二区三区| 欧美成人精品一级| 欧美日本久久| 欧美午夜网站| 中文一区在线| www.51av欧美视频| 97久久亚洲| 蜜桃一区二区三区在线| 亚洲精品91| 91免费精品| 日韩国产在线一| 午夜一级久久| 久久一区二区中文字幕| 超级白嫩亚洲国产第一| 日本成人在线视频网站| 久久先锋影音| 樱桃成人精品视频在线播放| 免费一二一二在线视频| 精品免费视频| 国产成人精品一区二区免费看京 | 国产极品嫩模在线观看91精品| 日韩精品一级中文字幕精品视频免费观看 | 久久久噜噜噜| 天堂а√在线最新版中文在线| 免费一级欧美在线观看视频| 国产日产精品一区二区三区四区的观看方式 | 麻豆久久一区| 国产精品成人a在线观看| 精品国产乱码久久久| 国产福利亚洲| 欧美天堂视频| 亚洲无线一线二线三线区别av| 99国产精品久久久久久久成人热 | 久久中文字幕av| 久久国产影院| 91久久午夜| 免费在线观看精品| 日韩精品1区2区3区| 欧美激情麻豆| 成人综合一区| а√天堂8资源在线| 国产一区二区中文| 综合一区二区三区| 麻豆精品一区二区综合av| 亚洲伦乱视频| 日韩精品一二三| 国产精品v一区二区三区| 日韩大片在线播放| 欧美日韩国产传媒| 中文一区一区三区免费在线观| 日韩不卡一区二区三区| 国内揄拍国内精品久久| 欧美99久久| 中文一区一区三区免费在线观 | 天堂av一区| 四虎精品一区二区免费| 美腿丝袜在线亚洲一区| 999视频精品| 国产欧美一区二区三区精品观看| 欧美国产偷国产精品三区| 婷婷精品进入| 精品一区二区男人吃奶| 免费国产自久久久久三四区久久 | 国产精品视频一区二区三区综合| 久久成人福利| 亚洲国产成人精品女人| 国产精品一区二区99| 红桃视频亚洲| 精品国产aⅴ| 日本va欧美va瓶| 好看的亚洲午夜视频在线| 国产精品伦一区二区| 国产精品社区| 久久久久91| 精品国产黄a∨片高清在线| 亚洲精品影院在线观看| 国内精品福利| 国产不卡av一区二区| 丝袜美腿成人在线| 久久三级毛片| 18国产精品| 日本亚洲三级在线| 三级欧美在线一区| 婷婷六月综合| 亚洲精品极品少妇16p| 婷婷激情一区| 青青青免费在线视频| 免费一级欧美片在线观看网站| 天堂精品久久久久| 亚洲天堂免费| 国产精品成人自拍| 久久狠狠久久| 日韩一区二区三区精品视频第3页| 国产精品日本欧美一区二区三区| 久久精品午夜| 国产福利一区二区精品秒拍| 国产精品羞羞答答在线观看| 国产欧美日韩一级| 精品三级av| 中文在线免费视频| 日韩伦理福利| 99久久九九| 午夜亚洲精品| 日韩精品免费视频人成| 7777精品| 日韩欧美午夜| 99国产精品久久久久久久成人热 | sm捆绑调教国产免费网站在线观看| 久久精品国产在热久久| 国产v日韩v欧美v|