日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

Python使用xpath實現圖片爬取

瀏覽:35日期:2022-07-11 09:53:11

高性能異步爬蟲

目的:在爬蟲中使用異步實現高性能的數據爬取操作

異步爬蟲的方式:

- 多線程、多進程(不建議):

好處:可以為相關阻塞的操作單獨開啟多線程或進程,阻塞操作就可以異步執行;

弊端:無法無限制的開啟多線程或多進程。

- 線程池、進程池(適當的使用):

好處:我們可以降低系統對進程或線程創建和銷毀的一個頻率,從而很好的降低系統的開銷;

弊端:池中線程或進程的數據是有上限的。

代碼如下

# _*_ coding:utf-8 _*_'''@FileName :6.4k圖片解析爬?。ó惒礁咝阅軠y試).py@CreateTime :2020/8/14 0014 10:01@Author : Lurker Zhang@E-mail : 289735192@qq.com@Desc. :'''import requestsfrom lxml import etreefrom setting.config import *import jsonimport osimport timefrom multiprocessing.dummy import Pooldef main(): # 圖片采集源地址 # source_url = ’http://pic.netbian.com/4kmeinv/’ # temp_url = ’http://pic.netbian.com/4kmeinv/index_{}.html’ # source_url = ’http://pic.netbian.com/4kdongman/’ # temp_url = ’http://pic.netbian.com/4kdongman/index_{}.html’ source_url = ’http://pic.netbian.com/4kmingxing/’ temp_url = ’http://pic.netbian.com/4kmingxing/index_{}.html’ # 本此采集前多少頁,大于1的整數 page_sum = 136 all_pic_list_url = [] if page_sum == 1: pic_list_url = source_url print(’開始下載:’ + pic_list_url) all_pic_list_url.append(pic_list_url) else: # 先采集第一頁 pic_list_url = source_url # 調用采集單頁圖片鏈接的函數 all_pic_list_url.append(pic_list_url) # 再采集第二頁開始后面的頁數 for page_num in range(2, page_sum + 1): pic_list_url = temp_url.format(page_num) all_pic_list_url.append(pic_list_url) # 單頁圖片多線程解析 pool1 = Pool(10) pool1.map(down_pic, all_pic_list_url) print(’采集完成,本地成功下載{0}張圖片,失敗{1}張圖片?!?format(total_success, total_fail)) # 存儲已下載文件名列表: with open('../depository/mingxing/pic_name_list.json', ’w’, encoding=’utf-8’) as fp: json.dump(pic_name_list, fp)def down_pic(pic_list_url): print('準備解析圖片列表頁:',pic_list_url) # 獲取圖片列表頁的網頁數據 pic_list_page_text = requests.get(url=pic_list_url, headers=headers).text tree_1 = etree.HTML(pic_list_page_text) # 獲取圖片地址列表 pic_show_url_list = tree_1.xpath(’//div[@class='slist']/ul//a/@href’) pic_url_list = [get_pic_url(’http://pic.netbian.com’ + pic_show_url) for pic_show_url in pic_show_url_list] # 開始下載并保存圖片(多線程) pool2 = Pool(5) pool2.map(save_pic, pic_url_list)def save_pic(pic_url): print('準備下載圖片:',pic_url) global total_success, total_fail, pic_name_list,path picname = get_pic_name(pic_url) if not picname in pic_name_list: # 獲取日期作為保存位置文件夾 pic = requests.get(url=pic_url, headers=headers).content try: with open(path + picname, ’wb’) as fp:fp.write(pic) except IOError: print(picname + '保存失敗') total_fail += 1 else: pic_name_list.append(picname) total_success += 1 print('成功保存圖片:{0},共成功采集{1}張。'.format(picname, total_success)) else: print('跳過,已下載過圖片:' + picname) total_fail += 1def get_pic_name(pic_url): return pic_url.split(’/’)[-1]def get_pic_url(pic_show_url): tree = etree.HTML(requests.get(url=pic_show_url, headers=headers).text) return ’http://pic.netbian.com/’ + tree.xpath(’//div[@class='photo-pic']/a/img/@src’)[0]if __name__ == ’__main__’: # 讀入已采集圖片的名稱庫,名稱存在重復的表示已經采集過將跳過不采集 if not os.path.exists(’../depository/mingxing/pic_name_list.json’): with open('../depository/mingxing/pic_name_list.json', ’w’, encoding='utf-8') as fp: json.dump([], fp) with open('../depository/mingxing/pic_name_list.json', 'r', encoding='utf-8') as fp: pic_name_list = json.load(fp) path = ’../depository/mingxing/’ + time.strftime(’%Y%m%d’, time.localtime()) + ’/’ if not os.path.exists(path): os.mkdir(path) # 記錄本次采集圖片的數量 total_success = 0 total_fail = 0 main()

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
亚洲免费专区| av综合电影网站| 国产精品麻豆成人av电影艾秋| 日本午夜大片a在线观看| 免费日韩视频| 婷婷色综合网| 国产一精品一av一免费爽爽| 不卡在线一区二区| 免费在线观看一区| 国产欧美日韩影院| 亚洲美女久久| 欧美另类中文字幕| 狠狠干成人综合网| 国产精品视频一区二区三区 | 精品国产中文字幕第一页| 亚洲精品乱码久久久久久蜜桃麻豆 | 人人爽香蕉精品| 久久国产精品99国产| 国产一区二区高清| 蜜桃久久久久久| 国产精品中文| 亚洲性色av| 日韩大片在线| 欧美在线网站| 国产欧美自拍一区| 蜜桃久久精品一区二区| 蜜桃视频一区二区三区| 国产精品久久久久9999高清| 91亚洲成人| 国产精品久久久久久久免费观看| 免费在线日韩av| 精品中文字幕一区二区三区 | 成人午夜精品| 日韩中文影院| 久久亚洲一区| 精品资源在线| 水蜜桃久久夜色精品一区的特点 | 欧美亚洲一级| 电影91久久久| 亚洲精品1区| 国产福利资源一区| 日本精品不卡| 国产精品a级| 亚洲二区精品| 蜜桃免费网站一区二区三区| 精品1区2区3区4区| 国产精品三级| 日本欧美一区二区| 噜噜噜久久亚洲精品国产品小说| 91精品麻豆| 精品国产午夜| 日韩一级欧洲| 综合国产视频| 久久爱www成人| 国产一区日韩一区| 97精品久久| 免费成人在线观看| 国产精品1luya在线播放| 视频精品一区二区| 欧美一级精品| 日韩在线精品| 国产精品羞羞答答在线观看| 99精品美女| 国产精品久久国产愉拍| 伊人久久高清| 狠狠久久伊人中文字幕| 欧美色图国产精品| 国产三级一区| 日本美女一区| 日韩**一区毛片| 福利一区和二区| 日本午夜精品视频在线观看| 蜜臀a∨国产成人精品| 精品国产亚洲一区二区在线观看| 欧美综合另类| 欧美久久天堂| 国产美女亚洲精品7777| 免费日本视频一区| 欧美日韩国产一区精品一区| 国产91在线播放精品| 国产精品2区| 91欧美日韩在线| 蜜桃av一区| 日韩午夜精品| 国产精品婷婷| 亚洲天堂一区二区| 久久一区亚洲| 久久精品一区二区国产| 国产精区一区二区| 91精品在线免费视频| 午夜久久免费观看| 天堂中文av在线资源库| 色爱av综合网| 国产精品xxx在线观看| 日韩极品在线观看| 精品91久久久久| 国产一区二区精品久| 久久精品亚洲欧美日韩精品中文字幕| 黑人精品一区| 亚洲一区国产| 91精品国产自产精品男人的天堂| 最近国产精品视频| 久久午夜影视| 欧美亚洲综合视频| 女生影院久久| 日本久久综合| 黄毛片在线观看| 日韩中文字幕视频网| 久久伊人久久| 日韩视频一区| 国产精品视频一区二区三区 | 国产福利资源一区| 99久久99久久精品国产片果冰| 亚洲人成精品久久久| 欧洲av不卡| 欧美国产免费| 国产一区亚洲| 激情国产在线| 国产高清久久| 91综合视频| 国产精品一页| 亚洲啊v在线免费视频| 999久久久精品国产| 久久99免费视频| 亚洲久久在线| 影音先锋久久| 欧美日韩水蜜桃| 精品欧美视频| 久久久精品区| 欧美一级二级三级视频| 精品国产乱码久久久| 在线观看亚洲精品福利片| 91久久国产| 日韩精品麻豆| 久久久亚洲欧洲日产| 日韩av三区| 日韩中文字幕一区二区高清99| 玖玖玖国产精品| 亚洲精品888| 99精品电影| 日韩av福利| 免费av一区| 国产劲爆久久| 精品一区电影| 亚洲精品成人| 久久国产人妖系列| 日韩啪啪电影网| 精品国产一区二| 超碰成人av| 黄色不卡一区| 美女精品在线| 色8久久久久| 久久国产小视频| 亚洲综合电影一区二区三区| 日韩av中文字幕一区| 日韩中文字幕亚洲一区二区va在线| 中文亚洲免费| 国产亚洲字幕| 日韩中文字幕高清在线观看| 国产一区亚洲| 亚洲精品自拍| 精品91福利视频| 日韩一区二区三区免费播放| 99久久亚洲精品蜜臀| 在线免费观看亚洲| 日本aⅴ亚洲精品中文乱码| 久久只有精品| 久久国产成人| 日产午夜精品一线二线三线| 久久国产精品成人免费观看的软件| 午夜亚洲一区| 国产成人免费av一区二区午夜| 国产一区久久| 麻豆一区二区99久久久久| 亚洲欧洲av| 亚洲欧洲美洲国产香蕉| 国产毛片精品| 黑丝一区二区| 精品精品99| 亚洲网址在线观看| 国产一区二区三区国产精品| 欧美一区二区性| 欧美一级全黄| 99日韩精品| 色爱av综合网| 精品中文字幕一区二区三区 | 老牛影视精品| 丝袜国产日韩另类美女| 成人三级高清视频在线看| 免费在线视频一区| 婷婷激情久久| 激情国产在线| 麻豆91小视频| 国产精品亚洲综合在线观看| 亚洲三级网址| 日av在线不卡| 丝袜美腿亚洲一区| 日韩一区精品视频| 中文一区一区三区免费在线观| 亚洲电影在线一区二区三区|