日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

python多線程爬取西刺代理的示例代碼

瀏覽:200日期:2022-06-28 16:59:26

西刺代理是一個國內IP代理,由于代理倒閉了,所以我就把原來的代碼放出來供大家學習吧。

鏡像地址:https://www.blib.cn/url/xcdl.html

首先找到所有的tr標簽,與class='odd'的標簽,然后提取出來。

python多線程爬取西刺代理的示例代碼

然后再依次找到tr標簽里面的所有td標簽,然后只提取出里面的[1,2,5,9]這四個標簽的位置,其他的不提取。

python多線程爬取西刺代理的示例代碼

最后可以寫出提取單一頁面的代碼,提取后將其保存到文件中。

import sys,re,threadingimport requests,lxmlfrom queue import Queueimport argparsefrom bs4 import BeautifulSouphead = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36'}if __name__ == '__main__': ip_list=[] fp = open('SpiderAddr.json','a+',encoding='utf-8') url = 'https://www.blib.cn/url/xcdl.html' request = requests.get(url=url,headers=head) soup = BeautifulSoup(request.content,'lxml') data = soup.find_all(name='tr',attrs={'class': re.compile('|[^odd]')}) for item in data: soup_proxy = BeautifulSoup(str(item),'lxml') proxy_list = soup_proxy.find_all(name='td') for i in [1,2,5,9]: ip_list.append(proxy_list[i].string) print('[+] 爬行列表: {} 已轉存'.format(ip_list)) fp.write(str(ip_list) + ’n’) ip_list.clear()

爬取后會將文件保存為 SpiderAddr.json 格式。

python多線程爬取西刺代理的示例代碼

最后再使用另一段代碼,將其轉換為一個SSR代理工具直接能識別的格式,{’http’: ’http://119.101.112.31:9999’}

import sys,re,threadingimport requests,lxmlfrom queue import Queueimport argparsefrom bs4 import BeautifulSoupif __name__ == '__main__': result = [] fp = open('SpiderAddr.json','r') data = fp.readlines() for item in data: dic = {} read_line = eval(item.replace('n','')) Protocol = read_line[2].lower() if Protocol == 'http': dic[Protocol] = 'http://' + read_line[0] + ':' + read_line[1] else: dic[Protocol] = 'https://' + read_line[0] + ':' + read_line[1] result.append(dic) print(result)

python多線程爬取西刺代理的示例代碼

完整多線程版代碼如下所示。

import sys,re,threadingimport requests,lxmlfrom queue import Queueimport argparsefrom bs4 import BeautifulSouphead = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36'}class AgentSpider(threading.Thread): def __init__(self,queue): threading.Thread.__init__(self) self._queue = queue def run(self): ip_list=[] fp = open('SpiderAddr.json','a+',encoding='utf-8') while not self._queue.empty(): url = self._queue.get() try:request = requests.get(url=url,headers=head)soup = BeautifulSoup(request.content,'lxml')data = soup.find_all(name='tr',attrs={'class': re.compile('|[^odd]')})for item in data: soup_proxy = BeautifulSoup(str(item),'lxml') proxy_list = soup_proxy.find_all(name='td') for i in [1,2,5,9]: ip_list.append(proxy_list[i].string) print('[+] 爬行列表: {} 已轉存'.format(ip_list)) fp.write(str(ip_list) + ’n’) ip_list.clear() except Exception:passdef StartThread(count): queue = Queue() threads = [] for item in range(1,int(count)+1): url = 'https://www.xicidaili.com/nn/{}'.format(item) queue.put(url) print('[+] 生成爬行鏈接 {}'.format(url)) for item in range(count): threads.append(AgentSpider(queue)) for t in threads: t.start() for t in threads: t.join()# 轉換函數def ConversionAgentIP(FileName): result = [] fp = open(FileName,'r') data = fp.readlines() for item in data: dic = {} read_line = eval(item.replace('n','')) Protocol = read_line[2].lower() if Protocol == 'http': dic[Protocol] = 'http://' + read_line[0] + ':' + read_line[1] else: dic[Protocol] = 'https://' + read_line[0] + ':' + read_line[1] result.append(dic) return resultif __name__ == '__main__': parser = argparse.ArgumentParser() parser.add_argument('-p','--page',dest='page',help='指定爬行多少頁') parser.add_argument('-f','--file',dest='file',help='將爬取到的結果轉化為代理格式 SpiderAddr.json') args = parser.parse_args() if args.page: StartThread(int(args.page)) elif args.file: dic = ConversionAgentIP(args.file) for item in dic: print(item) else: parser.print_help()

以上就是python多線程爬取西刺代理的示例代碼的詳細內容,更多關于python多線程爬取代理的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
亚洲一区日韩| 91精品福利| 国产亚洲一区二区手机在线观看| 国产福利电影在线播放| 色老板在线视频一区二区| 日韩a一区二区| 久久精品123| 中文在线а√天堂| 高清一区二区三区| 日韩精品不卡一区二区| 欧美日韩国产亚洲一区| 一区二区三区四区日韩| 国产日韩精品视频一区二区三区| 久久国产精品色av免费看| 国产精品久久久久9999高清 | 久久天堂影院| 国产精品va视频| 福利欧美精品在线| 亚洲激情av| 国产精品国产三级在线观看| 欧美日韩精品免费观看视欧美高清免费大片| 99日韩精品| 免费在线日韩av| 免费精品视频在线| 国产精品国产一区| 性色一区二区| 久久精品国产99国产精品| 亚洲综合日本| 国产一区二区三区亚洲综合| 一区三区视频| 精品理论电影在线| 伊人久久亚洲美女图片| 欧美成人aaa| 蜜桃传媒麻豆第一区在线观看 | 亚洲综合激情在线| 在线天堂资源www在线污| 欧美成人日韩| 国产精品婷婷| 911亚洲精品| 精品日韩视频| 久久xxx视频| 99日韩精品| 日韩电影免费网址| 日本亚洲视频| 嫩呦国产一区二区三区av| 蜜桃av一区二区| 久久久久国产精品一区二区| 欧美视频二区| 亚洲精品国产偷自在线观看| 欧美aa在线视频| 亚洲区欧美区| 六月婷婷一区| 欧美日韩国产在线观看网站 | 99久久九九| 国产成人黄色| 亚洲精品乱码久久久久久蜜桃麻豆 | 亚洲精品自拍| 日韩深夜视频| 日本午夜精品视频在线观看| 香蕉国产精品| 高潮久久久久久久久久久久久久| 日韩av一区二区三区| 亚洲一本视频| 日本va欧美va瓶| 国产视频一区三区| 国产一区二区三区免费在线| 蜜芽一区二区三区| 国产韩日影视精品| 国产aⅴ精品一区二区四区| 亚洲精品第一| 亚洲黄页一区| 国产精品毛片一区二区三区| 日韩精品一区二区三区免费观影 | 国产 日韩 欧美一区| 天堂久久一区| 国产一区二区三区自拍| 国产精品美女久久久久久不卡 | 香蕉人人精品| 精品久久免费| 青青国产精品| 五月天综合网站| 卡一卡二国产精品| 欧美精品中文字幕亚洲专区| 国产美女一区| 国产aⅴ精品一区二区四区| 日韩亚洲在线| 日韩午夜av| 国产极品一区| 久久中文字幕一区二区三区| 丝袜诱惑制服诱惑色一区在线观看 | 久久精品国产99久久| 麻豆精品一区二区综合av| 国产精品白丝av嫩草影院| 免费视频一区二区| 在线日韩一区| 亚洲免费播放| 亚洲人成网77777色在线播放| 亚洲精选久久| 日韩国产在线观看一区| 蜜臀va亚洲va欧美va天堂 | 精品三级久久| 免费看av不卡| 欧美激情另类| 精品国产午夜| 国产网站在线| 高清一区二区三区| 日韩av首页| 欧美国产另类| 成人在线超碰| 国产精品一区二区av交换| 国产精品玖玖玖在线资源| 视频一区二区欧美| 亚洲精品少妇| 免费一级欧美在线观看视频 | 日韩不卡在线| 亚洲黄色中文字幕| 国产精品成人一区二区不卡| 人人香蕉久久| 欧美日韩四区| 一二三区精品| 日韩精品视频中文字幕| 欧美一级一区| 欧美黑人巨大videos精品| 亚洲成人不卡| 午夜欧美理论片| 深夜日韩欧美| 国内精品伊人| 欧美a级一区| 亚洲精品欧美| 国产日韩视频| 韩日一区二区| 蜜桃av一区二区三区电影| 久久亚洲人体| 久久网站免费观看| 欧美在线综合| 国产图片一区| 精品国产亚洲一区二区三区在线 | 久久国产日韩| 国产精品嫩草99av在线| 欧美+日本+国产+在线a∨观看| 久久久精品网| 亚洲综合二区| 人人爱人人干婷婷丁香亚洲| 亚洲精品高潮| 亚洲精品日本| 麻豆精品视频在线观看视频| 久久精品国产久精国产| 久久爱www.| 日韩国产在线| 日韩不卡一区二区| 久久国内精品视频| 亚洲精品一区二区在线播放∴| 国产国产精品| 亚洲一区二区三区中文字幕在线观看| 亚洲2区在线| 国产精品三级| 精品国产乱码久久久久久1区2匹| 亚洲无线一线二线三线区别av| 老牛影视一区二区三区| 国产精品任我爽爆在线播放 | 精品三级久久| 美女精品一区二区| 日韩区欧美区| 亚洲免费婷婷| 婷婷中文字幕一区| 亚洲精品国产嫩草在线观看| 婷婷激情图片久久| 欧美激情 亚洲a∨综合| 视频一区二区国产| 国产高清不卡| 国产欧美在线观看免费| 人人草在线视频| 国产日韩一区二区三区在线播放 | 日本aⅴ亚洲精品中文乱码| 国精品一区二区| 伊人久久高清| 成人精品国产亚洲| 蜜臀91精品一区二区三区| 天堂资源在线亚洲| 久久青青视频| 婷婷精品久久久久久久久久不卡| 国产精品精品| 日本强好片久久久久久aaa| 欧美午夜不卡影院在线观看完整版免费| 超级白嫩亚洲国产第一| 日本成人手机在线| 久久久久美女| 久久久久国产精品一区二区| 91精品国产自产在线丝袜啪| 午夜在线一区| 国产调教精品| 午夜一区在线| 视频精品一区二区| 亚洲自啪免费| 综合欧美精品| 日韩精品视频一区二区三区| 亚洲午夜久久| 日本一区二区三区中文字幕| 日韩精品一二三| 久久精品国产www456c0m|