日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

Python中scrapy下載保存圖片的示例

瀏覽:25日期:2022-06-14 17:27:01

在日常爬蟲練習中,我們爬取到的數(shù)據(jù)需要進行保存操作,在scrapy中我們可以使用ImagesPipeline這個類來進行相關(guān)操作,這個類是scrapy已經(jīng)封裝好的了,我們直接拿來用即可。

Python中scrapy下載保存圖片的示例

在使用ImagesPipeline下載圖片數(shù)據(jù)時,我們需要對其中的三個管道類方法進行重寫,其中 — get_media_request 是對圖片地址發(fā)起請求

— file path 是返回圖片名稱

— item_completed 返回item,將其返回給下一個即將被執(zhí)行的管道類

Python中scrapy下載保存圖片的示例

那具體代碼是什么樣的呢,首先我們需要在pipelines.py文件中,導入ImagesPipeline類,然后重寫上述所說的3個方法:

from scrapy.pipelines.images import ImagesPipelineimport scrapyimport os class ImgsPipLine(ImagesPipeline): def get_media_requests(self, item, info):yield scrapy.Request(url = item[’img_src’],meta={’item’:item}) #返回圖片名稱即可 def file_path(self, request, response=None, info=None):item = request.meta[’item’]print(’########’,item)filePath = item[’img_name’]return filePath def item_completed(self, results, item, info):return item

方法定義好后,我們需要在settings.py配置文件中進行設置,一個是指定圖片保存的位置IMAGES_STORE = ’D:ImgPro’,然后就是啟用“ImgsPipLine”管道,

ITEM_PIPELINES = { ’imgPro.pipelines.ImgsPipLine’: 300, #300代表優(yōu)先級,數(shù)字越小優(yōu)先級越高}

設置完成后,我們運行程序后就可以看到“D:ImgPro”下保存成功的圖片。

Python中scrapy下載保存圖片的示例

完整代碼如下:

spider文件代碼:

# -*- coding: utf-8 -*-import scrapyfrom imgPro.items import ImgproItem class ImgSpider(scrapy.Spider): name = ’img’ allowed_domains = [’www.521609.com’] start_urls = [’http://www.521609.com/daxuemeinv/’] def parse(self, response):#解析圖片地址和圖片名稱li_list = response.xpath(’//div[@class='index_img list_center']/ul/li’)for li in li_list: item = ImgproItem() item[’img_src’] = ’http://www.521609.com/’ + li.xpath(’./a[1]/img/@src’).extract_first() item[’img_name’] = li.xpath(’./a[1]/img/@alt’).extract_first() + ’.jpg’ # print(’***********’) # print(item) yield item

items.py文件

import scrapy class ImgproItem(scrapy.Item): # define the fields for your item here like: # name = scrapy.Field() img_src = scrapy.Field() img_name = scrapy.Field()

pipelines.py文件

from scrapy.pipelines.images import ImagesPipelineimport scrapyimport osfrom imgPro.settings import IMAGES_STORE as IMGS class ImgsPipLine(ImagesPipeline): def get_media_requests(self, item, info):yield scrapy.Request(url = item[’img_src’],meta={’item’:item}) #返回圖片名稱即可 def file_path(self, request, response=None, info=None):item = request.meta[’item’]print(’########’,item)filePath = item[’img_name’]return filePath def item_completed(self, results, item, info):return item

settings.py文件

import randomBOT_NAME = ’imgPro’ SPIDER_MODULES = [’imgPro.spiders’]NEWSPIDER_MODULE = ’imgPro.spiders’ IMAGES_STORE = ’D:ImgPro’ #文件保存路徑LOG_LEVEL = 'WARNING'ROBOTSTXT_OBEY = False#設置user-agentUSER_AGENTS_LIST = ['Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1','Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6','Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6','Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1','Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5','Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.36 Safari/536.5','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3','Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3','Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3','Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3','Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3','Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.0 Safari/536.3','Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24','Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24' ]USER_AGENT = random.choice(USER_AGENTS_LIST)DEFAULT_REQUEST_HEADERS = { ’Accept’: ’text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8’, ’Accept-Language’: ’en’, # ’User-Agent’:'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36', ’User-Agent’:USER_AGENT} #啟動pipeline管道ITEM_PIPELINES = { ’imgPro.pipelines.ImgsPipLine’: 300,}

以上即是使用ImagesPipeline下載保存圖片的方法,今天突生一個疑惑,爬蟲爬的好,真的是牢飯吃的飽嗎?還請各位大佬解答!更多相關(guān)Python scrapy下載保存內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標簽: Python scrapy
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产精品一级| 久久亚洲国产精品尤物| 蜜桃久久精品一区二区| 老鸭窝毛片一区二区三区| 日韩一区二区三区四区五区| 欧美激情国产在线| 午夜电影亚洲| 91在线成人| 久久99精品久久久久久园产越南| 日日夜夜免费精品视频| 69堂精品视频在线播放| 精品久久亚洲| 欧美日韩激情在线一区二区三区| 在线国产一区| 一区二区三区四区日韩| 日韩视频精品在线观看| 国产精品嫩模av在线| 国产成人精品一区二区三区在线| 欧美理论视频| 天堂网在线观看国产精品| 高清av一区| 麻豆成人在线| 欧美成人aaa| 久久精品超碰| 鲁大师影院一区二区三区| 久久久久蜜桃| 欧美日韩一区二区国产 | 欧美日韩 国产精品| 91伊人久久| 国产图片一区| 国产高清精品二区| 日韩精品五月天| 精品1区2区3区4区| 999久久久国产精品| 亚洲爱爱视频| 激情五月综合| 91精品国产调教在线观看| 欧美黄色网页| 激情不卡一区二区三区视频在线| 日韩精品一区二区三区免费观影 | 国产精品久久久久久久免费软件 | 国产99精品一区| 欧美一级专区| 亚洲18在线| 欧美久久精品一级c片| 亚洲一区二区三区在线免费| 国产综合婷婷| 欧美一区三区| 欧美激情视频一区二区三区免费 | 男女性色大片免费观看一区二区 | 精品一区二区三区亚洲| 欧美激情视频一区二区三区免费 | 国模大尺度视频一区二区| 欧美成a人国产精品高清乱码在线观看片在线观看久 | 国产精品啊啊啊| 日韩精品福利一区二区三区| 久久久成人网| 国产91在线精品| 国产日韩免费| 在线成人动漫av| 国模大尺度视频一区二区| 日韩区一区二| 日日摸夜夜添夜夜添国产精品| 特黄特色欧美大片| 国产成人精品福利| 国产精品一区二区三区美女| 日韩精品成人在线观看| 亚洲三级网站| 日韩av中文字幕一区| 日本国产欧美| 日本午夜精品久久久久| 日韩不卡一区二区| 欧美日韩在线精品一区二区三区激情综合| 免费成人性网站| 视频一区视频二区中文字幕| 欧美在线资源| 婷婷亚洲精品| 欧美激情亚洲| 日韩在线精品| 日韩激情一区| 亚洲v在线看| 亚洲午夜视频| 日韩av不卡在线观看| 日韩国产欧美在线视频| 国产一区二区三区视频在线| 久久精品在线| 在线看片不卡| 久久毛片亚洲| 蜜臀av性久久久久蜜臀aⅴ四虎| 国产毛片精品| 激情欧美一区| 免费不卡在线视频| 亚洲欧洲国产精品一区| 中文在线不卡| 亚洲免费成人av在线| 国产精品1区| 丝袜亚洲另类欧美| 无码日韩精品一区二区免费| 欧美日本二区| 亚洲一级少妇| 亚洲在线网站| 国产精品成人国产| 四虎4545www国产精品 | 欧美极品中文字幕| 久久不见久久见国语| 美女精品视频在线| 亚洲人成亚洲精品| 免费美女久久99| 香蕉久久国产| 国产一区二区精品| 日韩三区免费| 精品国模一区二区三区| 亚洲综合不卡| 好吊视频一区二区三区四区| 亚洲制服少妇| 精品国产乱码久久久久久1区2匹| 成人在线免费观看网站| 亚洲天堂资源| 亚洲人成网77777色在线播放| 国产+成+人+亚洲欧洲在线| 亚洲一区免费| 色婷婷亚洲mv天堂mv在影片| 欧美日韩黄网站| 国产精品av久久久久久麻豆网| 91成人在线精品视频| 国产99精品一区| 欧美国产日韩电影| 天堂av在线一区| se01亚洲视频 | 激情视频网站在线播放色| 日本国产精品| 国产调教精品| 婷婷亚洲成人| 日韩成人精品一区二区三区 | 日本在线高清| 欧美精品资源| 久久久久久一区二区| 国产精东传媒成人av电影| 国产精品分类| 国产亚洲字幕| 91综合久久爱com| 亚洲精品日韩久久| 欧美精品自拍| 在线观看免费一区二区| 九色porny丨国产首页在线| 国产高清久久| 在线亚洲一区| 午夜欧美理论片| 亚洲深夜av| 亚洲一区二区三区四区电影| 日韩一级不卡| 噜噜噜久久亚洲精品国产品小说| 亚洲二区三区不卡| 999国产精品999久久久久久| 亚洲三区欧美一区国产二区| 日本一区二区三区视频在线看| 日韩综合一区二区| 美女精品在线观看| 日韩精彩视频在线观看| 久久精品1区| 美女视频黄久久| 免费日韩精品中文字幕视频在线| 欧美日韩精品一本二本三本 | 久久三级福利| 亚洲毛片网站| 日韩欧美综合| 亚洲+小说+欧美+激情+另类| 欧美精品黄色| 日韩精品久久久久久| 成人国产精品久久| 亚洲永久字幕| 精品久久一区| 日韩在线观看一区二区| 久久精品999| 色婷婷成人网| 久久久久久美女精品| 国产精品一国产精品k频道56| 中文日韩在线| 免费黄色成人| 男女男精品网站| 日韩影院在线观看| 99国产精品免费视频观看| 国产精品中文字幕亚洲欧美| 亚洲一区不卡| 亚洲精品在线观看91| 91青青国产在线观看精品| 免费人成网站在线观看欧美高清| 国产理论在线| 久久99精品久久久久久园产越南| 91久久精品无嫩草影院| 亚洲中字黄色| 中文字幕乱码亚洲无线精品一区| 欧美日韩尤物久久| 精品欧美视频| 欧美精品国产一区| 天堂精品久久久久| 99在线观看免费视频精品观看| 黄色不卡一区| 日本欧洲一区二区| 亚洲精品精选|