日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

python - 用scrapy爬取網站內容時,如何忽略某些內容為空的值;

瀏覽:187日期:2022-06-28 13:59:25

問題描述

我爬取京東上所有手機信息時會碰到如下問題:1、返回值過多,如下圖片所示:python - 用scrapy爬取網站內容時,如何忽略某些內容為空的值;

2、spider代碼如下:

-- coding: utf-8 --

import scrapyfrom scrapy.http import Requestfrom ueinfo.items import UeinfoItem

class MrueSpider(scrapy.Spider):

name = ’mrue’allowed_domains = [’jd.com’]start_urls = [’http://jd.com/’]def parse(self, response): key='手機' for i in range(1,2):url='https://search.jd.com/Search?keyword='+str(key)+'&enc=utf-8&page='+str((i*2)-1)#print(url)yield Request(url=url,callback=self.page)def page(self,response): #body=response.body.decode('utf-8','ignore') allid=response.xpath('//p[@class=’p-focus’]//a/@data-sku').extract() for j in range(0,len(allid)):thisid=allid[j]url1='https://item.jd.com/'+str(thisid)+'.html'#print(url1)yield Request(url=url1,callback=self.next)def next(self,response): item=UeinfoItem() item['pinpai']=response.xpath('//ul[@id=’parameter-brand’]/li/@title').extract() #print(item['pinpai']) item['xinghao']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’型號’]/following::*[1]').extract() #print(item['xinghao']) item['nianfen']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’上市年份’]/following::*[1]').extract() #print(item['nianfen']) item['yuefen']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’上市月份’]/following::*[1]').extract() #print(item['yuefen']) item['caozuoxt']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’操作系統’]/following::*[1]').extract() #print(item['caozuoxt']) item['cpupp']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’CPU品牌’]/following::*[1]').extract() #print(item['cpupp']) item['cpuhs']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’CPU核數’]/following::*[1]').extract() #print(item['cpuhs']) item['cpuxh']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’CPU型號’]/following::*[1]').extract() #print(item['cpuxh']) item['shuangkalx']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’雙卡機類型’]/following::*[1]').extract() #print(item['shuangkalx']) item['mfnetwangl']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’4G網絡’]/following::*[1]').extract() #print(item['mfnetwangl']) item['fnetwangl']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’網絡頻率(4G)’]/following::*[1]').extract() #print(item['fnetwangl']) item['netwanglplus']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’指紋識別’]/following::*[1]').extract() #print(item['netwanglplus']) item['volte']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’高清語音通話(VOLTE)’]/following::*[1]').extract() #print(item['volte']) item['screenstyle']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’主屏幕尺寸(英寸)’]/following::*[1]').extract() #print(item['screenstyle']) item['fenbiel']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’分辨率’]/following::*[1]').extract() #print(item['fenbiel']) item['dianchirl']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’電池容量(mAh)’]/following::*[1]').extract() #print(item['dianchirl']) yield item

pipelines的代碼如下:

-- coding: utf-8 --

import pymysql

class UeinfoPipeline(object):

def __init__(self): self.conn=pymysql.connect(host='127.0.0.1',user='root',passwd='root',db='mysql')def process_item(self, item, spider): try:pinpai=item['pinpai'][0]xinghao=item['xinghao'][0]nianfen=item['nianfen'][0]yuefen=item['yuefen'][0]caozuoxt=item['caozuoxt'][0]coupp=item['cpupp'][0]cpuhs=item['cpuhs'][0]cpuxh=item['cpuxh'][0]shuangkalx=item['shuangkalx'][0]mfnetwangl=item['mfnetwangl'][0]fnetwangl = item['fnetwangl'][0]netwanglplus=item['netwanglplus'][0]volte=item['volte'][0]screenstyle=item['screenstyle'][0]fenbiel=item['fenbiel'][0]dianchirl=item['dianchirl'][0]sql='insert into uems(pinpai,xinghao,nianfen,yuefen,caozuoxt,cpupp,cpuhs,cpuxh,shuangkalx,mwangluo,fwangluo,wangluoplus,volte,screenstyle,fenbian,dianchi)VALUES(’'+pinpai+'’,’'+xinghao+'’,’'+nianfen+'’,’'+yuefen+'’,’'+caozuoxt+'’,’'+coupp+'’,’'+cpuhs+'’,’'+cpuxh+'’,’'+shuangkalx+'’,’'+mfnetwangl+'’,’'+fnetwangl+'’,’'+netwanglplus+'’,’'+volte+'’,’'+screenstyle+'’,’'+fenbiel+'’,’'+dianchirl+'’)'self.conn.query(sql)#print(mfnetwangl)return item except Exception as err:passdef close_spider(self): self.conn.close()

問題解答

回答1:

pipelines中的

def close方法定義錯誤了

應為這樣

def close(self, spider)

至于忽略某些內容為空的值用for 可能節省代碼!

def process_item(self, item, spider): for k,v in item.items():if v == ’’: raise DropItem(repr(item))

標簽: Python 編程
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
成人在线观看免费视频| 国产精品毛片在线| 在线观看一区| 日韩高清成人在线| 国产精品午夜一区二区三区| 国内揄拍国内精品久久| 国产一区欧美| 福利在线免费视频| 蜜桃成人av| 日韩中文字幕无砖| 自拍自偷一区二区三区| 老牛影视精品| 日韩欧美精品一区二区综合视频| 亚洲精品影院在线观看| 久久午夜精品| 精品九九久久| 亚洲香蕉视频| 日韩精品欧美精品| 国产毛片精品久久| 国产精品99一区二区三| 国产中文欧美日韩在线| 日韩亚洲在线| 你懂的亚洲视频| 欧美日韩视频| 亚洲久久一区| 久久男人天堂| 日韩高清一区在线| 麻豆一区二区三区| 日韩一区免费| 日本欧美久久久久免费播放网| 欧洲一区二区三区精品| 国产亚洲电影| 国产精品任我爽爆在线播放| 亚洲一区二区三区高清不卡| 日韩在线视频一区二区三区| 久久久久久久久99精品大| 欧美亚洲专区| 国产欧洲在线| 国产欧美日本| 免费视频一区二区| 国产精品久久久免费| 人人爽香蕉精品| 99视频精品全部免费在线视频| 国产色综合网| 高清不卡亚洲| 美女在线视频一区| 日韩电影免费网址| 久久精品国产亚洲aⅴ| 香蕉精品视频在线观看| 在线观看一区| 精品免费av一区二区三区| 日韩和欧美的一区| 日韩影院精彩在线| 精品久久中文| 国产精品久久久久久久久久妞妞 | 麻豆视频一区| 欧美亚洲激情| 麻豆视频在线看| 老色鬼精品视频在线观看播放| 久久久久久久久丰满| 国产一区二区三区四区五区传媒| 天堂久久av| 日韩精品中文字幕第1页| 久久av导航| 日韩精品免费视频一区二区三区| 国产一区国产二区国产三区| 亚洲欧美日韩国产| 欧美在线观看视频一区| 日韩一区三区| 亚洲精品伦理| 国产精品日本| 欧美男人天堂| 国产欧美日韩影院| 欧美欧美黄在线二区| 亚洲精品伊人| 精品美女在线视频| 精品久久在线| 国产成人久久| 欧美国产美女| 国产精品原创| 欧美男人天堂| 激情亚洲影院在线观看| 日韩福利视频导航| 国产欧美另类| 国产欧美精品久久| 丝袜亚洲另类欧美| 久久精品国产亚洲夜色av网站 | 国产亚洲精品自拍| 成人精品亚洲| 国产精品对白| 麻豆国产一区| 国产夫妻在线| 国产精品高清一区二区| 黄色网一区二区| 亚洲va在线| 精品三级av在线导航| 久久天堂影院| 免费观看亚洲| 欧美精品1区| 国产精品久久久久久久久久久久久久久 | 久久精品福利| 日本成人中文字幕| 国产美女久久| 久久麻豆视频| 丁香婷婷久久| 国产欧美日韩在线观看视频| 久久精品伊人| 欧美激情国产在线| 中文视频一区| 青青草国产精品亚洲专区无| 国产精品nxnn| 五月国产精品| 牛牛精品成人免费视频| 91视频久久| 噜噜噜久久亚洲精品国产品小说| 日韩三级一区| 欧美国产极品| 嫩草伊人久久精品少妇av杨幂| 欧美日韩免费观看视频| 欧美粗暴jizz性欧美20| 国产亚洲久久| 日韩欧美二区| 黄色精品视频| 日韩国产专区| 亚洲精品一级| 亚洲精品福利| 精品视频一区二区三区四区五区 | 成人国产精品一区二区免费麻豆| 成人看片网站| 免费视频一区三区| 日本在线成人| 国产高清不卡| 久久久久午夜电影| 一本一道久久a久久精品蜜桃| 日本亚洲视频在线| 日韩精品亚洲aⅴ在线影院| 色黄视频在线观看| 中文视频一区| 亚洲日韩中文字幕一区| caoporn视频在线| 视频一区国产视频| 国产精品夜夜夜| 国产精品任我爽爆在线播放 | 日韩一区二区在线免费| 日韩午夜免费| 精品国产一区二区三区2021| 日韩1区2区日韩1区2区| 日韩理论片av| 久久青青视频| 国内精品福利| 日韩欧美久久| 国内一区二区三区| 亚洲无线一线二线三线区别av| 午夜久久免费观看| 日韩精品成人| 国产精品久久久久久久久久10秀 | 国产精品二区影院| 精品国产精品国产偷麻豆| 久久久777| 免费精品视频最新在线| 欧美一区影院| 国产91在线精品| 欧美日韩第一| 日本成人精品| 国产一区国产二区国产三区| 久久精品免费一区二区三区| 一二三区精品| 国产在视频一区二区三区吞精| 性欧美xxxx免费岛国不卡电影| 综合亚洲自拍| 日本欧美国产| 91久久久久| 国产麻豆精品| 久久精品欧美一区| 日韩高清在线不卡| 国产一区二区三区国产精品| 日韩亚洲在线| 麻豆91小视频| 夜夜精品视频| 国产精品一区二区精品| 91精品国产乱码久久久久久久| 亚洲精品系列| 欧洲一区二区三区精品| 亚洲深夜福利在线观看| 丰满少妇一区| 亚洲精品在线a| 欧美在线首页| 激情91久久| 国产精品色婷婷在线观看| 亚洲婷婷免费| 国产精品成人国产| 亚洲一区二区三区四区五区午夜| 国产精品一区亚洲| 国产中文一区| 你懂的国产精品| 久久www成人_看片免费不卡| 久久免费精品| 少妇精品在线| 国产韩日影视精品| 国产一区二区三区四区|