日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

Python scrapy爬取起點中文網小說榜單

瀏覽:40日期:2022-06-16 18:40:50
一、項目需求

爬取排行榜小說的作者,書名,分類以及完結或連載

二、項目分析

目標url:“https://www.qidian.com/rank/hotsales?style=1&page=1”

Python scrapy爬取起點中文網小說榜單

通過控制臺搜索發現相應信息均存在于html靜態網頁中,所以此次爬蟲難度較低。

Python scrapy爬取起點中文網小說榜單

通過控制臺觀察發現,需要的內容都在一個個li列表中,每一個列表代表一本書的內容。

Python scrapy爬取起點中文網小說榜單

在li中找到所需的內容

Python scrapy爬取起點中文網小說榜單

找到第兩頁的url“https://www.qidian.com/rank/hotsales?style=1&page=1”“https://www.qidian.com/rank/hotsales?style=1&page=2”對比找到頁數變化開始編寫scrapy程序。

三、程序編寫

創建項目太簡單,不說了

1.編寫item(數據存儲)

import scrapyclass QidianHotItem(scrapy.Item): name = scrapy.Field() #名稱 author = scrapy.Field() #作者 type = scrapy.Field() #類型 form= scrapy.Field() #是否完載

2.編寫spider(數據抓取(核心代碼))

#coding:utf-8from scrapy import Requestfrom scrapy.spiders import Spiderfrom ..items import QidianHotItem#導入下需要的庫class HotSalesSpider(Spider):#設置spider的類 name = 'hot' #爬蟲的名稱 qidian_header={'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'} #設置header current_page = 1 #爬蟲起始頁 def start_requests(self): #重寫第一次請求url='https://www.qidian.com/rank/hotsales?style=1&page=1'yield Request(url,headers=self.qidian_header,callback=self.hot_parse)#Request發起鏈接請求#url:目標url#header:設置頭部(模擬瀏覽器)#callback:設置頁面抓起方式(空默認為parse) def hot_parse(self, response):#數據解析#xpath定位list_selector=response.xpath('//div[@class=’book-mid-info’]')#獲取所有小說for one_selector in list_selector: #獲取小說信息 name=one_selector.xpath('h4/a/text()').extract()[0] #獲取作者 author=one_selector.xpath('p[1]/a[1]/text()').extract()[0] #獲取類型 type=one_selector.xpath('p[1]/a[2]/text()').extract()[0] # 獲取形式 form=one_selector.xpath('p[1]/span/text()').extract()[0] item = QidianHotItem() #生產存儲器,進行信息存儲 item[’name’] = name item[’author’] = author item[’type’] = type item[’form’] = form yield item #送出信息 # 獲取下一頁URL,并生成一個request請求 self.current_page += 1 if self.current_page <= 10:#爬取前10頁next_url = 'https://www.qidian.com/rank/hotsales?style=1&page='+str(self.current_page)yield Request(url=next_url,headers=self.qidian_header,callback=self.hot_parse) def css_parse(self,response):#css定位list_selector = response.css('[class=’book-mid-info’]')for one_selector in list_selector: # 獲取小說信息 name = one_selector.css('h4>a::text').extract()[0] # 獲取作者 author = one_selector.css('.author a::text').extract()[0] # 獲取類型 type = one_selector.css('.author a::text').extract()[1] # 獲取形式 form = one_selector.css('.author span::text').extract()[0] # 定義字典 item=QidianHotItem() item[’name’]=name item[’author’] = author item[’type’] = type item[’form’] = form yield item

3.start.py(代替命令行)

在爬蟲項目文件夾下創建start.py。

Python scrapy爬取起點中文網小說榜單

from scrapy import cmdline#導入cmd命令窗口cmdline.execute('scrapy crawl hot -o hot.csv' .split())#運行爬蟲并生產csv文件

出現類似的過程代表爬取成功。

Python scrapy爬取起點中文網小說榜單

hot.csv

Python scrapy爬取起點中文網小說榜單

總結

本次爬蟲內容還是十分簡單的因為只用了spider和item,這幾乎是所有scrapy都必須調用的文件,后期還會有middlewarse.py,pipelines.py,setting.py需要編寫和配置,以及從javascript和json中提取數據,難度較大。

到此這篇關于Python scrapy爬取起點中文網小說榜單的文章就介紹到這了,更多相關Python爬取起點中文網內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产精品对白| 日韩精品免费观看视频| 另类综合日韩欧美亚洲| 国产探花一区| 国产精品videossex| 久久国产人妖系列| 国产精品亚洲综合久久| 欧美激情麻豆| 国产suv精品一区| 国产欧洲在线| 久久天堂成人| 午夜一区在线| 青青草精品视频| 日本亚洲最大的色成网站www| 日本久久一区| 欧美成a人片免费观看久久五月天| 粉嫩av一区二区三区四区五区| 92国产精品| 日韩午夜av在线| 亚洲精品免费观看| 久久99久久久精品欧美| 国际精品欧美精品| 婷婷综合六月| 久久福利一区| 国产麻豆精品| 一本大道色婷婷在线| 影院欧美亚洲| 欧美日韩一区二区三区四区在线观看 | 久久中文字幕av| 亚洲精品va| 亚洲欧美日本国产 | 日韩超碰人人爽人人做人人添| 国产精品成人自拍| se01亚洲视频| 中文字幕免费一区二区| 日本欧美久久久久免费播放网| 美女视频黄 久久| 久久国产主播| 日韩综合一区二区| 五月天av在线| 亚洲精品动态| 日韩av在线播放网址| 国产精品三上| 美女久久久久久| 在线一区电影| 国产乱人伦精品一区| 久久亚洲国产| 日本不卡视频在线观看| 超碰在线99| 亚洲精品乱码久久久久久蜜桃麻豆| 久久国产麻豆精品| 久久一区二区中文字幕| 日韩高清二区| 欧美性感美女一区二区| 日韩欧美久久| 极品裸体白嫩激情啪啪国产精品| 青草av.久久免费一区| 肉色欧美久久久久久久免费看| 中文字幕av亚洲精品一部二部| 福利一区二区| 亚洲精品国产精品粉嫩| 日韩国产专区| 国产色99精品9i| 日韩视频在线一区二区三区 | 国产精选在线| 亚州国产精品| 亚洲精品一级二级| 日本三级亚洲精品| 国产一区日韩一区| 国产精品久久亚洲不卡| 国产精品免费看| 精品国产成人| 日韩一区精品| 午夜国产一区二区| 精品久久97| 日韩激情av在线| 极品裸体白嫩激情啪啪国产精品| 国产精品毛片久久久| 亚洲免费播放| 色网在线免费观看| 国产精成人品2018| 综合激情五月婷婷| 日韩午夜电影| 久久久久国产精品一区二区| 国产福利亚洲| 97se亚洲| 蜜臀av性久久久久蜜臀aⅴ四虎| а√天堂中文在线资源8| 国产毛片一区二区三区| 综合欧美精品| 四虎精品一区二区免费| 欧美日一区二区三区在线观看国产免 | 亚洲精品在线a| 欧美/亚洲一区| 日韩综合一区| 国产麻豆一区二区三区| 在线精品一区二区| 亚洲综合二区| 日韩视频在线一区二区三区| 日韩欧美少妇| 91综合视频| 国产精品久久免费视频| 日韩高清电影一区| 午夜日韩影院| 三级久久三级久久久| 美女日韩在线中文字幕| 不卡一区2区| 久久久久国产精品一区三寸 | 久久久久九九精品影院| 日韩一区二区三区四区五区| 综合激情在线| 免费在线欧美视频| 久热re这里精品视频在线6| 国产美女一区| 美女网站久久| 丝袜美腿高跟呻吟高潮一区| 91久久中文| 91久久中文| 亚洲一区中文| 午夜在线精品偷拍| 亚洲日产av中文字幕| 亚洲一区二区av| 午夜亚洲福利| 91大神在线观看线路一区| 日本一区二区中文字幕| 91成人福利| 久久亚洲黄色| 91亚洲人成网污www| 亚洲不卡系列| 欧美1级日本1级| 亚洲激情另类| 免费成人在线影院| 亚洲精品福利| 国产欧美日韩综合一区在线播放| 久久福利在线| 91亚洲人成网污www| 日韩综合精品| 狠狠干成人综合网| 久久电影一区| 一区二区高清| 日韩福利视频导航| 国产精品香蕉| 黄毛片在线观看| 99精品视频在线| 99日韩精品| 日韩精品视频网| 久久99影视| 国产精品久久久久久久久妇女| 欧美aa一级| 美女日韩在线中文字幕| 日韩av中文字幕一区| 精品视频国产| 美女亚洲一区| 深夜福利亚洲| 国产欧美日韩一区二区三区四区| 国产精品亚洲综合久久| 成人亚洲一区| 99国产精品视频免费观看一公开 | 热久久国产精品| 欧美日韩一区自拍| 日本在线高清| 亚洲免费网址| 91精品一区| 国产资源在线观看入口av| 免费av一区二区三区四区| 亚洲伊人影院| 精品国产一区二区三区av片| 日韩国产一区| 国产亚洲网站| 国产精品久久久久9999高清| 视频二区不卡| 免费在线成人网| 国产一区二区三区日韩精品| 日韩有吗在线观看| 欧美一区二区三区久久精品| 亚洲视频www| 国产精品主播| 三上悠亚国产精品一区二区三区| 久久午夜视频| 精品久久精品| 免费人成在线不卡| 国产一区二区精品久| 久久视频一区| 午夜久久av| 亚洲一区资源| 一区二区三区四区精品视频| 日本久久精品| 男人天堂欧美日韩| 婷婷综合国产| 尹人成人综合网| 欧美午夜精彩| 天堂va在线高清一区| 97精品国产| 亚洲精品国产精品粉嫩| 国产一区二区三区四区五区传媒| 亚洲精品1区2区| 久久精品一区二区三区中文字幕| 久久理论电影| 久久av影院| 免费日韩精品中文字幕视频在线|