日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

python 爬蟲請求模塊requests詳解

瀏覽:102日期:2022-07-03 11:36:53
requests

相比urllib,第三方庫requests更加簡單人性化,是爬蟲工作中常用的庫

requests安裝

初級爬蟲的開始主要是使用requests模塊安裝requests模塊:Windows系統(tǒng):cmd中:

pip install requests

mac系統(tǒng)中:終端中:

pip3 install requestsrequests庫的基本使用

import requestsurl = ’https://www.csdn.net/’reponse = requests.get(url)#返回unicode格式的數(shù)據(jù)(str) print(reponse.text)

python 爬蟲請求模塊requests詳解

響應對象response的⽅法

response.text 返回unicode格式的數(shù)據(jù)(str)response.content 返回字節(jié)流數(shù)據(jù)(⼆進制)response.content.decode(‘utf-8’) ⼿動進⾏解碼response.url 返回urlresponse.encode() = ‘編碼’

狀態(tài)碼

response.status_code: 檢查響應的狀態(tài)碼

python 爬蟲請求模塊requests詳解

例如:200 : 請求成功301 : 永久重定向302 : 臨時重定向403 : 服務器拒絕請求404 : 請求失敗(服務器⽆法根據(jù)客戶端的請求找到資源(⽹⻚))500 : 服務器內部請求

# 導入requestsimport requests# 調用requests中的get()方法來向服務器發(fā)送請求,括號內的url參數(shù)就是我們# 需要訪問的網(wǎng)址,然后將獲取到的響應通過變量response保存起來url = ’https://www.csdn.net/’ # csdn官網(wǎng)鏈接鏈接response = requests.get(url)print(response.status_code) # response.status_code: 檢查響應的狀態(tài)碼

200

請求⽅式

requests的幾種請求方式:

p = requests.get(url)p = requests.post(url)p = requests.put(url,data={’key’:’value’})p = requests.delete(url)p = requests.head(url)p = requests.options(url)GET請求

HTTP默認的請求方法就是GET* 沒有請求體* 數(shù)據(jù)必須在1K之內!* GET請求數(shù)據(jù)會暴露在瀏覽器的地址欄中

GET請求常用的操作:1. 在瀏覽器的地址欄中直接給出URL,那么就一定是GET請求2. 點擊頁面上的超鏈接也一定是GET請求3. 提交表單時,表單默認使用GET請求,但可以設置為POST

POST請求

(1). 數(shù)據(jù)不會出現(xiàn)在地址欄中(2). 數(shù)據(jù)的大小沒有上限(3). 有請求體(4). 請求體中如果存在中文,會使用URL編碼!

requests.post()用法與requests.get()完全一致,特殊的是requests.post()有一個data參數(shù),用來存放請求體數(shù)據(jù)

請求頭

當我們打開一個網(wǎng)頁時,瀏覽器要向網(wǎng)站服務器發(fā)送一個HTTP請求頭,然后網(wǎng)站服務器根據(jù)HTTP請求頭的內容生成當此請求的內容發(fā)送給服務器。我們可以手動設定請求頭的內容:

import requestsheader = { ’User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36’}url = ’https://www.csdn.net/’reponse = requests.get(url,headers=header)#打印文本形式print(reponse.text)requests設置代理

使⽤requests添加代理只需要在請求⽅法中(get/post)傳遞proxies參數(shù)就可以了

cookie

cookie :通過在客戶端記錄的信息確定⽤戶身份

HTTP是⼀種⽆連接協(xié)議,客戶端和服務器交互僅僅限于 請求/響應過程,結束后 斷開,下⼀次請求時,服務器會認為是⼀個新的客戶端,為了維護他們之間的連接, 讓服務器知道這是前⼀個⽤戶發(fā)起的請求,必須在⼀個地⽅保存客戶端信息。

requests操作Cookies很簡單,只需要指定cookies參數(shù)即可

import requests#這段cookies是從CSDN官網(wǎng)控制臺中復制的header = { ’User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36’, ’cookie’: ’uuid_tt_dd=10_30835064740-1583844255125-466273; dc_session_id=10_1583844255125.696601; __gads=ID=23811027bd34da29:T=1583844256:S=ALNI_MY6f7VlmNJKxrkHd2WKUIBQ34Bbnw; UserName=xdc1812547560; UserInfo=708aa833b2064ba9bb8ab0be63866b58; UserToken=708aa833b2064ba9bb8ab0be63866b58; UserNick=xdc1812547560; AU=F85; UN=xdc1812547560; BT=1590317415705; p_uid=U000000; Hm_ct_6bcd52f51e9b3dce32bec4a3997715ac=6525*1*10_30835064740-1583844255125-466273!5744*1*xdc1812547560; Hm_up_6bcd52f51e9b3dce32bec4a3997715ac=%7B%22islogin%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isonline%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isvip%22%3A%7B%22value%22%3A%220%22%2C%22scope%22%3A1%7D%2C%22uid_%22%3A%7B%22value%22%3A%22xdc1812547560%22%2C%22scope%22%3A1%7D%7D; log_Id_click=1; Hm_lvt_feacd7cde2017fd3b499802fc6a6dbb4=1595575203; Hm_up_feacd7cde2017fd3b499802fc6a6dbb4=%7B%22islogin%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isonline%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isvip%22%3A%7B%22value%22%3A%220%22%2C%22scope%22%3A1%7D%2C%22uid_%22%3A%7B%22value%22%3A%22xdc1812547560%22%2C%22scope%22%3A1%7D%7D; Hm_ct_feacd7cde2017fd3b499802fc6a6dbb4=5744*1*xdc1812547560!6525*1*10_30835064740-1583844255125-466273; Hm_up_facf15707d34a73694bf5c0d571a4a72=%7B%22islogin%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isonline%22%3A%7B%22value%22%3A%221%22%2C%22scope%22%3A1%7D%2C%22isvip%22%3A%7B%22value%22%3A%220%22%2C%22scope%22%3A1%7D%2C%22uid_%22%3A%7B%22value%22%3A%22xdc1812547560%22%2C%22scope%22%3A1%7D%7D; Hm_ct_facf15707d34a73694bf5c0d571a4a72=5744*1*xdc1812547560!6525*1*10_30835064740-1583844255125-466273; announcement=%257B%2522isLogin%2522%253Atrue%252C%2522announcementUrl%2522%253A%2522https%253A%252F%252Flive.csdn.net%252Froom%252Fyzkskaka%252Fats4dBdZ%253Futm_source%253D908346557%2522%252C%2522announcementCount%2522%253A0%257D; Hm_lvt_facf15707d34a73694bf5c0d571a4a72=1596946584,1597134917,1597155835,1597206739; searchHistoryArray=%255B%2522%25E8%258F%259C%25E9%25B8%259FIT%25E5%25A5%25B3%2522%252C%2522%25E5%25AE%25A2%25E6%259C%258D%2522%255D; log_Id_pv=7; log_Id_view=8; dc_sid=c0efd34d6da090a1fccd033091e0dc53; TY_SESSION_ID=7d77f76f-a4b1-43ef-9bb5-0aebee8ee475; c_ref=https%3A//www.baidu.com/link; c_first_ref=www.baidu.com; c_first_page=https%3A//www.csdn.net/; Hm_lvt_6bcd52f51e9b3dce32bec4a3997715ac=1597245305,1597254589,1597290418,1597378513; c_segment=1; dc_tos=qf1jz2; Hm_lpvt_6bcd52f51e9b3dce32bec4a3997715ac=1597387359’}url = ’https://www.csdn.net/’reponse = requests.get(url,headers=header)#打印文本形式print(reponse.text)session

session :通過在服務端記錄的信息確定⽤戶身份這⾥這個session就是⼀個指 的是會話會話對象是一種高級的用法,可以跨請求保持某些參數(shù),比如在同一個Session實例之間保存Cookie,像瀏覽器一樣,我們并不需要每次請求Cookie,Session會自動在后續(xù)的請求中添加獲取的Cookie,這種處理方式在同一站點連續(xù)請求中特別方便

處理不信任的SSL證書

什么是SSL證書?SSL證書是數(shù)字證書的⼀種,類似于駕駛證、護照和營業(yè)執(zhí)照的電⼦副本。

因為配置在服務器上,也稱為SSL服務器證書。SSL 證書就是遵守 SSL協(xié) 議,由受信任的數(shù)字證書頒發(fā)機構CA,在驗證服務器身份后頒發(fā),具有服務 器身份驗證和數(shù)據(jù)傳輸加密功能我們來爬一個證書不太合格的網(wǎng)站

python 爬蟲請求模塊requests詳解

import requestsurl = ’https://inv-veri.chinatax.gov.cn/’resp = requests.get(url)print(resp.text)

它報了一個錯

python 爬蟲請求模塊requests詳解

我們來修改一下代碼

import requestsurl = ’https://inv-veri.chinatax.gov.cn/’resp = requests.get(url,verify = False)print(resp.text)

我們的代碼又能成功爬取了

python 爬蟲請求模塊requests詳解

到此這篇關于python 爬蟲請求模塊requests的文章就介紹到這了,更多相關python 爬蟲requests模塊內容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持好吧啦網(wǎng)!

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产精品久久久一区二区| 日韩精品一区二区三区av| 蜜桃tv一区二区三区| 国产精品.xx视频.xxtv| 亚洲ww精品| 五月天av在线| 欧美精品aa| 亚洲制服一区| 99pao成人国产永久免费视频 | 国产suv精品一区二区四区视频| 午夜精品影院| 国产中文一区| 久久久精品久久久久久96 | 亚洲欧美一级| 日韩精品视频在线看| 日韩精品一二三区| 国产精品普通话对白| 欧美 日韩 国产精品免费观看| 亚洲欧洲高清| 日韩精品一卡| 激情视频一区二区三区| 欧美日韩精品在线一区| 精品国产一区二| 久久精品超碰| 国产欧美久久一区二区三区| 日韩国产欧美在线播放| 丝袜国产日韩另类美女| 久久高清国产| 亚洲高清不卡| 午夜久久影院| 亚洲中午字幕| 亚洲v天堂v手机在线| 日韩精品国产欧美| 日韩国产在线观看一区| 日韩欧美中文字幕在线视频| 亚洲三级观看| 日韩精品社区| 国产精品美女在线观看直播| 欧美亚洲综合视频| 国产精品传媒麻豆hd| 麻豆国产精品视频| 黄色aa久久| 99成人超碰| 国产一区二区三区自拍| 夜久久久久久| 亚洲日本国产| 国产伦乱精品| av资源亚洲| 成人黄色av| 久久久久国产精品一区二区| 婷婷激情一区| 99pao成人国产永久免费视频| 老司机精品久久| 丝袜美腿成人在线| 91精品视频一区二区| 久久这里只有| 婷婷综合六月| 伊人精品久久| 国产激情综合| 久久九九精品| 好吊日精品视频| 亚洲人成在线影院| 国产精品地址| 999久久久精品国产| 欧美日韩国产在线一区| 亚洲精品无吗| 国产黄色一区| 伊人久久大香线蕉av不卡| 黄色亚洲大片免费在线观看| 国产精品7m凸凹视频分类| 91久久视频| 国产伦理一区| 久久精品导航| 青草av.久久免费一区| 国产传媒在线| 亚洲精选久久| 国产精品久久免费视频| 欧美日韩视频免费观看| 三级一区在线视频先锋| 国产精品二区影院| 欧美日韩一二| 国产乱人伦精品一区| 日本免费一区二区三区四区| 蜜臀av性久久久久蜜臀aⅴ四虎| 日韩av资源网| 久久九九国产| 国产精品久久久一区二区| 激情综合网五月| 国产精品乱战久久久| 亚洲播播91| 久久国产三级精品| 国产专区一区| 免费一级欧美片在线观看网站| 91精品成人| 国产高清日韩| 91精品99| 大香伊人久久精品一区二区 | 欧美片第1页综合| 美女少妇全过程你懂的久久| 国产乱码精品一区二区亚洲| 今天的高清视频免费播放成人| 国产模特精品视频久久久久| 国产一区丝袜| 国产激情综合| 欧美在线看片| 日韩精品一区二区三区中文| 丝袜亚洲精品中文字幕一区| 欧美丝袜一区| 久久香蕉国产| 成人久久一区| 天堂av在线| www在线观看黄色| 国产精品任我爽爆在线播放| 日本午夜精品久久久| 婷婷视频一区二区三区| 免费精品视频在线| 亚洲精品1区2区| 伊人久久亚洲影院| 久久婷婷久久| 国户精品久久久久久久久久久不卡| 日韩欧美不卡| 色婷婷狠狠五月综合天色拍| 国产超碰精品| 99热精品久久| 激情综合网五月| 伊人久久亚洲热| 日韩亚洲精品在线| 亚洲午夜91| 噜噜噜躁狠狠躁狠狠精品视频 | 国产日韩欧美在线播放不卡| 91精品国产自产在线丝袜啪| 欧美久久精品| 国产精品成人自拍| 美女久久久久久| 国产一区二区三区久久久久久久久| 国内精品伊人| 日韩精品免费一区二区三区| 久久精品播放| 中文在线一区| 99视频一区| 蜜臀国产一区二区三区在线播放| 亚洲九九精品| 国产精品久久| 中文av在线全新| 激情综合网站| 亚洲精品护士| 国产精品啊v在线| 欧美sm一区| 99日韩精品| 日本欧美一区二区| 免费一区二区三区在线视频| 日韩国产欧美| 亚洲免费在线| 国产乱码精品一区二区亚洲| 国产a久久精品一区二区三区| 亚洲性色av| 蜜桃av一区| 国产精品白浆| 在线日韩欧美| 日韩二区三区四区| 成人高清一区| 欧美特黄一区| 欧美日韩亚洲一区三区| 四虎成人av| 日韩精品dvd| 丝袜美腿亚洲一区| 久久精品一区二区三区中文字幕| 成人羞羞在线观看网站| 最新国产精品视频| 国产精品九九| 久久精品国产68国产精品亚洲| 免费成人在线视频观看| 久久99青青| 亚洲国产不卡| 国产亚洲欧美日韩在线观看一区二区 | 日韩一二三区在线观看| 麻豆视频一区| 亚洲一区久久| 美女久久久久久| 亚洲精品电影| 国产精品白浆| 91国语精品自产拍| 国产精品久久久久久久久久白浆| 欧美日韩在线播放视频| 国产日韩欧美一区在线| 免费视频国产一区| 国产精品视频3p| 欧美日韩国产亚洲一区| 国产精品日韩精品在线播放 | 久久精品二区三区| 国产情侣久久| 欧美在线资源| 精品国产欧美| 蜜芽一区二区三区| 日韩精品欧美激情一区二区| 日韩精品视频网| 免费观看久久av| 精品网站999| 亚洲美女91| 国产综合色产|