日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

爬蟲圖片 - 請教各位:python爬蟲編碼問題,版本3.6,win10 64位下?

瀏覽:201日期:2022-07-14 15:35:50

問題描述

這是報錯信息:

Traceback (most recent call last): File 'D:pypic_downfrom2255ok.py', line 45, in <module> html = getHtml(url_all[i]) File 'D:pypic_downfrom2255ok.py', line 32, in getHtml html = response.read().decode()UnicodeDecodeError: ’utf-8’ codec can’t decode byte 0xb3 in position 184: invalid start byte

改了好多地方,主要可能是目標網站是gb2312編碼,這個程序在別的網站是可以正常下載圖片的,換上現在的網站就有問題還請各位多多指教,問題出在哪里?試了幾個方法都不行源碼如下:爬蟲圖片 - 請教各位:python爬蟲編碼問題,版本3.6,win10 64位下?

#coding=utf-8import urllib.requestfrom urllib.request import urlopen, urlretrieve import urllibimport urllib.parseimport reimport osfrom bs4 import BeautifulSoupurl_all =[’http://www.shop2255.com/showpro/2603.html’,’http://www.shop2255.com/showpro/1558.html’,’http://www.shop2255.com/showpro/1564.html’,’http://www.shop2255.com/showpro/2411.html’,’http://www.shop2255.com/showpro/2409.html’,’http://www.shop2255.com/showpro/1561.html’,’http://www.shop2255.com/showpro/2414.html’,’http://www.shop2255.com/showpro/2609.html’,’http://www.shop2255.com/showpro/2413.html’,’http://www.shop2255.com/showpro/2604.html’,’http://www.shop2255.com/showpro/2605.html’,’http://www.shop2255.com/showpro/2606.html’,’http://www.shop2255.com/showpro/2608.html’,’http://www.shop2255.com/showpro/2607.html’,’http://www.shop2255.com/showpro/2610.html’]def getHtml(url): response = urlopen(url) html = response.read().decode('gbk') return htmldef getImg(html): reg = ’src='http://www.b3g6.com/wenda/(.+?.jpg)'’ imgre = re.compile(reg) imglist = re.findall(imgre,html) return imglistfor i in range(len(url_all)): html = getHtml(url_all[i]) list=getImg(html.decode()) x = 0 for imgurl in list:print(x)file_path = url_all[i](filepath,tempfilename) = os.path.split(file_path)(filename,extension) = os.path.splitext(tempfilename)if not os.path.exists(’d:%s’ % filename): os.mkdir(’d:%s’ % filename)# os.mkdir(’D:%s’ % filename2)local=r’D:%s%s.jpg’ % (filename,imgurl.splite('/')[-1])urllib.request.urlretrieve(imgurl,local)x+=1print('done')

問題解答

回答1:

# coding: utf-8import urllibimport requestsfrom pyquery import PyQuery as Qimport osbase_url = ’http://www.shop2255.com/’url_all =[’http://www.shop2255.com/showpro/2603.html’]for url in url_all: _, file_name = os.path.split(url) dir_name, _ = os.path.splitext(file_name) if not os.path.exists(dir_name):os.mkdir(dir_name) r = requests.get(url) for _ in Q(r.text).find(’img’):src = Q(_).attr(’src’)image_url = src if src.startswith(’http’) else os.path.join(base_url, src)_, image_name = os.path.split(image_url)image_path = os.path.join(dir_name, image_name)urllib.urlretrieve(image_url, image_path)回答2:

首先在你這個代碼里面 local=r’D:%s%s.jpg’ % (filename,imgurl.splite('/')[-1])中split寫成了splite.

還有 urllib.request.urlretrieve(imgurl,local)這個imgurl不是一個合法的 url,只是一個相對 url, 要改成絕對 url,需要加上 base_url = ’http://www.shop2255.com/’

還有生成的文件路徑好像也有問題.

# -*- coding: utf-8 -*-import urllib.requestfrom urllib.request import urlopen, urlretrieveimport urllibimport urllib.parseimport reimport osfrom bs4 import BeautifulSoupbase_url = ’http://www.shop2255.com/’url_all =[’http://www.shop2255.com/showpro/2603.html’,’http://www.shop2255.com/showpro/1558.html’,’http://www.shop2255.com/showpro/1564.html’,’http://www.shop2255.com/showpro/2411.html’,’http://www.shop2255.com/showpro/2409.html’,’http://www.shop2255.com/showpro/1561.html’,’http://www.shop2255.com/showpro/2414.html’,’http://www.shop2255.com/showpro/2609.html’,’http://www.shop2255.com/showpro/2413.html’,’http://www.shop2255.com/showpro/2604.html’,’http://www.shop2255.com/showpro/2605.html’,’http://www.shop2255.com/showpro/2606.html’,’http://www.shop2255.com/showpro/2608.html’,’http://www.shop2255.com/showpro/2607.html’,’http://www.shop2255.com/showpro/2610.html’]def getHtml(url): response = urlopen(url) # print(response.read()) html = response.read().decode('gbk') print(html) return htmldef getImg(html): reg = ’src='http://www.b3g6.com/wenda/(.+?.jpg)'’ imgre = re.compile(reg) imglist = re.findall(imgre, html) return imglistfor i in range(len(url_all)): html = getHtml(url_all[i]) # 注意: 我這里沒有你那個錯誤,我只需要改這個就行了 # list = getImg(html.decode()) list = getImg(html) # print(list) x = 0 for imgurl in list:print(x)file_path = url_all[i](filepath, tempfilename) = os.path.split(file_path)(filename, extension) = os.path.splitext(tempfilename)if not os.path.exists(’d:%s’ % filename): os.mkdir(’d:%s’ % filename)# os.mkdir(’D:%s’ % filename2)local = r’D:%s%s.jpg’ % (filename, imgurl.split('/')[-1])try: urllib.request.urlretrieve(base_url + imgurl, local)except: print('can’t retrieve the' + base_url + imgurl)x += 1print('done')

標簽: Windows系統 win10
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
日韩高清中文字幕一区| 日韩在线观看一区| 国产精品蜜芽在线观看| 美女毛片一区二区三区四区最新中文字幕亚洲| 日韩精品一级二级 | 亚洲精品日韩久久| 欧美成a人国产精品高清乱码在线观看片在线观看久 | 亚洲久草在线| 中文一区一区三区免费在线观 | 国产日韩电影| 视频一区中文字幕国产| 五月婷婷六月综合| 久久久久亚洲精品中文字幕| 国产免费av国片精品草莓男男| 亚洲天堂日韩在线| 亚洲有吗中文字幕| 91精品国产经典在线观看| 久久精品 人人爱| 久久精品99国产国产精| 精品日韩在线| 色在线中文字幕| 国产精品视频一区视频二区| 国产成人精品一区二区三区免费| 人人精品亚洲| 群体交乱之放荡娇妻一区二区| 国产精品毛片视频| 国产91在线精品| 国产亚洲一区在线| 91精品一区二区三区综合| 丝袜美腿亚洲一区| 国产精品免费99久久久| 国产中文欧美日韩在线| 久久久精品久久久久久96| 日韩高清在线观看一区二区| 久久精品午夜| 99国产精品久久久久久久成人热| 欧美a一区二区| 亚洲一区二区三区免费在线观看 | 欧美在线网站| 欧美日韩18| 免费国产自线拍一欧美视频| 国产精品最新自拍| 日韩黄色大片| 日本一区福利在线| 136国产福利精品导航网址| 日韩高清电影免费| 欧美69视频| 久久精品伊人| 亚洲精品人人| 日产午夜精品一线二线三线| 在线亚洲国产精品网站| 成人av二区| 国产精品视频一区二区三区四蜜臂| 精品美女久久| 喷白浆一区二区| 肉色欧美久久久久久久免费看 | 亚洲精品影院在线观看| 午夜日韩av| 久久中文精品| 日韩国产在线一| 五月激激激综合网色播| 欧美不卡在线| 日韩中文首页| 欧美亚洲精品在线| 91麻豆精品| 99成人在线| 免费不卡中文字幕在线| 婷婷激情一区| av资源新版天堂在线| 亚洲精品一级| 国产日韩综合| 国产偷自视频区视频一区二区| 国产一区日韩欧美| 国产成人久久精品麻豆二区| 狠狠久久婷婷| 亚洲青青久久| 日本欧美韩国一区三区| 偷拍亚洲精品| 在线观看亚洲精品福利片| 中文字幕成在线观看| 免费成人在线影院| 日本国产亚洲| 久久av影视| 欧美成人一二区| 久久久久伊人| 美女av一区| 欧美在线网站| 日本国产亚洲| 国产精品久久久久久av公交车| 日韩三级精品| 久久99蜜桃| 影视先锋久久| 国产欧美日韩一区二区三区四区 | 精品视频97| 欧美中文字幕一区二区| 五月亚洲婷婷 | 亚洲精品成人一区| 国产一区2区在线观看| av中文资源在线资源免费观看| 国产91在线精品| 日韩在线视频精品| 国产精品色网| 亚洲精品永久免费视频| 怡红院精品视频在线观看极品| 欧美在线黄色| 国产成人精品一区二区三区视频 | 91精品国产福利在线观看麻豆| 日韩高清不卡一区二区| 亚洲女人av| 欧美日韩四区| 欧美在线综合| 一二三区精品| 欧美特黄一区| 国产高清一区| 日韩综合精品| 亚洲五月婷婷| 久久亚洲色图| 亚洲91网站| 麻豆精品视频在线| 国产不卡人人| 激情欧美一区| 免费在线成人网| 69堂精品视频在线播放| 免费一级欧美在线观看视频| 精品久久一区| 欧美丝袜一区| 日韩在线观看中文字幕| 亚洲毛片在线| 欧美国产极品| 99久久99久久精品国产片果冰| 99riav1国产精品视频| 在线亚洲国产精品网站| 麻豆极品一区二区三区| 亚洲综合丁香| 亚洲深夜av| 午夜国产精品视频免费体验区| 亚洲啊v在线| 中文字幕成在线观看| 日韩欧美自拍| 日本不良网站在线观看| 日韩毛片在线| 亚洲经典在线| 99视频+国产日韩欧美| 午夜精品婷婷| 亚洲成人精选| 国产精品久久久免费| 国产精品超碰| 久久久91麻豆精品国产一区| 另类欧美日韩国产在线| 91欧美国产| 黑丝一区二区| 欧美日韩精品一区二区三区视频| 欧美一区精品| 在线一区av| 国产日韩专区| 青草久久视频| 精品国产aⅴ| 不卡中文一二三区| 国产精品99免费看| 亚洲毛片网站| 久久精品三级| 亚洲一区不卡| 你懂的网址国产 欧美| 亚洲天堂成人| 97se亚洲| 精品一区在线| 国产精品久久国产愉拍| 国内在线观看一区二区三区| 亚洲综合国产| 国产一区国产二区国产三区| 国产一区二区精品| 精品视频黄色| 亚洲人成毛片在线播放女女| 日韩影院在线观看| av资源中文在线| 日韩国产欧美一区二区三区| 91精品xxx在线观看| 国产精品黄色| 六月丁香综合| 在线一区视频观看| 国产精品成人自拍| 日韩欧美在线精品| 蜜桃av一区| 久久久精品久久久久久96| 精品久久中文| 国产情侣久久| 老鸭窝亚洲一区二区三区| 欧洲av不卡| 国产精品一区亚洲| 日韩精品欧美成人高清一区二区| 亚洲精品电影| 国产一区日韩欧美| 亚洲黄色免费av| 日韩综合一区| 超碰在线99| 国产精品久久久久久久久妇女| 国产精品白丝一区二区三区| 欧美日韩91| 国产欧美精品久久| 国产乱码精品一区二区亚洲|