日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

基于python requests selenium爬取excel vba過程解析

瀏覽:27日期:2022-07-14 11:53:09

目的:基于辦公與互聯網隔離,自帶的office軟件沒有帶本地幫助工具,因此在寫vba程序時比較不方便(后來發現07有自帶,心中吐血,瞎折騰些什么)。所以想到通過爬蟲在官方摘錄下來作為參考。

目標網站:https://docs.microsoft.com/zh-cn/office/vba/api/overview/

所使工具:

python3.7,requests、selenium庫

前端方面:使用了jquery、jstree(用于方便的制作無限層級菜單

設計思路:

1、分析目標頁面,可分出兩部分,左邊時導航,右邊是內容顯示。

2、通過selenium對導航條進行深度遍歷,取得導航條所有節點以及對應的鏈接,并以jstree的數據格式存儲。

# 導航層級為<ul> <li> <a>... <span>....

3、使用requests遍歷所有鏈接取得相應主體頁面。

實現:

## parent 上級節點# wait_text 上級節點對應的xpath路徑的文本項# level,limit 僅方便測試使用#def GetMenuDick_jstree(parent,level,wait_text,limit=2): if level >= limit: return [] parent.click() l = [] num = 1 new_wati_text = wait_text + ’/following-sibling::ul’ # 只需要等待ul出來就可以了/li[’ + str(ele_num) + ’]’ try: wait.until(EC.presence_of_element_located((By.XPATH,new_wati_text))) # 查詢子節點所有的 a節點和span節點(子菜單) childs = parent.find_elements_by_xpath(’following-sibling::ul/li/span | following-sibling::ul/li/a’) for i in childs: k = {} if i.get_attribute(’role’) == None:k[’text’] = i.text# 如果是子菜單,進行深度遍歷k[’children’] = GetMenuDick_jstree(i,level+1,new_wati_text + ’/li[’ + str(num) + ’]/span’,limit) else:# 網頁訪問的Url無Html后綴,需要加上。去除無相關地址,形成相對路徑。url_text = str(i.get_attribute(’href’)).replace(’https://docs.microsoft.com/zh-cn/office/’, ’’,1) + ’.html’k[’text’] = i.textk[’a_attr’] = {'href':url_text,'target':'showframe'}lhref.append(str(i.get_attribute(’href’))) num = num + 1 l.append(k) parent.click() # 最后收起來 except Exception as e: print(’error message:’,str(e),’error parent:’ ,parent.text,’ new_wati_text:’,new_wati_text,’num:’,str(num)) lerror.append(parent.text) finally: return l

# data菜單,lhref為后續需要訪問的地址。# 找到第一個excel節點,從excel開始data = []lhref = []lerror = []k = {}browser.get(start_url)browser.set_page_load_timeout(10) #超時設置xpath_text = ’//li[contains(@class,'tree')]/span[text()='Excel'][1]’cl = browser.find_element_by_xpath(xpath_text)k = {’text’:’Excel’}k[’children’] = GetMenuDick_jstree(cl,1,xpath_text,20)data.append(k)# Writing JSON datawith open(r’templetedata.json’, ’w’, encoding=’utf-8’) as f: json.dump(data, f)

進行到這里,已經擁有了excel vba下所有的菜單信息以及對應的url。下來需要得到頁面主體。

實現思路:

1、遍歷所有url

2、通過url得到相應的文件名

## 根據網頁地址,得到文件名,并創建相應文件夾#def create_file(url): t = ’https://docs.microsoft.com/zh-cn/office/’ # 替換掉字眼,然后根據路徑生成相應文件夾 url = url.replace(t,'',1) lname = url.split(’/’) # 先判斷有沒有第一個文件夾 path = lname[0] if not os.path.isdir(path): os.mkdir(path) for l in lname[1:-1]: path = path + ’’ + str(l) if not os.path.isdir(path): os.mkdir(path) if len(lname) > 1: path = path + ’’ + lname[-1] + ’.html’ return path

3、訪問url得到主體信息儲存。

# requests模式# 循環遍歷,如果錯誤,記錄下來,以后再執行had_lhref = []error_lhref = []num = 1for url in lhref: try: had_lhref.append(url) path = create_file(url) resp = requests.get(url,timeout=5,headers = headers) # 設置訪問超時,以及http頭 resp.encoding = ’utf-8’ html = etree.HTML(resp.text) c = html.xpath(’//main[@id='main']’) # tostring獲取標簽所有html內容,是字節類型,要decode為字符串 content = html_head + etree.tostring(c[0], method=’html’).decode(’utf-8’) with open(path,’w’, encoding=’utf-8’) as f: f.write(content) except Exception as e: print(’error message:’,str(e),’error url:’,url) error_lhref.append(url) if num % 10 == 0 : print(’done:’,str(num) + ’/’ + str(len(lhref)),’error num:’ + str(len(error_lhref))) #time.sleep(1) # 睡眠一下,防止被反 num = num + 1

現在,菜單信息與內容都有了,需要構建自己的主頁,這里使用了jstree;2個html,index.html,menu.html。

index.html:使用frame頁面框架,相對隔離。

<!DOCTYPE html><html><head> <meta charset='UTF-8'> <meta name='viewport' content='width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no'> <title>參考文檔</title> <script src='http://www.b3g6.com/bcjs/js/jquery.min.js'> </script></head><frameset rows='93%,7%'> <frameset cols='20%,80%' frameborder='yes' framespacing='1'> <frame src='http://www.b3g6.com/bcjs/menu.html' name='menuframe'/> <frame name='showframe' /> </frameset> <frameset frameborder='no' framespacing='1'> <frame src='http://www.b3g6.com/bcjs/a.html' /> </frameset></frameset></html>

menu.html:

1、引入了data.json,這樣在可以進行離線調用,使用ajax.get讀取json的話,會提示跨域失敗;

2、jstree會禁止<a>跳轉事件,所有需要通過監聽'change.tree'事件來進行跳轉。

<!DOCTYPE html><html lang='en'><head> <meta charset='UTF-8'> <title>Title</title> <script src='http://www.b3g6.com/bcjs/js/jquery.min.js'></script> <link rel='stylesheet' href='http://www.b3g6.com/bcjs/themes/default/style.min.css' rel='external nofollow' /> <script src='http://www.b3g6.com/bcjs/js/jstree.min.js'></script> <script type='text/javascript' src='http://www.b3g6.com/bcjs/data.json'></script></head><body> <div> <form id='s'> <input type='search' /> <button type='submit'>Search</button> </form> <div id='container'> </div> <div id='container'></div> <script> $(function () {$(’#container’).jstree({ 'plugins': ['search', 'changed'], ’core’: { ’data’: data, }}); }); $(’#container’).on('changed.jstree', function (e, data) {//console.log(data.changed.selected.length); // newly selected//console.log(data.changed.deselected); // newly deselectedif (data.changed.selected.length > 0){ // 說明轉換了,獲取url var url = data.node.a_attr.href // console.log(url) if (url == '#'){ }else{ parent[data.node.a_attr.target].location.href = url }}else{} }) $('#s').submit(function (e) {e.preventDefault();$('#container').jstree(true).search($('#q').val()); }); </script> </div></body></html>

以上,得到最后的本地版網頁excel vba參考工具。最后,部分office自帶本地版的vba參考工具,有點白干一場。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: python
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
精品久久精品| 国产精品亚洲四区在线观看 | 日本成人精品| 香蕉久久久久久久av网站| 久久精品国产www456c0m| 视频在线不卡免费观看| 国产日韩视频| 午夜亚洲精品| 91欧美在线| 97精品在线| 国产另类在线| 国产探花在线精品| 日韩美女精品| 美女一区网站| 欧美丝袜一区| 日本不卡免费高清视频在线| 欧美亚洲二区| 午夜日韩在线| 久久一区二区三区喷水| se01亚洲视频 | 美女精品网站| 丝袜a∨在线一区二区三区不卡| 亚洲欧美日韩综合国产aⅴ| 五月婷婷亚洲| 石原莉奈在线亚洲二区| 噜噜噜躁狠狠躁狠狠精品视频| 久久国产福利| 91国内精品| 久久精品国产一区二区| 精品国产免费人成网站| 蜜桃av.网站在线观看| 国产自产自拍视频在线观看 | 欧美在线精品一区| 国产免费久久| 九九九精品视频| av中文字幕在线观看第一页| 久久夜夜操妹子| 久久久久美女| 亚洲精品1区| 中文字幕视频精品一区二区三区| 亚洲v天堂v手机在线| 国产欧美丝祙| 97精品中文字幕| 亲子伦视频一区二区三区| 黄色免费成人| 久久国际精品| 国产精品中文| av免费不卡国产观看| 午夜久久免费观看| 亚洲综合图色| 国产欧美69| 天堂8中文在线最新版在线| 日韩欧美自拍| 免费不卡在线观看| 精品无人区麻豆乱码久久久| 999久久久91| 亚洲另类av| 免费在线亚洲欧美| 久久久夜精品| 日韩精品一区二区三区中文| 精品精品99| 极品日韩av| 国产精品伦一区二区| 欧美日韩国产在线观看网站| 国产精品亚洲二区| 91成人网在线观看| 国产精品mm| 欧美不卡高清一区二区三区| 免费久久精品视频| 国产成人精品福利| 日本久久综合| 日韩av中文字幕一区二区 | 日韩一区电影| 日韩高清电影免费| 国产91精品对白在线播放| 国产亚洲高清一区| 红桃视频国产精品| 成人精品高清在线视频| 亚洲一区二区日韩| 精品国产欧美日韩一区二区三区| 免费观看久久av| 国产伦精品一区二区三区在线播放 | 伊人成人网在线看| 国产精品v一区二区三区| 夜夜嗨av一区二区三区网站四季av| 久久一区精品| 综合日韩在线| 欧美综合另类| 日韩精品诱惑一区?区三区| 欧美亚洲二区| 亚洲激情五月| 国产精品蜜芽在线观看| 国产精品亚洲一区二区在线观看| 蜜臀久久久99精品久久久久久| 日韩另类视频| 精品国产a一区二区三区v免费| 日本少妇一区二区| 免费精品视频| 日韩一区亚洲二区| 国产精品亚洲综合色区韩国| 四虎在线精品| 亚洲影视一区二区三区| 午夜精品亚洲| 亚洲午夜av| 久久久久午夜电影| 国产精品99久久久久久董美香| 亚洲色图网站| 亚洲在线电影| 99re国产精品| 亚洲激情国产| 免费黄色成人| 欧美jjzz| 欧美日韩在线网站| 久久久久一区| 视频小说一区二区| 日韩免费视频| 激情国产在线| 电影天堂国产精品| 日韩中文影院| 久久精品播放| 欧洲av不卡| 日韩一区二区三区免费| 韩国久久久久久| 国产一二在线播放| 久久只有精品| 国产人成精品一区二区三| 欧美片第1页综合| 国产日韩欧美一区在线| 国产日韩精品视频一区二区三区| 日韩一区免费| 欧美日韩xxxx| 国产精品亚洲二区| 国产精品成人国产| 美女精品一区二区| 高清一区二区| 另类专区亚洲| 久久久夜夜夜| 亚洲成人日韩| 亚洲精品成人一区| 国产精品亚洲产品| 欧美成人aaa| 精品一区av| 香蕉久久99| 一区二区三区四区精品视频| 亚洲激情婷婷| 亚洲欧美网站在线观看| 日韩三级精品| 欧美精品不卡| 免费一二一二在线视频| 亚洲欧洲另类| 人人精品久久| 人人爱人人干婷婷丁香亚洲| 日韩国产在线一| 麻豆国产一区| 欧美日韩中文一区二区| 亚洲精品麻豆| 久久亚洲黄色| 久久婷婷av| 一区二区国产在线| 牛牛精品成人免费视频| 91亚洲国产成人久久精品| 亚洲韩日在线| 日韩欧美高清一区二区三区| 精品一区二区三区免费看| 99久久精品网站| 99在线精品免费视频九九视| 亚洲精品一级| 国产a亚洲精品| 久久国产88| 精品国产精品国产偷麻豆| 欧美日韩国产欧| 国产日产精品_国产精品毛片 | 夜久久久久久| 欧美日韩一区二区国产| 伊伊综合在线| 日韩国产欧美在线播放| 日韩一区二区中文| 日本精品在线播放| 色老板在线视频一区二区| 日韩激情网站| 久久亚洲成人| 亚久久调教视频| 一本大道色婷婷在线| 综合国产在线| 九九精品调教| 国产精品九九| 狠狠色综合网| 国产精品久久久久av蜜臀| 欧美亚洲精品在线| 国产精品igao视频网网址不卡日韩| 影院欧美亚洲| 国产精品一区高清| 蜜臀精品久久久久久蜜臀| 欧洲亚洲一区二区三区| 久久精品五月| 美女精品视频在线| 国产亚洲一区| 欧美亚洲网站| 国产毛片精品久久| 国产欧美日韩在线观看视频|