日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

python實現(xiàn)PDF中表格轉(zhuǎn)化為Excel的方法

瀏覽:148日期:2022-07-21 08:53:57

這幾天想統(tǒng)計一下《中國人文社會科學期刊 AMI 綜合評價報告(2018 年):A 刊評價報告》中的期刊,但是只找到了該報告的PDF版,對于表格的編輯不太方便,于是想到用Python將表格轉(zhuǎn)成Excel格式。

python實現(xiàn)PDF中表格轉(zhuǎn)化為Excel的方法

看過別人寫的博客,發(fā)現(xiàn)Python解析PDF有以下四種方式:

-pdfminer:擅長文字的解析,把表格解析成普通的文本,沒有格式;-pdf2html:把pdf解析成html,但html的標簽并沒有規(guī)律,解析一個表格還可以,多個表格的話不太好提取;-tabula:對于簡單的表格,即單元格中沒有換行的,表頭表尾形式不復雜的,使用比較方便。但是單腦需要Java環(huán)境;-pdfplumber:是一個可以處理pdf格式信息的庫。可以查找關(guān)于每個文本字符、矩陣、和行的詳細信息,也可以對表格進行提取并進行可視化調(diào)試。

本文采用pdfplumber庫讀取PDF中的表格,運行環(huán)境:Python3.5.2,Anaconda4.2.0。首先簡單介紹一下pdfplumber庫:

-pdfplumber.pdf中包含了.metadata和.pages兩個屬性:.metadata是一個包含pdf信息的字典。.pages是一個包含頁面信息的列表。

-pdfplumber.page的類中包含的主要的屬性:

.page_number 頁碼。.width 頁面寬度。.height 頁面高度。.objects/.chars/.lines/.rects 這些屬性中每一個都是一個列表,每個列表都包含一個字典,每個字典用于說明頁面中的對象信息, 包括直線,字符, 方格等位置信息。

-一些常用的方法:

.extract_text() 用來提頁面中的文本,將頁面的所有字符對象整理為的那個字符串。.extract_words() 返回的是所有的單詞及其相關(guān)信息。.extract_tables() 提取頁面的表格。.to_image() 用于可視化調(diào)試時,返回PageImage類的一個實例。

import pdfplumberimport pandas as pdpath = ’test.pdf’pdf = pdfplumber.open(path)i=1#writer=pd.ExcelWriter(’output.xlsx’)df=pd.DataFrame(columns=[’序號’,’刊名’,’主辦單位’,’等級’])sheetname=[’考古文博’,’歷史學’,’馬克思主義理論’,’民族學與文化學’,’文學-外國文學’,’文學-中國文學’,’藝術(shù)學’,’語言學’,’哲學’,’宗教學’,’法學’ ,’管理學’,’環(huán)境科學’,’教育學’,’經(jīng)濟學-財政科學’,’經(jīng)濟學-工業(yè)經(jīng)濟’,’經(jīng)濟學-金融’,’經(jīng)濟學-經(jīng)濟管理’,’經(jīng)濟學-經(jīng)濟綜合’,’經(jīng)濟學-貿(mào)易經(jīng)濟’ ,’經(jīng)濟學-農(nóng)業(yè)經(jīng)濟’,’經(jīng)濟學-世界經(jīng)濟’,’人文地理學’,’社會學’,’體育學’,’統(tǒng)計學’,’圖書館情報與檔案學’,’心理學’,’新聞學與傳播學’ ,’政治學-國際政治’,’政治學-中國政治’,’綜合-高校綜合性學報’,’綜合-綜合性人文社科期刊’] ##由于存在一個表格跨頁的情況,先將所有表格存放在一個DataFrame中,再根據(jù)序號拆分。for page in pdf.pages[17:59]: print (page) # 獲取當前頁面的全部文本信息,包括表格中的文字 # print(page.extract_text()) for table in page.extract_tables(): #print(table) df=df.append(pd.DataFrame(table[1:],columns=table[0]),ignore_index=True)print (df)writer=pd.ExcelWriter(’output3.xlsx’)new_df=pd.DataFrame()j=1index=[]#記錄序號==1的行索引,用于后面的表格拆分for i in range(len(df)): if df.ix[i,0]==’1’: index.append(i) print ('################')index.append(len(df))#print (index)#按行索引將內(nèi)容切片并逐個添加到表中for t in range(len(index)-1): new_df=df.ix[index[t]:index[t+1]-1,:] #print (new_df) new_df.to_excel(writer,sheet_name=sheetname[t],encoding=’gb2312’,index=None)writer.save()pdf.close()print(’finished’)

最終保存為Excel。

python實現(xiàn)PDF中表格轉(zhuǎn)化為Excel的方法

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網(wǎng)。

標簽: python
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
亚洲人成亚洲精品| 97精品国产一区二区三区 | 精品中文在线| 亚洲精品第一| 久久精品一区二区不卡| 日韩久久一区| 91精品综合| 日韩美女一区二区三区在线观看| 国产精品久久久久久久久免费高清| 久久亚洲欧洲| 狠狠爱成人网| 国产一区二区中文| 午夜精品久久久久久久久久蜜桃| 动漫av一区| 精品国产亚洲一区二区在线观看| 日本免费在线视频不卡一不卡二| 免费人成黄页网站在线一区二区 | 亚洲综合小说| 久久午夜精品一区二区| 在线一区免费观看| 99热精品在线观看| 亚洲少妇诱惑| 亚洲一级在线| 先锋亚洲精品| 蜜桃视频一区二区三区 | 亚洲午夜视频| 成人精品久久| 欧美国产小视频| 国产白浆在线免费观看| 国产精品啊v在线| 久久只有精品| 成人黄色av| 日韩伦理一区| 欧美sm一区| 欧美亚洲精品在线| 免费日韩av片| 日韩精品三区四区| 国产精品多人| 成人国产精品久久| 日韩高清中文字幕一区二区| 久久久精品久久久久久96| 国产精品7m凸凹视频分类| 国产一区久久| 免费在线观看一区二区三区| 国产农村妇女精品一区二区| 久久国产精品久久w女人spa| 在线观看一区| 国产毛片一区二区三区 | 欧美日韩精品免费观看视频完整| av在线资源| 久久亚洲专区| 麻豆91精品| 91精品国产一区二区在线观看| 国产精品夜夜夜| 在线看片国产福利你懂的| 欧美日韩激情| 亚洲人成亚洲精品| 欧美日韩xxxx| 国产一区二区三区四区| 久久精品青草| 美女黄网久久| 国产欧美日韩免费观看| 日韩久久电影| 国产精品免费看| 亚洲一区有码| 国产精品15p| 四虎4545www国产精品 | 成人欧美一区二区三区的电影| 久久精品国产www456c0m| 亚洲一卡久久| 国产欧美高清视频在线| 午夜精品成人av| 99在线精品视频在线观看| 日韩精品亚洲专区在线观看| 麻豆成人综合网| 99久久精品国产亚洲精品| 日本一区二区中文字幕| 97精品一区二区| 亚洲综合福利| 久久精品国产99国产| 伊人久久亚洲美女图片| 国产精品一卡| 亚洲一区二区三区四区五区午夜 | 久久国产乱子精品免费女| 精品福利久久久| 不卡在线一区| 91精品丝袜国产高跟在线| av一区在线| 欧美一区91| 99视频精品视频高清免费| 欧美在线不卡| 蜜桃国内精品久久久久软件9| 国产亚洲欧美日韩精品一区二区三区 | 激情久久婷婷| 91久久精品无嫩草影院| 99久久婷婷| 日韩影片在线观看| 久久久精品久久久久久96| 日韩一区二区三免费高清在线观看 | 国产亚洲一区在线| 国产一区丝袜| 三级欧美在线一区| 欧美成人a交片免费看| 日韩av中文在线观看| 欧美日韩黑人| 91青青国产在线观看精品| 国产精品任我爽爆在线播放| 日韩高清不卡在线| 午夜久久黄色| 婷婷精品进入| 女主播福利一区| 欧美天堂亚洲电影院在线观看| 色88888久久久久久影院| 中文字幕在线官网| 国产精品成人a在线观看| 精品国产麻豆| 国产一区二区三区视频在线| 精品一区二区三区中文字幕在线| 欧美韩一区二区| 国产精品66| 国产精品黄色片| 久久精品国产久精国产| 精品亚洲自拍| 国产成人精品免费视| 国产一区二区三区亚洲| 久久久久久一区二区| 日韩电影免费网址| 亚洲成人va| 精品在线91| 在线一区视频| 综合日韩在线| 日韩一区网站| 国产精品久久久久毛片大屁完整版| 国产精品久久久久久av公交车| 久久av影视| 国产不卡一区| 日韩精品免费一区二区三区| 婷婷丁香综合| 玖玖精品视频| 亚欧成人精品| 久久精品99国产国产精| 精品国产乱码久久久| 精品捆绑调教一区二区三区| 91久久久精品国产| 伊人久久大香伊蕉在人线观看热v| 午夜天堂精品久久久久| 国产精品男女| 亚洲黄色免费看| 欧美在线亚洲综合一区| 少妇精品久久久一区二区| 国产精品一区二区三区四区在线观看 | 伊人成人在线视频| 中文字幕一区二区三区四区久久| 日本免费一区二区视频| 免费在线日韩av| 日韩欧美午夜| 日韩视频久久| 欧美天堂在线| 欧美少妇精品| 免费在线观看视频一区| 国产精品久久久久久久久久妞妞| 免费看av不卡| 日韩中文字幕不卡| 国产精品一区二区三区四区在线观看| 久久av免费| 极品日韩av| 日韩高清欧美激情| av高清不卡| 综合干狼人综合首页| 精品不卡一区| 亚洲一区二区三区高清不卡| 久久狠狠亚洲综合| 秋霞国产精品| 日韩欧乱色一区二区三区在线| 免费精品一区| 亚洲青青久久| 国产精品毛片久久| 日本 国产 欧美色综合| 老牛国内精品亚洲成av人片 | 久久久久亚洲精品中文字幕| 99久久精品网站| 7m精品国产导航在线| 日韩不卡在线| 久久国产尿小便嘘嘘| 亚洲大片在线| 国产精品v一区二区三区| 在线日韩中文| 国产精品久久久久久av公交车| 免费观看久久av| 麻豆精品新av中文字幕| 在线一区免费| 国产成人免费视频网站视频社区| 国产精品人人爽人人做我的可爱| 国产精品99久久久久久董美香| 一区在线观看| 欧美激情另类| 日韩国产欧美在线播放| 亚洲二区视频| 精品久久一区| 欧美日韩夜夜|