日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例

瀏覽:31日期:2022-07-01 15:04:36

隨著SaaS服務(wù)的流行,越來越多的人選擇在各個平臺上編寫文檔,制作表格并進(jìn)行分享。

同時,隨著Markdown語法的破圈,很多平臺開始集成支持這種簡潔的書寫標(biāo)記語言,這樣可以保證平臺上用戶文檔樣式的統(tǒng)一性。

但是在一些場景下,我們還是會在本地的Office軟件上寫有很多文檔,或者歷史遺留了很多本地文檔。

如果我們需要將其上傳到各大平臺,直接復(fù)制粘貼,大概率是會造成文檔內(nèi)容結(jié)構(gòu)和樣式的丟失。于此我們需要將其轉(zhuǎn)換為 Markdown 語法。

很多桌面軟件(比如Typora)都提供了導(dǎo)入 Word 文件的功能,這類功能一般是通過 Pandoc 這個軟件來擴(kuò)展實(shí)現(xiàn)的。

Pandoc 是一個全能型的文檔格式轉(zhuǎn)換工具,其能夠?qū)⒍喾N文檔格式轉(zhuǎn)換為各類常見的文檔格式。具體的文檔格式之間的轉(zhuǎn)換如下圖所示(來源于官網(wǎng)):

Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例

Pandoc 是瑞士軍刀一般的存在,能夠較好的處理各類的文檔格式轉(zhuǎn)換,但是如果我們需要自己寫程序,調(diào)用 Pandoc 則需要額外的安裝 Pandoc 才行,并且也不方便自定義。

幸而,在 Python 中有很多第三方模塊提供了此類文檔格式的轉(zhuǎn)換功能。今天,我們來實(shí)現(xiàn)一下比較頻繁使用到的 Word 文檔轉(zhuǎn) Markdown 文檔。

轉(zhuǎn)換邏輯

Word 文檔到 Markdown 文檔的轉(zhuǎn)換總體而言分兩步來實(shí)現(xiàn):

第一步,將 Word 文檔轉(zhuǎn)換為 HTML 文檔; 第二步,將 HTML 文檔轉(zhuǎn)換為 Markdown 文檔; 依賴模塊

要實(shí)現(xiàn)這個功能我們需要借助 Python 的兩個第三方模塊:

mammoth markdownify

mammoth 是一個用于將 Word 文檔轉(zhuǎn)換為 HTML 的模塊,它支持在 Python、JavaScript、Java、.Net等平臺使用。而 markdownify 則是將 HTML 轉(zhuǎn)換為 Markdown 文檔的模塊。

處理 Word 圖片

因?yàn)?Word 文檔中不可避免地會存在很多圖片,為了在轉(zhuǎn)換后的文檔中能夠正確地顯示圖片,我們需要自定義一下Word 文檔內(nèi)圖片的處理方式。默認(rèn)情況下,mammoth 會將圖片轉(zhuǎn)換為 base64 編碼的字符串,這樣不用生成額外的本地圖片文件,但是會使文檔體積變得很大。所以我們選擇將圖片另存為本地圖片:

# 轉(zhuǎn)存Word文檔內(nèi)的圖片def convert_img(image): with image.open() as image_bytes: file_suffix = image.content_type.split('/')[1] path_file = './img/{}.{}'.format(str(time.time()),file_suffix) with open(path_file, ’wb’) as f: f.write(image_bytes.read()) return {'src':path_file}正式轉(zhuǎn)換

在這里,我們以州的先生很久以前寫的《Python爬蟲實(shí)戰(zhàn)與機(jī)器學(xué)習(xí)應(yīng)用》(需要這本書的小伙伴可以微信私聊我)這本書的 Word 文檔來演示。

Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例

代碼如下所示:

# 讀取Word文件with open(r'F:自媒體Python爬蟲實(shí)戰(zhàn)與機(jī)器學(xué)習(xí)應(yīng)用.docx' ,'rb') as docx_file: # 轉(zhuǎn)化Word文檔為HTML result = mammoth.convert_to_html(docx_file,convert_image=mammoth.images.img_element(convert_img)) # 獲取HTML內(nèi)容 html = result.value # 轉(zhuǎn)化HTML為Markdown md = markdownify(html,heading_style='ATX') print(md) with open('./docx_to_html.html',’w’,encoding=’utf-8’) as html_file,open('./docx_to_md.md','w',encoding=’utf-8’) as md_file: html_file.write(html) md_file.write(md) messages = result.messages

運(yùn)行程序,最終生成2個文件:

docx_to_html.html docx_to_md.md

其中,docx_to_html.html 是 Word 文檔轉(zhuǎn)換為 HTML 后的文檔:

Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例

docx_to_md.md 是 HTML 轉(zhuǎn)換為 Markdown 后的文檔:

Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例

最后是另存為的圖片:

Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例

怎么樣,簡單的二三十行代碼就完成了 Word 到 Markdown 文檔的轉(zhuǎn)換,是不是很簡單?

此功能將集成到覓道文檔作為文檔導(dǎo)入的功能實(shí)現(xiàn),歡迎持續(xù)進(jìn)行關(guān)注!

文章版權(quán)所有:州的先生博客

原文地址:https://zmister.com/archives/1601.html

以上就是Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例的詳細(xì)內(nèi)容,更多關(guān)于python Word文檔轉(zhuǎn)換Markdown的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: python
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产偷自视频区视频一区二区| 日韩国产成人精品| 成人亚洲精品| 福利精品一区| 国产aⅴ精品一区二区四区| 九九九精品视频| 91亚洲成人| 国内精品麻豆美女在线播放视频| 麻豆一区在线| 国产欧美一区二区三区精品酒店| 欧美日韩视频免费观看| 国产综合婷婷| 国产精品社区| 7777精品| 四季av一区二区凹凸精品| 天堂8中文在线最新版在线| 999精品一区| 免费视频久久| 欧美有码在线| 精品久久在线| 久久久久亚洲| 蜜臀久久99精品久久久画质超高清| 视频一区视频二区在线观看| 中文字幕免费一区二区| 国产日韩一区二区三区在线播放| 精品视频自拍| 亚洲午夜久久久久久尤物| 久久国产福利| 久久国产精品免费一区二区三区| 精品亚洲二区| 蜜桃视频欧美| 综合欧美精品| 欧美激情一区| 久久免费大视频| 亚洲综合中文| 久久久精品国产**网站| 亚洲二区在线| 亚洲欧美网站在线观看| 国产精品网址| 亚洲网站视频| 久久国内精品自在自线400部| 国产夫妻在线| 在线视频亚洲欧美中文| 久久婷婷国产| 图片区亚洲欧美小说区| 日韩不卡在线观看日韩不卡视频| av资源新版天堂在线| 久热精品在线| 国产第一亚洲| 手机精品视频在线观看| 久久精品国产999大香线蕉| 日韩一级精品| 精品久久一区| 乱人伦精品视频在线观看| 7777精品| 五月天综合网站| 久久国产精品免费一区二区三区 | 日韩激情综合| 成人羞羞在线观看网站| 日韩1区2区日韩1区2区| 久久久久免费av| 国产精品夜夜夜| 老牛国产精品一区的观看方式| 欧美韩一区二区| 免费日韩视频| 成人看片网站| 日韩欧美激情电影| 欧美一区二区性| 精品视频一二| 青草综合视频| 亚洲国产成人精品女人| 电影91久久久| 7m精品国产导航在线| 亚洲国产一区二区三区在线播放| 久久99免费视频| 日韩综合一区二区| 欧美在线网站| 视频在线不卡免费观看| 日本欧美在线| 伊人久久亚洲热| а√天堂8资源在线| 日本亚州欧洲精品不卡| 亚洲成人三区| 欧洲精品一区二区三区| 久久影院一区二区三区| 日韩精品视频在线看| 日韩视频在线一区二区三区 | 亚洲综合不卡| 九色精品91| 国内不卡的一区二区三区中文字幕| 亚洲欧洲专区| 日韩午夜免费| 久久久久蜜桃| 天堂8中文在线最新版在线| 国产精品v亚洲精品v日韩精品| 亚洲精品日韩久久| 日韩一级不卡| 黄色欧美日韩| 激情婷婷久久| 欧美亚洲国产激情| www成人在线视频| 国产在线观看www| 国产中文欧美日韩在线| 国产精品一二| 日韩国产在线观看一区| 四虎精品永久免费| 亚洲精品欧洲| 婷婷精品久久久久久久久久不卡| 视频一区二区欧美| 夜久久久久久| 夜夜嗨av一区二区三区网站四季av| 欧美亚洲国产一区| 国内精品福利| 中文一区二区| 天堂av在线一区| 久久成人亚洲| 久久亚洲风情| 日韩中文字幕1| 日韩制服丝袜av| aa国产精品| 美女国产精品| 一区二区三区网站| 日韩欧美中文字幕电影| 日本不卡中文字幕| 欧美亚洲三级| 久久99久久人婷婷精品综合| 国产激情欧美| 精品99久久| 中文字幕系列一区| 红桃视频亚洲| 亚洲aa在线| 国产高清精品二区| 欧美国产美女| 美女少妇全过程你懂的久久| 亚洲第一区色| 日韩中文字幕区一区有砖一区| 亚洲精品日本| 国产精品久久久久久久久久久久久久久| 国产精品久久久久毛片大屁完整版| 免费亚洲婷婷| 国产成人精品亚洲日本在线观看| 亚洲调教视频在线观看| 亚洲一区二区成人| 日韩美女国产精品| 免费人成在线不卡| 国产精品亚洲成在人线| 欧美精品一区二区久久| 亚洲香蕉久久| 精品不卡一区| 黑丝一区二区| 精品资源在线| 亚洲伊人影院| 日韩欧美网址| 91精品国产经典在线观看| 在线亚洲一区| 蜜桃av一区二区在线观看| 日本成人中文字幕| 国产精品免费99久久久| 国产一区丝袜| 美女网站一区| 亚洲tv在线| 精品国产欧美日韩一区二区三区| 亚洲成人精品| 蜜臀av亚洲一区中文字幕| 中文字幕av亚洲精品一部二部| 国产精品高清一区二区| 日韩高清欧美| 快she精品国产999| 欧美成人精品午夜一区二区| 久久中文字幕二区| 日本麻豆一区二区三区视频| 久久久久黄色| 日韩视频不卡| 国产精品午夜av| 久久视频精品| 欧美亚洲tv| 精品成人免费一区二区在线播放| 首页国产欧美日韩丝袜| 免费亚洲一区| 国产99精品一区| 欧美影院视频| 亚洲精品成人| 久久精品系列| 亚洲午夜久久| 香蕉成人av| 欧美一级全黄| 久久麻豆精品| 国产精品qvod| 午夜在线播放视频欧美| 美腿丝袜亚洲一区| 国产免费成人| 97精品一区| 日韩激情一区二区| 久久在线视频免费观看| 日本国产亚洲| 亚洲国产不卡| 久久精品伊人| 日韩精品视频网| 成午夜精品一区二区三区软件| 亚洲精品成人|