日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

Python實現Wordcloud生成詞云圖的示例

瀏覽:49日期:2022-07-31 16:46:55

wordcloud是Python擴展庫中一種將詞語用圖片表達出來的一種形式,通過詞云生成的圖片,我們可以更加直觀的看出某篇文章的故事梗概。

首先貼出一張詞云圖(以哈利波特小說為例):

Python實現Wordcloud生成詞云圖的示例

在生成詞云圖之前,首先要做一些準備工作

1.安裝結巴分詞庫

pip install jieba

Python實現Wordcloud生成詞云圖的示例

Python中的分詞模塊有很多,他們的功能也都是大同小異,我們安裝的結巴分詞 是當前使用的最多的類型。

下面我來簡單介紹一下結巴分詞的用法

結巴分詞的分詞模式分為三種:

(1)全模式:把句子中所有的可以成詞的詞語都掃描出來, 速度快,但是不能解決歧義問題

(2)精確模式:將句子最精確地切開,適合文本分析

(3)搜索引擎模式:在精確模式的基礎上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞

下面用一個簡單的例子來看一下三種模式的分詞區別:

import jieba # 全模式:把句子中所有的可以成詞的詞語都掃描出來, 速度快,但是不能解決歧義問題 text = '哈利波特是一常優秀的文學作品' seg_list = jieba.cut(text, cut_all=True) print(u'[全模式]: ', '/ '.join(seg_list)) # 精確模式:將句子最精確地切開,適合文本分析 seg_list = jieba.cut(text, cut_all=False) print(u'[精確模式]: ', '/ '.join(seg_list)) # 默認是精確模式 seg_list = jieba.cut(text) print(u'[默認模式]: ', '/ '.join(seg_list)) # 搜索引擎模式:在精確模式的基礎上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞seg_list = jieba.cut_for_search(text)print(u'[搜索引擎模式]: ', '/ '.join(seg_list))

下面是對這句話的分詞方式:

Python實現Wordcloud生成詞云圖的示例

通過這三種分詞模式可以看出,這些分詞模式并沒有很好的劃分出“哈利波特”這個專有名詞,這是因為在結巴分詞的字典中并沒有記錄這個名詞,所以需要我們手動添加自定義字典

添加自定義字典:找一個方便引用的位置 (下圖的路徑是我安裝的位置),新建文本文檔(后綴名為.txt),將想添加的詞輸入進去(注意輸入格式),保存并退出

Python實現Wordcloud生成詞云圖的示例

在上面的代碼中加入自定義字典的路徑,再點擊運行

jieba.load_userdict('/home/jmhao/anaconda3/lib/python3.7/site-packages/jieba/mydict.txt')

分詞結果,可以看出“哈利波特”這個詞已經被識別出來了

Python實現Wordcloud生成詞云圖的示例

結巴分詞還有另一個禁用詞的輸出結果

stopwords = {}.fromkeys([’優秀’, ’文學作品’]) #添加禁用詞之后 seg_list = jieba.cut(text) final = ’’ for seg in seg_list: if seg not in stopwords: final += seg seg_list_new = jieba.cut(final) print(u'[切割之后]: ', '/ '.join(seg_list_new))

可以看到輸出結果中并沒有“優秀”和“文學作品”兩個詞

Python實現Wordcloud生成詞云圖的示例

結巴分詞還有很多比較復雜的操作,具體的可以去官網查看,我就不再過多的贅述了

下面我們正式開始詞云的制作

首先下載模塊,這里我所使用的環境是Anaconda,由于Anaconda中包含很多常用的擴展包,所以這里只需要下載wordcloud。若使用的環境不是Anaconda,則另需安裝numpy和PIL模塊

pip install wordcloud

Python實現Wordcloud生成詞云圖的示例

然后我們需要找一篇文章并使用結巴分詞將文章分成詞語的形式

# 分詞模塊 def cut(text): # 選擇分詞模式 word_list = jieba.cut(text,cut_all= True) # 分詞后在單獨個體之間加上空格 result = ' '.join(word_list) # 返回分詞結果 return result

這里我在當前文件夾下創建了一個文本文檔“xiaoshuo.txt”,并復制了一章的小說作為詞云的主體文字

使用代碼控制,打開并讀取小說的內容

#導入文本文件,進行分詞,制作詞云 with open('xiaoshuo.txt') as fp: text = fp.read() # 將讀取的中文文檔進行分詞 text = cut(text)

在網上找到一張白色背景的圖片下載到當前文件夾,作為詞云的背景圖(若不指定圖片,則默認生成矩形詞云)

#設置詞云形狀,若設置了詞云的形狀,生成的詞云與圖片保持一致,后面設置的寬度和高度將默認無效 mask = np.array(image.open('monkey.jpeg'))

接下來可以根據喜好來定義詞云的顏色、輪廓等參數 下面為常用的參數設置方法

font_path : '字體路徑' 詞云的字體樣式,若要輸出中文,則跟隨中文的字體 width = n 畫布寬度,默認為400像素 height = n 畫布高度,默認為400像素 scale = n 按比例放大或縮小畫布 min_font_size = n 設置最小的字體大小 max_font_size = n 設置最大的字體大小 stopwords = ’words’ 設置要屏蔽的詞語 background_color = ’’color 設置背景板顏色 relative_scaling = n 設置字體大小與詞頻的關聯性 contour_width = n 設置輪廓寬度 contour_color = ’color’ 設置輪廓顏色

完整代碼

#導入詞云庫 from wordcloud import WordCloud #導入圖像處理庫 import PIL.Image as image #導入數據處理庫 import numpy as np #導入結巴分詞庫 import jieba # 分詞模塊 def cut(text): # 選擇分詞模式 word_list = jieba.cut(text,cut_all= True) # 分詞后在單獨個體之間加上空格 result = ' '.join(word_list) return result #導入文本文件,進行分詞,制作詞云 with open('xiaoshuo.txt') as fp: text = fp.read() # 將讀取的中文文檔進行分詞 text = cut(text) #設置詞云形狀 mask = np.array(image.open('monkey.jpeg')) #自定義詞云 wordcloud = WordCloud( # 遮罩層,除白色背景外,其余圖層全部繪制(之前設置的寬高無效) mask=mask, #默認黑色背景,更改為白色 background_color=’#FFFFFF’, #按照比例擴大或縮小畫布 scale=, # 若想生成中文字體,需添加中文字體路徑 font_path='/usr/share/fonts/bb5828/逐浪雅宋體.otf' ).generate(text) #返回對象 image_produce = wordcloud.to_image() #保存圖片 wordcloud.to_file('new_wordcloud.jpg') #顯示圖像 image_produce.show()

注:若想要生成圖片樣式的詞云圖,找到的圖片背景必須為白色,或者使用Photoshop摳圖替換成白色背景,否則生成的詞云為矩形

我的詞云原圖:

Python實現Wordcloud生成詞云圖的示例

生成的詞云圖:

Python實現Wordcloud生成詞云圖的示例

到此這篇關于Python實現Wordcloud生成詞云圖的示例的文章就介紹到這了,更多相關Python Wordcloud生成詞云圖內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: python
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
久久精品国产久精国产| 色偷偷偷在线视频播放| 日韩精品影视| 成人精品亚洲| 国产精品嫩草99av在线| 国产高清一区| 婷婷激情图片久久| 日韩av一级| 香蕉久久夜色精品国产| 日韩三级久久| 久久av影院| 久久黄色影院| 蜜臀av性久久久久蜜臀aⅴ四虎 | 国产精品久久久久av电视剧| 久久视频国产| 日精品一区二区三区| 欧美日本不卡| 久久中文字幕二区| 爽好多水快深点欧美视频| 日韩影院精彩在线| 国产精品国产三级在线观看| 久久久人人人| 奇米狠狠一区二区三区| 丁香六月综合| 亚久久调教视频| 麻豆视频在线观看免费网站黄| 国产成人a视频高清在线观看| 91日韩欧美| 日韩中文av| 国产在线一区不卡| 中文字幕日韩高清在线| 国产不卡av一区二区| 日韩 欧美一区二区三区| 国产精品久久久久av蜜臀| 国产99亚洲| 国产第一亚洲| 国产欧美在线| 亚洲资源网站| 国产午夜精品一区二区三区欧美 | 最新国产精品久久久| 成人亚洲欧美| 久久99国产精品视频| 国产亚洲一级| 亚洲午夜精品久久久久久app| 国产精品高潮呻吟久久久久| 免费观看在线色综合| 婷婷亚洲五月| 久久精品免费一区二区三区| 国产精品chinese| 国产午夜精品一区在线观看| 亚洲精品福利| 亚洲精品乱码久久久久久蜜桃麻豆| 91精品国产自产在线观看永久∴| 久久久精品区| 国产在线观看91一区二区三区| 国产精品二区影院| 精品视频国内| 欧美日韩一区二区三区四区在线观看| 日韩一区精品字幕| 亚洲精品少妇| 日韩av一区二区三区| 日本成人在线一区| 欧美日韩亚洲一区三区| 国产精区一区二区| 精品国内亚洲2022精品成人| 国模大尺度视频一区二区| 一区二区精品伦理...| 亚洲精品.com| 午夜一级在线看亚洲| 视频在线观看一区二区三区| 中文精品电影| 麻豆久久一区| 四虎成人av| 夜夜嗨网站十八久久| 一本综合精品| 精品视频国内| 亚洲精品中文字幕乱码| 婷婷久久免费视频| 美女久久久精品| 亚洲香蕉网站| 天堂俺去俺来也www久久婷婷| 国产精品亚洲一区二区在线观看| 日韩成人免费| 亚洲一区有码| 久久久久久婷| 亚洲日本国产| 成人国产精品一区二区免费麻豆| 成人自拍av| 亚洲五月综合| 成人午夜精品| 日本特黄久久久高潮| 婷婷综合六月| 欧美在线黄色| 黄色亚洲在线| 黄色aa久久| 国产欧美在线| 国产午夜精品一区二区三区欧美| 精品视频高潮| 天堂va欧美ⅴa亚洲va一国产| 日韩在线观看| 国产精品成人一区二区网站软件| 日韩亚洲在线| 精品国产一区二区三区噜噜噜| 合欧美一区二区三区| 精品久久中文| 欧美久久一区二区三区| 日韩中文字幕区一区有砖一区 | 亚洲精品九九| 欧美另类专区| 在线一区视频观看| 卡一卡二国产精品| 日韩国产在线不卡视频| 午夜久久tv| 国产成人在线中文字幕| 国产乱码精品一区二区亚洲| 亚洲三级观看| 亚洲综合图色| 鲁大师成人一区二区三区| 欧美粗暴jizz性欧美20| 蜜桃成人精品| 91精品一区二区三区综合在线爱 | 不卡中文字幕| 免费欧美一区| 国产亚洲高清视频| 丝袜美腿一区二区三区| 久久久国产精品一区二区中文| 国产高潮在线| 日本精品影院| 99在线|亚洲一区二区| 亚洲少妇在线| 亚洲一区免费| 日韩av在线播放中文字幕| 国产精品毛片视频| 久久亚洲国产精品尤物| 丁香婷婷久久| 久久精品播放| 国产日韩专区| 欧美一区免费| 精品理论电影在线| 激情自拍一区| 亚洲欧美日韩国产一区| 欧美亚洲tv| 久久91导航| 婷婷综合国产| 天堂а√在线最新版中文在线| 日韩欧美午夜| 亚洲综合不卡| 欧美精品1区| 久久黄色影院| 青青草91视频| 久久蜜桃精品| 青青草精品视频| 精品亚洲美女网站| 日韩国产在线观看| 成人看片网站| 免费在线看一区| 精品国产亚洲一区二区三区在线| 久久精品亚洲人成影院| 日本不卡视频一二三区| 欧美aa在线观看| 69堂免费精品视频在线播放| 蜜臀国产一区| 国产乱码精品一区二区三区亚洲人| 四虎影视精品| 久久国产精品美女| 亚洲自啪免费| 亚洲www啪成人一区二区| 国产亚洲久久| 美女精品网站| 激情91久久| 国产精品videossex| 一区二区日韩免费看| 日本韩国欧美超级黄在线观看| 国产日韩在线观看视频| 亚洲欧美久久久| 九九在线精品| 欧美一区久久久| 久久精品国产999大香线蕉| 97成人超碰| 日韩福利视频导航| 国产美女一区| 最新亚洲激情| 九色精品91| 婷婷六月综合| 99综合视频| 99久久亚洲精品蜜臀| 91一区二区三区四区| 精品国产欧美| 精品久久久网| 精品一区视频| 国产精品va视频| 欧美激情99| 久久久久久久久成人| 国产一区精品福利| sm久久捆绑调教精品一区| 中国字幕a在线看韩国电影| 亚洲欧洲高清| 亚洲国产日韩欧美在线| 亚洲一区二区三区高清不卡| 天堂久久av|