python學(xué)習(xí)之panda數(shù)據(jù)分析核心支持庫
Python是一門實(shí)現(xiàn)數(shù)據(jù)可視化很好的語言,他們里面的很多庫可以很好的畫出圖形,形象明了。
今天我們就來說說:Pandas數(shù)據(jù)分析核心支持庫
初識(shí)Pandas:Pandas 是 Python 語言的一個(gè)擴(kuò)展程序庫,用于數(shù)據(jù)分析。
Pandas 是一個(gè)開放源碼、BSD 許可的庫,提供高性能、易于使用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。
Pandas 名字衍生自術(shù)語 “panel data”(面板數(shù)據(jù))和 “Python data analysis”(Python 數(shù)據(jù)分析)。
Pandas 一個(gè)強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集,基礎(chǔ)是 Numpy(提供高性能的矩陣運(yùn)算),其次數(shù)series,還有一個(gè)DataFrame,這三個(gè)比較常用。
Pandas 可以從各種文件格式比如 CSV、JSON、SQL、Microsoft Excel 導(dǎo)入數(shù)據(jù)。
Pandas 可以對各種數(shù)據(jù)進(jìn)行運(yùn)算操作,比如歸并、再成形、選擇,還有數(shù)據(jù)清洗和數(shù)據(jù)加工特征。
Pandas 廣泛應(yīng)用在學(xué)術(shù)、金融、統(tǒng)計(jì)學(xué)等各個(gè)數(shù)據(jù)分析領(lǐng)域。
Pandas的主體:Pandas 的主要數(shù)據(jù)結(jié)構(gòu)是 Series (一維數(shù)據(jù))與 DataFrame(二維數(shù)據(jù)),這兩種數(shù)據(jù)結(jié)構(gòu)足以處理金融、統(tǒng)計(jì)、社會(huì)科學(xué)、工程等領(lǐng)域里的大多數(shù)典型用例。
Series:帶標(biāo)簽的一維同構(gòu)數(shù)組,一種類似于一維數(shù)組的對象,它由一組數(shù)據(jù)(各種Numpy數(shù)據(jù)類型)以及一組與之相關(guān)的數(shù)據(jù)標(biāo)簽(即索引)組成。
DataFrame:帶標(biāo)簽,大小可變,二維異構(gòu)表格。一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類型(數(shù)值、字符串、布爾型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個(gè)索引)。
Pandas的安裝:終端輸入,如果你跟我一樣使用Anaconda中的Jupyter進(jìn)行代表編寫的話,也可以在Anaconda的終端里輸入,之后就可以直接用了,他是Python中的一個(gè)庫,使用不需要安裝什么其他軟件,擁有Python編譯器即可。
pip install pandasPandas的應(yīng)用:
1:導(dǎo)入pandas庫
import pandas as pd
2:pandas之series
Pandas Series 類似表格中等一個(gè)列(column),類似于一維數(shù)組,可以保存任何數(shù)據(jù)類型 Series 由索引(index)和列組成,函數(shù)如下:
pandas.Series( data, index, dtype, name, copy)
參數(shù)說明:
data:一組數(shù)據(jù)(ndarray 類型)。
index:數(shù)據(jù)索引標(biāo)簽,如果不指定,默認(rèn)從 0 開始。
dtype:數(shù)據(jù)類型,默認(rèn)會(huì)自己判斷。
name:設(shè)置名稱。
copy:拷貝數(shù)據(jù),默認(rèn)為 False。
Demo:
FIrst:
import pandas as pda = ['shimmer', 'zhuzhu', 'recently祝祝']myvar = pd.Series(a)print(myvar)
代碼結(jié)果:

Second:可修改索引值、

Third:使用字典創(chuàng)建, key/value 對象,類似字典來創(chuàng)建 Series

Fourth:可以通過索引值的指定來取值

3:pandas之Dataframe
DataFrame 是一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類型(數(shù)值、字符串、布爾型值)。DataFrame既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個(gè)索引)。

DataFrame 構(gòu)造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
參數(shù)說明:
data:一組數(shù)據(jù)(ndarray、series, map, lists, dict 等類型)。
index:索引值,或者可以稱為行標(biāo)簽。
columns:列標(biāo)簽,默認(rèn)為 RangeIndex (0, 1, 2, …, n) 。
dtype:數(shù)據(jù)類型。
copy:拷貝數(shù)據(jù),默認(rèn)為 False。
Demo:
First:指定列標(biāo)

Second:列分開插入,通過字典的形式創(chuàng)建

Third:使用字典(key/value),其中字典的 key 為列名:

fourth:通過loc取值,類似于列表里x,index【number】取值

Fifth:可以返回多行數(shù)據(jù),使用 [[ … ]] 格式,… 為各行的索引,以逗號隔開:

Sixth:指定索引值

Seventh:取指定索引值

本篇就到這吧,希望看完這篇文章對你有用。
總結(jié)到此這篇關(guān)于python學(xué)習(xí)之panda數(shù)據(jù)分析核心支持庫的文章就介紹到這了,更多相關(guān)python之panda模塊內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. 通過Django Admin+HttpRunner1.5.6實(shí)現(xiàn)簡易接口測試平臺(tái)2. IntelliJ IDEA安裝插件的方法步驟3. Docker 部署 Prometheus的安裝詳細(xì)教程4. idea 打包的jar運(yùn)行報(bào) "XXX中沒有主清單屬性"5. idea重置默認(rèn)配置的方法步驟6. IntelliJ IDEA設(shè)置自動(dòng)提示功能快捷鍵的方法7. idea設(shè)置代碼格式化的方法步驟8. idea打開多個(gè)窗口的操作方法9. IntelliJ IDEA調(diào)整字體大小的方法10. php過濾器使用詳解

網(wǎng)公網(wǎng)安備