熟練掌握pandas函數(shù)都能幫我們在數(shù)據(jù)分析過程中節(jié)省時間。pandas還有很多讓人舒適的用法,這次就為大家介紹5個pandas函數(shù)!
大數(shù)據(jù)分析常用pandas函數(shù)有哪些由Python大數(shù)據(jù)分析編譯。
一、 explode
explode用于將一行數(shù)據(jù)展開成多行。比如說dataframe中某一行其中一個元素包含多個同類型的數(shù)據(jù),若想要展開成多行進(jìn)行分析,這時候explode就派上用場,而且只需一行代碼,非常節(jié)省時間。
用法:
參數(shù)作用:
column :str或tuple
以下表中第三行、第二列為例,展開[2,3,8]:
使用explode輕松將[2,3,8]轉(zhuǎn)換成多行,且行內(nèi)其他元素保持不變。
二、 Nunique
Nunique用于計算行或列上唯一值的數(shù)量,即去重后計數(shù)。這個函數(shù)在分類問題中非常實用,當(dāng)不知道某字段中有多少類元素時,Nunique能快速生成結(jié)果。
用法:
參數(shù)作用:
1)axis:int型,0代表行,1代表列,默認(rèn)0;
2)dropna:bool類型,默認(rèn)為True,計數(shù)中不包括NaN;
先創(chuàng)建一個df:
對year列進(jìn)行唯一值計數(shù):
輸出:10 對整個dataframe的每一個字段進(jìn)行唯一值計數(shù):
三、infer_objects
infer_objects用于將object類型列推斷為更合適的數(shù)據(jù)類型。
用法:
pandas支持多種數(shù)據(jù)類型,其中之一是object類型。object類型包括字符串和混合值(數(shù)字及非數(shù)字)。
object類型比較寬泛,如果可以確定為具體數(shù)據(jù)類型,則不建議用object。
使用infer_objects方法將object推斷為int類型:
4. memory_usage
memory_usage用于計算dataframe每一列的字節(jié)存儲大小,這對于大數(shù)據(jù)表非常有用。
用法:
參數(shù)解釋:index:指定是否返回df中索引字節(jié)大小,默認(rèn)為True,返回的第一行即是索引的內(nèi)存使用情況;deep:如果為True,則通過查詢object類型進(jìn)行系統(tǒng)級內(nèi)存消耗來深入地檢查數(shù)據(jù),并將其包括在返回值中。
首先創(chuàng)建一個df,共2列,1000000行。
返回每一列的占用字節(jié)大?。?/p>
第一行是索引index的內(nèi)存情況,其余是各列的內(nèi)存情況。
五、replace
顧名思義,replace是用來替換df中的值,賦以新的值。
用法:
參數(shù)解釋:
1)to_replace:被替換的值
2)value:替換后的值
3)inplace:是否要改變原數(shù)據(jù),F(xiàn)alse是不改變,True是改變,默認(rèn)是False
4)limit:控制填充次數(shù)
5)regex:是否使用正則,False是不使用,True是使用,默認(rèn)是False
6)method:填充方式,pad,ffill,bfill分別是向前、向前、向后填充
創(chuàng)建一個df:
將A全部替換為D:
將B替換為E,C替換為F:
填寫下面表單即可預(yù)約申請免費試聽!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費! 怕學(xué)不會?助教全程陪讀,隨時解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!
?2007-2022/ www.5wd995.cn 北京漫動者數(shù)字科技有限公司 備案號: 京ICP備12034770號 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc