五月综合激情婷婷六月,日韩欧美国产一区不卡,他扒开我内裤强吻我下面视频 ,无套内射无矿码免费看黄,天天躁,日日躁,狠狠躁

新聞動態(tài)

推薦一款高效的python數(shù)據框處理工具Sidetable

發(fā)布日期:2021-12-08 22:06 | 文章來源:CSDN

我們知道 Pandas 是數(shù)據科學社區(qū)中流行的 Python 包,它包含許多函數(shù)和方法來分析數(shù)據。盡管它的功能對于數(shù)據分析來說足夠有效,但定制的庫可以為 Pandas 增加更多的價值。

Sidetable 就是一個開源 Python 庫,它是一種可用于數(shù)據分析和探索的工具,作為 value_counts 和 crosstab 的功能組合使用的。在本文中,我們將更多地討論和探索其功能。歡迎收藏學習、點贊支持。

安裝

可以使用從 PyPI 安裝 Sidetable

pip install sidetable

用法

我們將使用從 Kaggle 下載的 Titanic 數(shù)據集來實現(xiàn)該庫。

sidetable 的思想是減少數(shù)據分析所需的代碼行數(shù)并加快工作流程。對于任何數(shù)據集,都需要執(zhí)行一些數(shù)據分析任務,包括可視化特征分布、頻率計數(shù)、缺失記錄計數(shù)。

我們將使用 Titanic 數(shù)據集詳細討論 Sidetable 庫的特性。

1、freq()

Pandas 提供了 value_counts() 函數(shù),用于計算特征的頻率計數(shù)。Pandas 可以計算分布計數(shù)和概率分布,但你可能希望更容易組合這些值。

分布計數(shù)和概率分布可以結合使用,但需要大量的輸入和代碼記憶。

對于 sidetable,使用 freq() 函數(shù)在一行Python代碼中實現(xiàn)它更簡單。你可以獲得累計總數(shù)、百分比和更大的靈活性。

除此之外,還可以對多個列進行分組,以可視化已分組要素的分布。

你還可以使用參數(shù) value 指定要素列,以指示分組的數(shù)據“sum”應基于特定列。

2、Counts

sidetable 中的 counts() 函數(shù)可以生成一個匯總表,該匯總表可用于確定你需要考慮為分類或數(shù)值的特征,以便進一步分析和建模。counts() 函數(shù)顯示特征的唯一值的數(shù)量以及最頻繁和最不頻繁的值。

可以使用 exclude 和 include 參數(shù)從數(shù)據集中排除或包含特定數(shù)據類型。

3、missing()

sidetable 中 missing()函數(shù)生成一個匯總表,該匯總表按每列的總缺失值的計數(shù)和百分比顯示缺失記錄。

4、subtotal()

Sidetable 中 subtotal() 函數(shù)最適合與 Pandas 中的 group by 函數(shù)一起使用。它可用于計算數(shù)據幀分組的一個或多個級別的小計。

subtotal()函數(shù)可以將其添加到分組數(shù)據的一個或多個級別。你需要首先使用groupby()函數(shù)對數(shù)據框進行分組,然后在每個級別添加一個小計。

結論

Sidetable 是一種高效且方便的工具,它結合了 Pandas 的 value_counts 和 crosstab,生成一個可解釋且易于理解的匯總表,還可用于提供分析結果。語法的簡單性使其成為用于數(shù)據分析和探索的更好的庫。

以上就是這款高效的python數(shù)據框 處理工具Sidetable的詳細內容了。

更多python數(shù)據框 處理工具Sidetable的內容請關注本站其他相關文章。

版權聲明:本站文章來源標注為YINGSOO的內容版權均為本站所有,歡迎引用、轉載,請保持原文完整并注明來源及原文鏈接。禁止復制或仿造本網站,禁止在非maisonbaluchon.cn所屬的服務器上建立鏡像,否則將依法追究法律責任。本站部分內容來源于網友推薦、互聯(lián)網收集整理而來,僅供學習參考,不代表本站立場,如有內容涉嫌侵權,請聯(lián)系alex-e#qq.com處理。

相關文章

實時開通

自選配置、實時開通

免備案

全球線路精選!

全天候客戶服務

7x24全年不間斷在線

專屬顧問服務

1對1客戶咨詢顧問

在線
客服

在線客服:7*24小時在線

客服
熱線

400-630-3752
7*24小時客服服務熱線

關注
微信

關注官方微信
頂部