数据表的处理和数据运算也是非常基础的知识。
目录
- 1. 数据表的处理
- 1.1 转置数据表的行列
- 1.2 将数据表转换为树形结构
- 1.3 数据表的拼接
- merge()函数
- concat()函数
- append()函数
- 2. 数据的运算
- 2.1 数据的统计运算
- 求和
- 求平均值、求最值
将数据表转换为树形结构就是在维持二维表格的行标签不变的情况下,把列标签也变成行标签,通俗来讲,就是为二维表格建立层次化的索引。
用stack()函数将上述数据表转换为树形结构。
数据表的拼接是指将两个或多个数据表合并为一个数据表,主要会用到pandas模块中的merge()函数、concat()函数和append()函数。
merge()函数
想合并两个表的所有数据,则需要为merge()函数添加参数how,并设置其值为'outer'。
如果两个表中相同的列标签不止一个,可以利用参数on来指定依据哪一列进行合并操作。
concat()函数
concat()函数采用的是全连接数据的方式,它可以直接将两个或多个数据表合并,即不需要两表的某些列或索引相同,也可以把数据整合到一起。
合并后的表中每一行的行标签仍然为原先两个表各自的行标签,如果想要重置行标签,可以在concat()函数中设置参数ignore_index为True。
append()函数
append()函数的用法比较简单,它可以直接将一个或多个数据表中的数据合并到其他数据表中。
和 print(pd.concat([data1,data2])) 结果一样
有数据的统计运算、数值分布情况的获取、相关系数的计算、数据的分组汇总、数据透视表的创建。
常见的统计运算包括求和、求平均值、求最值,分别要用到sum()函数、mean()函数、max()函数和min()函数。
求和
对于非数值数据,运算结果是将它们依次连接得到的一个字符串;对于数值数据,运算结果才是数据之和。
求平均值、求最值
pandas模块中的describe()函数可以按列获取数据表中所有数值数据的分布情况,包括数据的个数、均值、最值、方差、分位数等。
相关系数通常用来衡量两个或多个元素之间的相关程度,使用pandas模块中的corr()函数可以计算相关系数。
如果只想查看某一列与其他列的相关系数,可以用列标签来指定列。
pandas模块中的groupby()函数可以对数据进行分组。
数据透视表可对数据表中的数据进行快速分组和计算。pandas模块中的pivot_table()函数可以制作数据透视表。
附记:在茫茫的信息海洋中,遇到就是有缘,期待回复交流,为缘分留下痕迹……
到此这篇python 字典添加数据(python字典里面添加字典)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/kjbd-pdakx/16419.html