Pandas基础使用

https://blog.csdn.net/u011746554/article/details/74911215

功能

DataFrame使用二維塊來保存數據的。

https://blog.csdn.net/u011746554/article/details/74911215

前几行后者后几行
- df.head(6)表示显示前6行数据，若head()中不带参数则会显示全部数据。
- df.tail(6)表示显示后6行数据，若tail()中不带参数则也会显示全部数据。
查看DataFrame的index，columns以及values
- a.index ; a.columns ; a.values 即可
describe()函数对于数据的快速统计汇总
- a.describe()对每一列数据进行统计，包括计数，均值，std，各个分位数等。

https://www.cnblogs.com/wodexk/p/10316793.html

loc和iloc 可以更换单行、单列、多行、多列的值
- df1.loc[0,’age’]=25 先用loc找到要更改的值，再用赋值（=）的方法实现更换值
- df1.iloc[0,2]=25 iloc：用索引位置来查找
at 、iat只能更换单个值
- df1.iat[0,2]=25 # iat 用来取某个单值,只能用数字 as index
- df1.at[0,’age’]=25 # at 用来取某个单值,只能用index和columns索引名称

https://blog.csdn.net/akenseren/article/details/80711895 https://www.cnblogs.com/wuzhiblog/p/python_new_row_or_col.html

行和，纵向求和
- df.loc[‘Cluster_sum’] = df.apply(lambda x: x.sum(), axis=0)
列和，横向求和
- df[‘Cluster_sum’] = df.apply(lambda x: x.sum(), axis=1)
- df[‘col3’] = df.apply(lambda x: x[‘col1’] + 2 * x[‘col2’], axis=1)
pd.read_csv
- the first columns index, may become unknown1 column.