Pandas最常用的15个函数
发布时间 :
字数:596
阅读 :
Pandas是一个功能强大的数据处理库,它提供了大量的函数和方法,用于数据的读取、清洗、转换、分析和可视化。下面是Pandas中最常用的15个函数及其代码示例:
read_csv():用于读取CSV文件中的数据并创建DataFrame对象。
1 2 3 4
| import pandas as pd
df = pd.read_csv('data.csv') print(df)
|
head():用于查看DataFrame中的前几行数据,默认显示前5行。
- tail():用于查看DataFrame中的后几行数据,默认显示后5行。
- info():用于查看DataFrame的基本信息,包括列名、数据类型、非空值数量等。
- describe():用于生成DataFrame中数值列的统计摘要,包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。
- shape:用于获取DataFrame的形状,即行数和列数。
- columns:用于获取DataFrame的列名。
- fillna():用于填充DataFrame中的缺失值。
1 2
| df.fillna(0, inplace=True) print(df)
|
- groupby():用于对DataFrame进行分组操作。
1 2
| grouped = df.groupby('category') print(grouped.mean())
|
- sort_values():用于对DataFrame按照指定列进行排序。
1 2
| sorted_df = df.sort_values('column_name') print(sorted_df)
|
- drop_duplicates():用于移除DataFrame中的重复行。
1 2
| df.drop_duplicates(inplace=True) print(df)
|
- value_counts():用于计算DataFrame中某一列的唯一值计数。
1
| print(df['column_name'].value_counts())
|
- apply():用于对DataFrame的某一列或多列应用自定义函数。
1 2 3 4 5 6
| def custom_function(x): return x * 2
df['column_name'] = df['column_name'].apply(custom_function) print(df)
|
- merge():用于合并两个DataFrame对象。
1 2
| merged_df = pd.merge(df1, df2, on='key_column') print(merged_df)
|
- plot():用于绘制DataFrame中的数据图表。
1 2
| df.plot(x='column_name1', y='column_name2', kind='line') plt.show()
|
通过掌握这些常用函数,您可以更加高效地使用Pandas进行数据处理和分析。它们提供了基本的数据操作和转换功能,为您的数据工作提供了便利。
总结:本文介绍了Pandas中最常用的15个函数,并提供了相应的代码示例。这些函数涵盖了数据读取、查看、描述统计、缺失值处理、分组、排序、去重、计数、自定义函数应用、合并和可视化等常见的数据处理任务。掌握这些函数将帮助您更加熟练地使用Pandas进行数据分析和处理。
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 richffan@outlook.com