1.分组聚合函数(groupby)
类似SQL的groupby那样的数据透视功能。可以使用pandas库的groupby函数来实现分组聚合操作。
举例:
有一个A表,分别有甲项目和乙项目,甲项目连续两年的销售为50万元和54万元,乙项目连续两年的销售额为74万元和56万元。
现在求甲项目和乙项目的各自销售额之和,具体如下:
代码:
1 | import pandas as pd |
运行结果:
销售额 | 项目名称 |
---|---|
乙项目 | 130 |
甲项目 | 104 |
2.时间转换函数(to_datetime)
可以使用pandas库的to_datetime函数来实现时间转换操作。
举例:将分秒的时间转换为日期
Date | Sales |
---|---|
2020-01-01 10:30:00 | 1000 |
2020-01-02 15:20:00 | 1500 |
2020-01-03 18:40:00 | 2000 |
代码:
1 | import pandas as pd |
运行结果:
Date | Sales |
---|---|
2020-01-01 | 1000 |
2020-01-02 | 1500 |
2020-01-03 | 2000 |
3.分列函数(str.split)
在Python中,可以使用pandas库的str.split函数来实现分列操作。
举例:将地址列按照逗号分隔符进行拆分,并将拆分后的结果存储到城市列和省份列中。
数据示例:
Customer | Address |
---|---|
A | Beijing,China |
B | Shanghai,China |
C | New York,United States |
代码:
1 | import pandas as pd |
运行结果:
City | Country/Region |
---|---|
0 | Beijing/China |
1 | Shanghai/China |
2 | New York/United States |
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 richffan@outlook.com