说明
1、按索引匹配的广播机制,这里的广播机制与numpy广播机制还有很大不同。
2、便捷的数据读写操作,相比于numpy仅支持数字索引,pandas的两种数据结构均支持标签索引,包括bool索引也是支持的。
3、类比SQL的join和groupby功能,pandas可以很容易实现SQL这两个核心功能,实际上,SQL的绝大部分DQL和DML操作在pandas中都可以实现。
4、类比Excel的数据透视表功能,Excel中最为强大的数据分析工具之一是数据透视表,这在pandas中也可轻松实现。
5、自带正则表达式的字符串向量化操作,对pandas中的一列字符串进行通函数操作,而且自带正则表达式的大部分接口。
丰富的时间序列向量化处理接口。
常用的数据分析与统计功能,包括基本统计量、分组统计分析等。
集成matplotlib的常用可视化接口,无论是series还是dataframe,均支持面向对象的绘图接口。
实例
import numpy as np import pandas as pd # 创建一个符合正态分布的10个股票5天的涨跌幅数据 stock_change = np.random.normal(0, 1, (10, 5)) pd.DataFrame(stock_change) # 添加行索引 stock = ["股票{}".format(i) for i in range(10)] pd.DataFrame(stock_change, index=stock) # 添加列索引 date = pd.date_range(start="20200101", periods=5, freq="B") data = pd.DataFrame(stock_change, index=stock, columns=date) # 属性 print(data.shape) print(data.index) print(data.columns) print(data.values) data.T # 行列转置 # 方法 data.head(3) # 开头3行 data.tail(2) # 最后2行
以上就是python中pandas功能特色的介绍,希望对大家有所帮助。更多Python学习指路:
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。