Pandas最初被作为金融数据分析工具而开发出来 , 因此 , pandas为时间序列分析提供了很好的支持 。
Pandas的名称来自于面板数据(panel data)和Python数据分析(data analysis) 。panel data是经济学中关于多维数据集的一个术语 , 在Pandas中也提供了panel的数据类型 。
文章插图
数据结构:Series:一维数组 , 与Numpy中的一维array类似 。二者与Python基本的数据结构List也很相近 , 其区别是:List中的元素可以是不同的数据类型 , 而Array和Series中则只允许存储相同的数据类型 , 这样可以更有效的使用内存 , 提高运算效率 。
Time- Series:以时间为索引的Series 。
DataFrame:二维的表格型数据结构 。很多功能与R中的data.frame类似 。可以将DataFrame理解为Series的容器 。以下的内容主要以DataFrame为主 。
Panel :三维的数组 , 可以理解为DataFrame的容器 。
Pandas 有两种自己独有的基本数据结构 。读者应该注意的是 , 它固然有着两种数据结构 , 因为它依然是 Python 的一个库 , 所以 , Python 中有的数据类型在这里依然适用 , 也同样还可以使用类自己定义数据类型 。只不过 , Pandas 里面又定义了两种数据类型:Series 和 DataFrame , 它们让数据操作更简单了 。
因为pandas是python的第三方库所以使用前需要安装一下 , 直接使用pip install pandas 就会自动安装pandas以及相关组件
导入pandas模块并使用别名 , 以及导入Series模块 , 以下使用基于本次导入 。
from pandas import Series import pandas as pd
【python导入pandas具体步骤方法】
推荐阅读
- 用 Python 生成有“灵魂”的二维码
- Python结合VBA进行数据处理与报表制作
- Python语法解析
- 如何使用python将数字转换成大写金额
- Python服务器动态资源请求
- 教你在 CentOS 7 下编译安装 Python 3.7 与 Python 2.7.5 共存
- 七款“Python开源框架”的优缺点
- Python对象的比较、拷贝
- Python3.7编译常见报错之“No module named ‘_ctypes’”
- 如何批量导入电话号码到手机通讯录