Python pandas包读取excel文件教程
Python读取Excel文件教程
现在,我们将演示如何使用Python语言读取Excel文件内容。或许你会觉得这样读取Excel文件内容是非常困难的,事实并非如此,我们将逐步实现它。
1. 创建一个新项目
首先,创建一个项目,然后在项目文件夹添加一个名为”shares_baba.py”的文件
2. 创建一个Excel文件
为了演示起见,我们创建一个名为”阿里巴巴2017年股票数据.xlsx”的Excel文件,其内容如下:
可以看到,该Excel文件包含了一些图书的基本信息,我们平时也是这样使用Excel的。
3. 安装Python 库
现在需要做的就是安装可以读取Excel文件内容的Python库,当然有很多库都可以完成此项工作,这里我们选择比较常用的pandas库。使用pandas库有以下几个原因:
Pandas 是基本NumPy 的软件库,可以提供易于使用的Python 数据结构和数据分析工具
Pandas 不仅强大而且非常灵活,经常被用于数据分析
要安装Pandas库,可以使用如下命令:
pip install pandas&pip3 install pandas
为了从读取Excel电子表格中的数据,我们还需要使用xlrd库,当然pip安装即可:
pip install xlrd&pip3 install xlrd
4. 读取Excel文件
现在,我们编写一段代码来读取”阿里巴巴2017年股票数据.xlsx”文件中的内容:
import pandas as pd
fileNameStr = 'E:\*****\阿里巴巴2017年股票数据.xlsx'
# 读取excel文件里的数据
xl = pd.ExcelFile(fileNameStr)
# 获取指定工作表(Sheet)名称的数据
babaDF = xl.parse('Sheet1')
print(babaDF )
代码解释:
首先引入pandas模块
初始化一个变量”fileNameStr ”用于存储Excel文件名,注意示例并没有给出确切的文件路径,只使用了文件名,那么系统会默认使用当前路径,也就是将”阿里巴巴2017年股票数据.xlsx”放置于项目文件夹同”shares_baba.py”位于同一目录即可
调用pandas模板的ExcelFile方法,将”阿里巴巴2017年股票数据.xlsx”中的内容读取到变量xl,调用parse方法,获取指定工作表(Sheet)名称的数据到变量babaDF ,最后在终端将babaDF 变量的内容打印出来
一切正常的话,会在终端显示如下结果:
方法二:
import pandas as pd
babaDF = pd.read_excel('E:\*****\阿里巴巴2017年股票数据.xlsx')
print(babaDF )
代码解释:
首先引入pandas模块
调用pandas模板的read_excel方法,将”阿里巴巴2017年股票数据.xlsx”中的内容读取到变量babaDF ,最后在终端将babaDF 变量的内容打印出来
一切正常的话,会在终端显示如下结果:
以上就是Python读取Excel文件的简单教程。
来源:Arvin灬w