Python pandas包读取excel文件教程

Python读取Excel文件教程

现在,我们将演示如何使用Python语言读取Excel文件内容。或许你会觉得这样读取Excel文件内容是非常困难的,事实并非如此,我们将逐步实现它。

1. 创建一个新项目

首先,创建一个项目,然后在项目文件夹添加一个名为”shares_baba.py”的文件

2. 创建一个Excel文件

为了演示起见,我们创建一个名为”阿里巴巴2017年股票数据.xlsx”的Excel文件,其内容如下:

可以看到,该Excel文件包含了一些图书的基本信息,我们平时也是这样使用Excel的。

3.  安装Python 库

现在需要做的就是安装可以读取Excel文件内容的Python库,当然有很多库都可以完成此项工作,这里我们选择比较常用的pandas库。使用pandas库有以下几个原因:

Pandas 是基本NumPy 的软件库,可以提供易于使用的Python 数据结构和数据分析工具

Pandas 不仅强大而且非常灵活,经常被用于数据分析

要安装Pandas库,可以使用如下命令:

pip install pandas&pip3 install pandas

为了从读取Excel电子表格中的数据,我们还需要使用xlrd库,当然pip安装即可:

pip install xlrd&pip3 install xlrd

4. 读取Excel文件

现在,我们编写一段代码来读取”阿里巴巴2017年股票数据.xlsx”文件中的内容:

import pandas as pd

fileNameStr = 'E:\*****\阿里巴巴2017年股票数据.xlsx'

# 读取excel文件里的数据

xl = pd.ExcelFile(fileNameStr)

# 获取指定工作表(Sheet)名称的数据
babaDF = xl.parse('Sheet1')

print(babaDF ) 

代码解释:

首先引入pandas模块

初始化一个变量”fileNameStr ”用于存储Excel文件名,注意示例并没有给出确切的文件路径,只使用了文件名,那么系统会默认使用当前路径,也就是将”阿里巴巴2017年股票数据.xlsx”放置于项目文件夹同”shares_baba.py”位于同一目录即可

调用pandas模板的ExcelFile方法,将”阿里巴巴2017年股票数据.xlsx”中的内容读取到变量xl,调用parse方法,获取指定工作表(Sheet)名称的数据到变量babaDF ,最后在终端将babaDF 变量的内容打印出来

一切正常的话,会在终端显示如下结果:

方法二:

import pandas as pd

babaDF = pd.read_excel('E:\*****\阿里巴巴2017年股票数据.xlsx')

print(babaDF ) 

 代码解释:

首先引入pandas模块

调用pandas模板的read_excel方法,将”阿里巴巴2017年股票数据.xlsx”中的内容读取到变量babaDF ,最后在终端将babaDF 变量的内容打印出来

一切正常的话,会在终端显示如下结果:

以上就是Python读取Excel文件的简单教程。

来源:Arvin灬w

物联沃分享整理
物联沃-IOTWORD物联网 » Python pandas包读取excel文件教程

发表评论