```markdown

使用 `pd.read_excel` 读取 Excel 文件

pandas 是一个强大的 Python 数据分析库，它提供了方便的数据读取、处理和分析功能。其中，pd.read_excel 是一个非常常用的函数，用于从 Excel 文件中读取数据，并将其转换为 DataFrame 结构，以便进一步分析和处理。

安装 `pandas`

在使用 pd.read_excel 之前，首先需要安装 pandas 库。如果没有安装，可以通过以下命令安装：

bash pip install pandas

导入 `pandas`

在开始使用 read_excel 之前，需要导入 pandas 库：

python import pandas as pd

基本用法

最简单的用法是直接从 Excel 文件中读取数据，并返回一个 DataFrame。假设我们有一个名为 data.xlsx 的文件，可以通过以下方式读取：

python df = pd.read_excel('data.xlsx') print(df)

读取指定的工作表

如果 Excel 文件中包含多个工作表，可以通过 sheet_name 参数指定要读取的工作表。例如，如果文件中有一个名为 "Sales" 的工作表，可以这样读取：

python df = pd.read_excel('data.xlsx', sheet_name='Sales')

如果没有指定 sheet_name，pandas 默认会读取第一个工作表。

读取多个工作表

如果需要读取多个工作表，可以将 sheet_name 参数设置为一个包含工作表名称或索引的列表。例如，读取名为 "Sales" 和 "Inventory" 的工作表：

python df_dict = pd.read_excel('data.xlsx', sheet_name=['Sales', 'Inventory'])

df_dict 将是一个字典，其中键是工作表名称，值是相应的 DataFrame。

读取指定的行和列

如果只需要读取文件中的部分数据，可以使用 usecols 和 nrows 参数来限制读取的列和行数。

usecols：指定要读取的列，可以是列名或列的索引。
nrows：指定要读取的行数。

例如，读取前 5 行和指定的列：

python df = pd.read_excel('data.xlsx', usecols=['A', 'C', 'E'], nrows=5) print(df)

读取时跳过行

如果 Excel 文件中有一些不需要的行，可以使用 skiprows 参数跳过它们。例如，跳过文件中的前两行：

python df = pd.read_excel('data.xlsx', skiprows=2) print(df)

设置列名

如果 Excel 文件没有列名或者需要自定义列名，可以使用 header 参数或 names 参数来指定列名。

header：指定列名所在的行，默认为 0（即第一行）。
names：指定列名列表。

例如，指定列名：

python df = pd.read_excel('data.xlsx', names=['Column1', 'Column2', 'Column3']) print(df)

读取带有索引的列

如果需要将 Excel 中的某一列作为 DataFrame 的索引，可以使用 index_col 参数。例如，将第一列作为索引：

python df = pd.read_excel('data.xlsx', index_col=0) print(df)

读取 Excel 文件的特定数据类型

pd.read_excel 还支持读取特定的数据类型，可以通过 dtype 参数来强制转换某些列的数据类型。例如，将某一列强制转换为字符串类型：

python df = pd.read_excel('data.xlsx', dtype={'Column1': str}) print(df)

处理缺失值

在读取 Excel 文件时，pandas 会自动将空白单元格处理为 NaN。如果需要进行其他缺失值的处理，可以在读取时使用 na_values 参数。例如，将 "N/A" 和 "NULL" 作为缺失值：

python df = pd.read_excel('data.xlsx', na_values=['N/A', 'NULL']) print(df)

保存 Excel 文件

如果需要将修改后的 DataFrame 保存回 Excel 文件，可以使用 to_excel 方法：

python df.to_excel('output.xlsx', index=False)

总结

pd.read_excel 是 pandas 提供的一个非常强大且灵活的工具，可以让我们轻松地从 Excel 文件中读取数据。通过合理地使用参数，可以定制读取的内容，提升数据处理效率。掌握这些基本用法后，能够更加高效地进行数据分析和处理。

```

热搜
行业
快讯
专题

使用 pd.read_excel 读取 Excel 文件

安装 pandas

导入 pandas