如何使用 Pandas 将 excel 文件导入 Python?

原文:https://www . geesforgeks . org/如何使用 pandas 将 excel 文件导入 python/

以 CSV 格式获取数据集并不总是可能的。因此, 【熊猫】 为我们提供了将其他格式的数据集转换为数据框的功能。excel 文件有一个“”。“xlsx”格式。

在开始之前,我们需要安装几个库。

pip install pandas
pip install xlrd

要使用 Pandas 将 Excel 文件导入 Python,我们必须使用Pandas . read _ Excel()函数。

语法: pandas.read_excel( iosheet_name=0header=0name = None,…。)

返回:数据帧或数据帧字典。

假设 Excel 文件如下所示:

Excel file

现在,我们可以深入研究代码。

例 1: 读取 Excel 文件。

Python 3

import pandas as pd

df = pd.read_excel("sample.xlsx")
print(df)

输出:

dataframe

示例 2: 要选择特定的列,我们可以传递一个参数“ index_col ”。

Python 3

import pandas as pd

# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
                   index_col = 0)  

print(df)

输出:

select a particular column

示例 3: 如果您不喜欢列的初始标题,可以使用参数“标题”将其更改为索引。

Python 3

import pandas as pd

df = pd.read_excel('sample.xlsx',
                   header = None)
print(df)

输出:

dataframe without header

示例 4: 如果要更改特定列的数据类型,可以使用参数“ dtype ”来完成。

Python 3

import pandas as pd

df = pd.read_excel('sample.xlsx', 
                   dtype = {"Products": str,
                            "Price":float})
print(df)

输出:

data type change

示例 5: 如果您有未知值,那么您可以使用参数“ na_values 来处理它。它会将上述未知值转换为“ NaN

Python 3

import pandas as pd
df = pd.read_excel('sample.xlsx', 
                   na_values =['item1', 
                               'item2'])
print(df)

输出:

Dataframe with NaN value