学科分类
目录
数据分析

读写Excel文件

Excel文件也是比较常见的用于存储数据的文件,它里面的数据均是以二维表格的形式显示的,可以对数据进行统计、分析等操作。Excel的文件扩展名有.xls和.xlsx两种。

Pandas中提供了对Excel文件进行读写操作的方法,分别为to_excel()方法和read_excel()函数,关于这两个方法的操作具体如下。

1. 使用to_excel()方法写入Excel文件

to_excel()方法的功能是将DataFrame对象写入到Excel工作表中,该方法的语法格式如下:

to_excel(excel_writer,sheet_name='Sheet1',na_rep='',float_format=None, columns=None, 
         header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None,
         merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None)

上述方法中常用参数表示的含义如下:

(1) excel_writer:表示读取的文件路径。

(2) sheet_name:表示工作表的名称,可以接收字符串,默认为“Sheet1”。

(3) na_rep:表示缺失数据。

(4) index:表示是否写行索引,默认为True。

为了能够让大家更好地理解,接下来,创建一个2行2列的DataFrame对象,之后将该对象写入到itcast.xlsx文件中,具体代码如下。

In [83]: import pandas as pd
         df1 = pd.DataFrame({'col1': ['传', '智'], 'col2': ['播', '客']})
         df1.to_excel(r'E:\数据分析\itcast.xlsx','python基础班')
         '写入完毕'
Out[83]: '写入完毕'

上述示例中,创建了一个2行2列的DataFrame对象,然后调用to_excel()方法将该对象写入到E盘下的itcast.xlsx文件中。

打开“E:\数据分析”目录下的itcast.xlsx文件,文件的内容如图1所示。

img

图1 打开itcast.xlsx文件

值得一提的是,如果写入的文件不存在,则系统会自动创建一个文件,反之则会将原文中的内容进行覆盖。

2. 使用read_excel()函数读取Excel文件

read_excel()函数的作用是将Excel中的数据读取出来,转换成DataFrame展示,其语法格式如下:

pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,
                  squeeze=False,dtype=None,engine=None,converters=None,true_values=None,
                  false_values=None,skiprows=None,nrows=None,na_values=None,
                  parse_dates=False,date_parser=None,thousands=None,comment=None,
                  skipfooter=0,convert_float=True, **kwds)

上述函数中常用参数表示的含义如下:

(1) io:接收string,表示路径对象。

(2) sheet_name:指定要读取的工作表,默认为0。

(3) header:用于解析DataFrame的列标签。如果传入一个整数列表,则这些行会合并为一个MultiIndex对象。

(4) names:要使用的列名称。

(5) index_col:用作行索引的列编号或者列名,如果给定一个序列,则表示有多个行索引。

接下来,通过read_excel()函数将itcast.xlsx文件中的数据全部读取出来,示例代码如下。

In [84]: import pandas as pd
         data = pd.read_excel(r'E:\数据分析\itcast.xlsx')
         data
Out[84]: 
  col1  col2
0   传   播
1   智   客
点击此处
隐藏目录