Excel读写之xlrd模块

cnblogs 2024-09-30 09:39:01 阅读 98

1.1、xlrd模块介绍

xlrd:用于读取Excle数据文件将返回的数据对象放到内存中,然后查询数据文件对象的相关信息。

xlwt:用于在内存中生成新的数据文件对象,处理完成后写入到Excel数据文件中。

xlutils:主要的作用就是copy新的文件对象,在新的数据对象中完成数据处理操作。

注意:在使用 xlrd 读取 .xlsx 文件时,由于 xlrd 从版本 2.0.0 开始停止支持 .xlsx 格式,可能会遇到 xlrd.biffh.XLRDError: Excel xlsx file; not supported 的错误。

如果需要读取.xlsx文件,你可能需要安装1.2.0版本的xlrd。

1.2、xlrd操作方法汇总

1.2.1、Excel操作

1.2.1.1、打开文件

<code>import xlrd

workbook = xlrd.open_workbook('test.xls')

print(workbook) # <xlrd.book.Book object at 0x7f592100ff50>

1.2.1.2、获取所有的表名

import xlrd

workbook = xlrd.open_workbook(r'./code/excelRead/test.xls')

# 获取所有的工作表名

sheet_names = workbook.sheet_names()

print(sheet_names) # ['sdxl', 'hzgg', 'sdyxz', 'TB2018']

# 获取所有的sheet对象

Sheets = workbook.sheets()

print(Sheets) # [Sheet 0:<sdxl>, Sheet 1:<hzgg>, Sheet 2:<sdyxz>, Sheet 3:<TB2018>]

1.2.1.3、获取指定的Sheet

import xlrd

workbook = xlrd.open_workbook(r'./code/excelRead/test.xls')

# 方式一:通过索引选取

sheet1 = workbook.sheets()[0]

print(sheet1 ) # Sheet 0:<sdxl>

# 方式二:通过索引选取

sheet2 = workbook.sheet_by_index(2)

print(sheet2) # Sheet 2:<sdyxz>

# 方式三:通过表名选取,返回一个<class 'xlrd.sheet.Sheet'>对象

sheet = workbook.sheet_by_name("hzgg")

print(sheet) # Sheet 1:<hzgg>

1.2.1.4、某个sheet是否导入完毕

# 通过索引,检查某个sheet是否导入完毕

print(workbook.sheet_loaded(0)) # True

# 通过文件名,检查某个sheet是否导入完毕

print(workbook.sheet_loaded("hzgg")) # True

1.2.2、sheet对象的基本操作

1.2.2.1、sheet表行操作

1.2.2.1.1、获取表中所有的行数

import xlrd

workbook = xlrd.open_workbook(r'./code/excelRead/test.xls')

sheet2 = workbook.sheet_by_name("hzgg")

# 特别注意,这是属性而不是方法,不加括号

print(sheet2.nrows) # 17

1.2.2.1.2、返回指定行的所有单元格数值组成的列表

1.2.2.1.3、获取某行的类型及数据

1.2.2.1.4、获取某行的类型的列表

单元类型ctype:empty为0,string为1,number为2,date为3,boolean为4, error为5(左边为类型,右边为类型对应的值)

1.2.2.1.5、以切片形式获取某行的类型及数据

1.2.2.1.6、获取某行的长度

1.2.2.1.7、获取sheet的所有行生成器

1.2.2.2、sheet表列操作

1.2.2.2.1、获取有效列数

<code>import xlrd

workbook = xlrd.open_workbook(r'./code/excelRead/test.xls')

sheet2 = workbook.sheet_by_name("hzgg")

# 获取有效列数

print(sheet2.ncols) # 9

1.2.2.2.2、获取某列数据

1.2.2.2.3、获取某列类型

1.2.2.2.4、以切片方式获取某列类型及数据

1.2.2.3、单元格操作

1.2.2.4、单元格中的日期/时间操作

在使用xlrd读取excel时,我们常常会遇到日期格式的数据,如果我们不经过任何处理,那么我们得到会是如 45089.0、45171.0 这样的excel时间戳。那么我们该如何读取呢?这里介绍俩方法。

1.2.2.4.1、xlrd.xldate_as_tuple(xldate, datemode)

xlrd.xldate_as_tuple(xldate,datemode)

:param xldate: 要处理的单元格值,自然是excel中的日期数据

:param datemode: 使用哪条基准的时间戳(0代表1900-01-01为基准,1代表1904-01-01为基准);常使用1900为基准

返回值:返回一个元组,类似于(year,month,day,hour,minute,nearest_second)

但是,仅适用于date类型的excel单元格,不适用于time类型的单元格,对于time类型的单元格值,报错:XLDateAmbiguous

1.2.2.4.2、xlrd.xldate.xldate_as_datetime(xldate, datemode)

xlrd.xldate.xldate_as_datetime(xldate,datemode)

:param xldate: 要处理的单元格值,自然是excel中的日期数据

:param datemode: 使用哪条基准的时间戳(0代表1900-01-01为基准,1代表1904-01-01为基准);常使用1900为基准

返回值:datetime对象,格式 year-month-day hour:minute:second

但是,对于time类型的单元格值,转化后自动以基准补充;如基准选择1900时,时间 13:09:30 转化后为:1900-01-01 23:08:00



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。