python读取excel的方法实例分析

本文实例讲述了python读取excel的方法。分享给大家供大家参考。具体如下:

今天需要从一个excel文档(.xls)中导数据到数据库的某表,开始是手工一行行输的。后来想不能一直这样,就用python写了下面的代码,可以很方便应对这种场景。比如利用我封装的这些方法可以很方便地生成导入数据的sql。 当然熟悉excel编程的同学还可以直接用vba写个脚本生成插入数据的sql。

还可以将.xls文件改为.csv文件,然后通过sqlyog或者navicat等工具导入进来,但是不能细粒度控制(比如不满足某些条件的某些数据不需要导入,而用程序就能更精细地控制了;又比如重复数据不能重复导入;还有比如待导入的excel表格和数据库中的表的列不完全一致) 。

我的python版本是3.0,需要去下载xlrd 3: http://pypi.python.org/pypi/xlrd3/ 然后通过setup.py install命令安装即可

import xlrd3
”’
author: jxqlove?
本代码主要封装了几个操作excel数据的方法
”’
”’
获取行视图
根据sheet序号获取该sheet包含的所有行,返回值类似[ [‘a’, ‘b’, ‘c’], [‘1’, ‘2’, ‘3’] ]
sheetindex指示sheet的索引,0表示第一个sheet,依次类推
xlsfilepath是excel文件的相对或者绝对路径
”’
def getallrowsbysheetindex(sheetindex, xlsfilepath):
workbook = xlrd3.open_workbook(xlsfilepath)
table = workbook.sheets()[sheetindex]
rows = []
rownum = table.nrows # 总共行数
rowlist = table.row_values
for i in range(rownum):
rows.append(rowlist(i)) # 等价于rows.append(i, rowlists(i))
return rows
”’
获取某个sheet的指定序号的行
sheetindex从0开始
rowindex从0开始
”’
def getrow(sheetindex, rowindex, xlsfilepath):
rows = getallrowsbysheetindex(sheetindex, xlsfilepath)
return rows[rowindex]
”’
获取列视图
根据sheet序号获取该sheet包含的所有列,返回值类似[ [‘a’, ‘b’, ‘c’], [‘1’, ‘2’, ‘3’] ]
sheetindex指示sheet的索引,0表示第一个sheet,依次类推
xlsfilepath是excel文件的相对或者绝对路径
”’
def getallcolsbysheetindex(sheetindex, xlsfilepath):
workbook = xlrd3.open_workbook(xlsfilepath)
table = workbook.sheets()[sheetindex]
cols = []
colnum = table.ncols # 总共列数
collist = table.col_values
for i in range(colnum):
cols.append(collist(i))
return cols
”’
获取某个sheet的指定序号的列
sheetindex从0开始
colindex从0开始
”’
def getcol(sheetindex, colindex, xlsfilepath):
cols = getallcolsbysheetindex(sheetindex, xlsfilepath)
return cols[colindex]
”’
获取指定sheet的指定行列的单元格中的值
”’
def getcellvalue(sheetindex, rowindex, colindex, xlsfilepath):
workbook = xlrd3.open_workbook(xlsfilepath)
table = workbook.sheets()[sheetindex]
return table.cell(rowindex, colindex).value # 或者table.row(0)[0].value或者table.col(0)[0].value
if __name__==’__main__’:
rowsinfirstsheet = getallrowsbysheetindex(0, ‘./产品.xls’)
print(rowsinfirstsheet)
colsinfirstsheet = getallcolsbysheetindex(0, ‘./产品.xls’)
print(colsinfirstsheet)
print(getrow(0, 0, ‘./产品.xls’))
# 获取第一个sheet第一行的数据
print(getcol(0, 0, ‘./产品.xls’))
# 获取第一个sheet第一列的数据
print(getcellvalue(0, 3, 2, ‘./产品.xls’))
# 获取第一个sheet第四行第二列的单元格的值

希望本文所述对大家的python程序设计有所帮助。

Posted in 未分类

发表评论