python读取与写入csv格式文件
在数据分析中经常需要从csv格式的文件中存取数据以及将数据写书到csv文件中。将csv文件中的数据直接读取为dict类型和dataframe是非常方便也很省事的一种做法,以下代码以鸢尾花数据为例。
csv文件读取为dict
代码
# -*- coding: utf-8 -*-
import csv
with open(‘e:/iris.csv’) as csvfile:
reader = csv.dictreader(csvfile, fieldnames=none) # fieldnames默认为none,如果所读csv文件没有表头,则需要指定
list_1 = [e for e in reader] # 每行数据作为一个dict存入链表中
csvfile.close()
print list_1[0]
输出
{‘petal.length’: ‘1.4’, ‘sepal.length’: ‘5.1’, ‘petal.width’: ‘0.2’, ‘sepal.width’: ‘3.5’, ‘species’: ‘setosa’}
如果读入的每条数据需要单独处理且数据量较大,推荐逐条处理然后再放入。
list_1 = list()
for e in reader:
list_1.append(your_func(e)) # your_func为每条数据的处理函数多条类型为dict的数据写入csv文件
代码
# 数据
data = [
{‘petal.length’: ‘1.4’, ‘sepal.length’: ‘5.1’, ‘petal.width’: ‘0.2’, ‘sepal.width’: ‘3.5’, ‘species’: ‘setosa’},
{‘petal.length’: ‘1.4’, ‘sepal.length’: ‘4.9’, ‘petal.width’: ‘0.2’, ‘sepal.width’: ‘3’, ‘species’: ‘setosa’},
{‘petal.length’: ‘1.3’, ‘sepal.length’: ‘4.7’, ‘petal.width’: ‘0.2’, ‘sepal.width’: ‘3.2’, ‘species’: ‘setosa’},
{‘petal.length’: ‘1.5’, ‘sepal.length’: ‘4.6’, ‘petal.width’: ‘0.2’, ‘sepal.width’: ‘3.1’, ‘species’: ‘setosa’}
]
# 表头
header = [‘petal.length’, ‘sepal.length’, ‘petal.width’, ‘sepal.width’, ‘species’]
print len(data)
with open(‘e:/dst.csv’, ‘wb’) as dstfile: #写入方式选择wb,否则有空行
writer = csv.dictwriter(dstfile, fieldnames=header)
writer.writeheader() # 写入表头
writer.writerows(data) # 批量写入
dstfile.close()
上述代码将数据整体写入csv文件,如果数据量较多且想实时查看写入了多少数据可以使用writerows函数。
读取csv文件为dataframe
代码
# 读取csv文件为dataframe
import pandas as pd
dframe = pd.dataframe.from_csv(‘e:/iris.csv’)
也可以稍微曲折点:
import csv
import pandas as pd
with open(‘e:/iris.csv’) as csvfile:
reader = csv.dictreader(csvfile, fieldnames=none) # fieldnames默认为none,如果所读csv文件没有表头,则需要指定
list_1 = [e for e in reader] # 每行数据作为一个dict存入链表中
csvfile.close()
dfrme = pd.dataframe.from_records(list_1)dataframe写入csv文件dfrme.to_csv(‘e:/dst.csv’, index=false) # 不要每行的编号
以上就是详解python读取与写入csv格式文件方法的详细内容,更多请关注 第一php社区 其它相关文章!