论文中图表形式多样,常用的处理工具有excel、matlab以及python等,excel自处理的方法有两个缺陷:
1.当数据较多时,容易出现excel“翻白眼”的现象;
2.需要使用subplot功能或批量处理时,使用matlab或python更为方便;
3.excel处理的图在美观程度上较论文图表标准有一定的距离。对比matlab以及python的plot功能,从图的美观角度出发,python稍占优势,下文讲简要介绍将excel中的数据提取到python中并利用python的matplotlib库制图的过程。
一.如何将excel中的数据导入python中:
此部分主要介绍如何将excel中的数据导入python中(原始数据可能在.txt或.out文件中,且数据较为繁杂,可以先利用matlab或python将数据进行处理存入excel中,包括一些简单的计算、排列等,以便于之后的绘图,或直接利用python提取.txt中数据,在此不做详细介绍),主要方法是利用python的xlrd库,流程如下:
# 导入xlrd库
import xlrd
# 读取指定excel文件(此处为excel_dir)中的数据
data=xlrd.open_workbook(excel_dir)
# 读取指定data中某sheet(此处命名为sheetname)中的数据
table=data.sheet_by_name(sheetname)
#读取table中某一列的数据
needs=table.col_values(0)
其中有几个需要说明的点:
1.excel_dir和sheetname如何定义?
excel_dir应写成字符串的格式(即’ ‘或者” “),最终应以.xls或.xlsx等excel的后缀结尾,比如读取administrator桌面上的名为result.xls的文件可写为:
excel_dir = ‘c:\users\administrator\desktop\result.xls’data=xlrd.open_workbook(excel_dir)
sheetname定义的方法同上,除此之外sheet还有通过索引顺序的读取方法:
table = data.sheets()[0] #通过索引顺序获取
table = data.sheet_by_index(0) #通过索引顺序获取
2.如何读取某单元格或者某行的数据?
流程中所示为读取某sheet中某列的数据,同理某行数据为:
table.col_values(i)
读取某单元格数据命令为:
table.cell(i,j).value
3.读取某行或某列数据时,数据的范围是什么?
举个例子:当某sheet中表格如下时,会读取4×3表格中的数据。
即若想读取b列数据,代码应写为
table.col_values(1)
注意:python是从0开始计数的,故column number应为1,此时计入的信息为:[u”,u”,4,u”]
且注意table的维度由各个sheet决定,及若某excel表格有多个sheet,可能出现list长度不同的情况。
4.如果想取某列2-5行如何做呢?
table.col_values(i)[1:5]
5.若想取到最后一个数字,应如何编写代码?
由于各行/列的数据类型可能不同,可能会出现第一列仅4个数字,而第二列有9个数字,而最多的一列有100个数字等类似的情况,若直接用取整列的命令,会使list中掺入u”,导致下一步的绘图出错,此时可以使用如下方法:
a_col=table.col_values(i)
a=a_col[0,a_col.index(u”)]
但需注意,此命令不能对控制行数的列使用,否则也会报错,可编写其他判断语句进行鉴别是否使用该命令。
二.如何利用python进行绘图:
此处介绍利用matplotlib库进行绘图的方法,首先应导入matplotlib库:
import numpy as npimport matplotlib.pyplot as plt
绘图方法很简单,大致流程如下:
# 绘图命令,1为图号,并设置figsize
fig_drift= plt.figure(1,figsize=(12,4))
# 设置数据在x轴和y轴的坐标,以及颜色、标签等属性,此处用了两组数据
plt.plot(drift[0], story,”g-“,label=’$damped$’)
plt.plot(drift[1], story,”r-.”,label=’$undamped$’)
# 设置x轴和y轴的标签
plt.xlabel(‘drift’)
plt.ylabel(‘storey’)
# 选择显示数据组标签
plt.legend()
# 设置x轴和y轴的间隔及范围
plt.xticks((0.000,0.005,0.010,0.015))
plt.yticks(range(1,5,1))
# 设置图名
plt.title(‘minor’)
其中需要说明的几点:
1.如何绘制多图?
很简单,只需在设置了图号名之后,插入:
ax2 = plt.subplot(132)
plt.sca(ax2)
后面的命令与前述一致,值得一提的是,plt.subplot(131)指的是绘制一个含有1×3子图的图,且ax1代表的是第2张图,而plt.sca(ax2)表示选择该子图。
2.设置x轴、y轴以及其他命令如何判断是赋予哪张图的属性呢?
matplotlib会直接将该属性赋予上一plot对象。
3.如何绘制散点图?
把pl.plot(x, y)改成pl.plot(x, y, ‘o’)即可。
4.其他一些设置参数:
# 设置x轴和y轴的上下限
pl.xlim(i, j)
pl.ylim(m,n)
# 显示图
pl.show()
# 保存图,自动存为png格式
plt.savefig(dir+name.png,dpi=600)
除此之外还支持设置x轴(y轴)坐标显示,绘制饼状图、直方图等功能,在此不再一一介绍。
三.说点题外话:
曾经看过一句话:“世界上没有烂语言,只有写语言的烂人”。
每种语言各自有其优势,也有其劣势,在此不做过多评价。如何利用语言实现绘图或达到更多目标,在于我们如何选择。恰到好处地使用for或def、class等语句,能使一段代码如虎添翼,写在这里,作为给自己的提醒:遇到问题先明确方法、形成体系再进入编写,不要盲目地将看似正确的语言进行强行拼凑,返工率极高。
更多如何利用python绘制学术论文图表方法相关文章请关注php中文网!