如何利用python绘制学术论文图表方法

论文中图表形式多样,常用的处理工具有excel、matlab以及python等,excel自处理的方法有两个缺陷:

1.当数据较多时,容易出现excel“翻白眼”的现象;

2.需要使用subplot功能或批量处理时,使用matlab或python更为方便;

3.excel处理的图在美观程度上较论文图表标准有一定的距离。对比matlab以及python的plot功能,从图的美观角度出发,python稍占优势,下文讲简要介绍将excel中的数据提取到python中并利用python的matplotlib库制图的过程。

一.如何将excel中的数据导入python中:

此部分主要介绍如何将excel中的数据导入python中(原始数据可能在.txt或.out文件中,且数据较为繁杂,可以先利用matlab或python将数据进行处理存入excel中,包括一些简单的计算、排列等,以便于之后的绘图,或直接利用python提取.txt中数据,在此不做详细介绍),主要方法是利用python的xlrd库,流程如下:

# 导入xlrd库
import xlrd
# 读取指定excel文件(此处为excel_dir)中的数据
data=xlrd.open_workbook(excel_dir)
# 读取指定data中某sheet(此处命名为sheetname)中的数据
table=data.sheet_by_name(sheetname)
#读取table中某一列的数据
needs=table.col_values(0)

其中有几个需要说明的点:

1.excel_dir和sheetname如何定义?

excel_dir应写成字符串的格式(即’ ‘或者” “),最终应以.xls或.xlsx等excel的后缀结尾,比如读取administrator桌面上的名为result.xls的文件可写为:

excel_dir = ‘c:\users\administrator\desktop\result.xls’data=xlrd.open_workbook(excel_dir)

sheetname定义的方法同上,除此之外sheet还有通过索引顺序的读取方法:

table = data.sheets()[0] #通过索引顺序获取
table = data.sheet_by_index(0) #通过索引顺序获取

2.如何读取某单元格或者某行的数据?

流程中所示为读取某sheet中某列的数据,同理某行数据为:

table.col_values(i)

读取某单元格数据命令为:

table.cell(i,j).value

3.读取某行或某列数据时,数据的范围是什么?

举个例子:当某sheet中表格如下时,会读取4×3表格中的数据。

如何利用python绘制学术论文图表方法

即若想读取b列数据,代码应写为

table.col_values(1)

注意:python是从0开始计数的,故column number应为1,此时计入的信息为:[u”,u”,4,u”]

且注意table的维度由各个sheet决定,及若某excel表格有多个sheet,可能出现list长度不同的情况。

4.如果想取某列2-5行如何做呢?

table.col_values(i)[1:5]

5.若想取到最后一个数字,应如何编写代码?

由于各行/列的数据类型可能不同,可能会出现第一列仅4个数字,而第二列有9个数字,而最多的一列有100个数字等类似的情况,若直接用取整列的命令,会使list中掺入u”,导致下一步的绘图出错,此时可以使用如下方法:

a_col=table.col_values(i)
a=a_col[0,a_col.index(u”)]

但需注意,此命令不能对控制行数的列使用,否则也会报错,可编写其他判断语句进行鉴别是否使用该命令。

二.如何利用python进行绘图:

此处介绍利用matplotlib库进行绘图的方法,首先应导入matplotlib库:

import numpy as npimport matplotlib.pyplot as plt

绘图方法很简单,大致流程如下:

# 绘图命令,1为图号,并设置figsize
fig_drift= plt.figure(1,figsize=(12,4))
# 设置数据在x轴和y轴的坐标,以及颜色、标签等属性,此处用了两组数据
plt.plot(drift[0], story,”g-“,label=’$damped$’)
plt.plot(drift[1], story,”r-.”,label=’$undamped$’)
# 设置x轴和y轴的标签
plt.xlabel(‘drift’)
plt.ylabel(‘storey’)
# 选择显示数据组标签
plt.legend()
# 设置x轴和y轴的间隔及范围
plt.xticks((0.000,0.005,0.010,0.015))
plt.yticks(range(1,5,1))
# 设置图名
plt.title(‘minor’)

其中需要说明的几点:

1.如何绘制多图?

很简单,只需在设置了图号名之后,插入:

ax2 = plt.subplot(132)
plt.sca(ax2)

后面的命令与前述一致,值得一提的是,plt.subplot(131)指的是绘制一个含有1×3子图的图,且ax1代表的是第2张图,而plt.sca(ax2)表示选择该子图。

2.设置x轴、y轴以及其他命令如何判断是赋予哪张图的属性呢?

matplotlib会直接将该属性赋予上一plot对象。

3.如何绘制散点图?

把pl.plot(x, y)改成pl.plot(x, y, ‘o’)即可。

4.其他一些设置参数:

# 设置x轴和y轴的上下限
pl.xlim(i, j)
pl.ylim(m,n)
# 显示图
pl.show()
# 保存图,自动存为png格式
plt.savefig(dir+name.png,dpi=600)

除此之外还支持设置x轴(y轴)坐标显示,绘制饼状图、直方图等功能,在此不再一一介绍。

三.说点题外话:

曾经看过一句话:“世界上没有烂语言,只有写语言的烂人”。

每种语言各自有其优势,也有其劣势,在此不做过多评价。如何利用语言实现绘图或达到更多目标,在于我们如何选择。恰到好处地使用for或def、class等语句,能使一段代码如虎添翼,写在这里,作为给自己的提醒:遇到问题先明确方法、形成体系再进入编写,不要盲目地将看似正确的语言进行强行拼凑,返工率极高。

更多如何利用python绘制学术论文图表方法相关文章请关注php中文网!

Posted in 未分类

发表评论