2023
当前位置: 首页 >> 在线课堂 >> 2023 >> 正文
多变量数据这样作图就对了
发布时间:2023-09-23 发布者: 浏览次数:

多变量数据这样作图就对了!

我们平时作图的时候都是按照数据类型决定图的类型的。例如:当有X和Y数据,我们首先想到的是二维的折线图;当有XYZ数据时,可以在二维折线图上加图例说明(Z仅作分类)(如下图),也可以画三维柱状图(Z为数据值)。


于是,我们得到一个结论,一个n维度的图像最多承受n+1维数据

但是这样的图无法表达出同类数据间的关系(Z1,Z2,Z3的关系无法直观表达)。可能现在我们还不太明确“关系”的概念。

这里列举一组数据。

Cell mass

Cell number

h1

h2

h3

0.0001

1000

97.83%

97.53%

93.92%

0.0005

200

91.05%

88.74%

72.92%

0.001

100

84.64%

79.40%

54.03%

0.002

50

74.66%

65.63%

31.74%

0.005

20

55.29%

42.72%

10.49%

Cell mass

Cell number

h1

h2

h3

0.001

100

84.64%

79.4%

54.03%

200

91.02%

88.76%

72.95%

300

93.73%

92.22%

81.04%

0.002

50

74.66%

65.63%

31.74%

100

84.51%

79.69%

54.20%

150

88.61%

85.55%

65.81%

表中,单元胞质量和元胞数量是两个自变量,h1-h3是三个因变量,这个表主要表达,在总质量一定的情况下(Cell mass × Cell number = 定值),系统的三阶耗散功率是怎样的。

这时候不同的元胞质量之间存在一个轻重的关系,不同的元胞数量存在一个多少的关系,这样我们用普通的二维折线图无法表达出这层意思,尤其是无法表达总质量一定的情况。

第二个表主要想表达在单位质量一定的情况下,元胞数量对耗散功率的影响,表1和表2存在数据交叉

这时候就要在二维平面加入另外一个二维元素,组成多维度数据图。这是一个重要的构图思路。下面先看成品。


这是一个合二为一的图。起先我是先画了第一个表的数据的,但是左下角留白太多,这样导致的图像色彩和内容不平衡,所以需要在左下角加入其它内容,于是表2的内容便加入了进来。

我采用了这种气泡散点图的方式,主要想利用气泡的大小直观地表达出每组之间存在的“轻重”和“多少”关系,同时也不妨碍表达数据量之间的趋势关系,这就是在二维平面加入另外一个二维元素表达多维数据的方式。

下面简单说一下教程。

Matlab程序

我在画这个图的时候是直接在Visio里面画的,利用直线量的距离,不会Matlab的同学可以这么做。其实利用Matlab也不难,主要的代码就是利用bubblechart命令,x和y是控制气泡的位置,z是控制气泡的大小,考虑到气泡图要在visio中后处理,所以这里将它们的大小随意设置了。

x=1:1:15;y=[97.83 97.53 93.92 91.05 88.74 72.92 84.64 79.4 54.03 74.66 65.63 31.74 55.29 42.72 10.49];z=[1 1 1 1.1 1.1 1.1 1.2 1.2 1.2 1.3 1.3 1.3 1.4 1.4 1.4];bubblechart(x,y,z)

运行结果如下。


Visio编辑

我们将这个图片导入到visio中,取消组合。 我们只保留主要的气泡图,其余部分通过手绘重新编辑。绘制一个矩形,填充为淡灰色,调整气泡的大小和位置置矩形中,按照气泡大小分为不同的颜色,颜色均采用中性色。


在矩形周围加入刻度线和文字说明。


构图思路

这里的思路就比较重要了,希望大家能有这个意识。我们发现这这个图的左下角和右上角是比较空旷的,在我们的视觉里,颜色分配是不平衡的,给人一种不平衡和不饱满的感觉。

为了消除这种感觉,我们需要尽可能地在这两个地方填补内容,因为表2的内容与表1类似,且数据有交叉的部分,所以我觉得把表2做成一个子图。形式尽量不与图1类似,这样形式饱满。这里,我以渐变色表达出了不同的元胞数量,因为它们的质量是一样的


将图组合在一起。尽量重合元素,这样能省去额外的横纵坐标标注。


接下来我们在图的其他部分插入元胞质量和元胞数量。如下图


我们可以看到,插入这些文字以后,整个图变得丰满了。在考虑右侧圆球排列顺序的时候,有两种方式,从小球到大球的依次排列和从大球到小球的依次排列,按照小球在图中先表示的顺序,右边应该是先排列小球的,但是我发现图的右下角占的颜色比重已经很大了,如果还将大气泡放在下面,会显得不协调,可以对比下图和上图


总结

上文介绍了一种多变量数据图的做法,美观简单。同时绘图过程穿插了很多的绘图思路,包括怎样分析数据之间的关系,用什么样的颜色,什么样的大小,除了这些基本的,我们还要注意我们的标注一定是在变化的,因为我们无法保证每次的气泡分布都是这种形式。

我们要学会感知图形色彩和内容的失重不平衡,通过调配使之达到平衡、协调、美观,这也是作图最应该学的核心。

关注“博硕科研绘图”公众号,了解更多科研知识!


海南省生物材料与医疗器械工程研究中心/海南省创伤与灾难救援研究重点实验室版权所有 ©2024

地       址:海南省海口市龙华区学院路3号力行楼C栋1层

联系电话:0898-66892503 

微博

微信扫一扫

扫一扫手机访问