网络数据是最常用的数据类型之一。社交网络上的好友关系、计算机的网络连接关系以及代码中函数调用关系等都组成了网络。网络数据通常用图(graph)来表示。图由一个顶点集合
和边集
组成。其中每条边
连接了图中的两个顶点(
)。利用网络可视化技术对大量神经元和神经元之间的连边进行可视化,帮助机器学习专家理解复杂的深度神经网络,对训练出现问题的神经网络进行调试,从而对网络的可能优化方向提供思路。
现有网络可视化方法可以按照是否考虑网络随时间的变化分为静态和动态两类。
静态网络可视化方法主要包括节点-链接图(node-link diagram)和邻接矩阵(adjacency matrix)。在节点-链接图(图1)中,每个节点表示图中的一个顶点,每条边表示相应顶点之间存在关联。为了生成美观、实用的节点-链接图,需要对图进行合理布局。目前,节点-链接图的常用布局方法是力导向法(force-directed layout)。力导向法借用弹簧模型进行布局。它在两个点之间加入虚拟的弹簧,弹簧的弹力保证过近的点会被弹开,过远的点会被拉近。整个过程不断迭代,从而最小化整个弹簧系统的能量函数,完成布局。邻接矩阵(图2)将个节点之间的连接关系表示为
的矩阵
。矩阵中元素
表示了节点
和
之间的关系。一种常见的表达方式是
为1代表节点之间存在连边,
为0代表节点之间不存在连边。要突显网络中存在的模式(例如节点的聚类效果),需要对邻接矩阵中的节点进行合理排序。给定一个排序方法的能量函数,要最大化或者最小化这个能量函数是一个NP问题,因此实际应用中往往采用启发的方法找到近似解。与节点-链接图相比,邻接矩阵在图接近于完全图的情况时,也可以保证没有视觉混乱。但是当边的数目比较少时,节点-链接图的空间利用率更高,且能够更好地展示网络中心和关系的传递性。为了综合这两个方法的优点,研究人员提出了混合式的布局方法NodeTrix。此方法首先利用连接关系对节点进行聚类。因为同一类的节点之间关系紧密,这些节点之间的关系用邻接矩阵进行展示,而不同类节点之间关系则用节点-链接图的形式展示。
动态网络可视化方法根据时间的表示方式分为两类:基于动画的方法和基于时间轴的方法。基于动画的方法利用动画的方式平滑地将上一个时间点的图转化成下一个时间点的图,从而保证用户的心像地图(mental map)不会发生突变。基于时间轴的方法将时间维度映射到空间上的一个坐标轴,将不同时间点的图显示在该时间点对应的空间位置。这两类方法适合完成的任务不同,没有绝对的优劣之分。当不需要对多个时间点的图进行频繁对比时,动画的方式更加直观,且更容易吸引人的注意。如果需要对比不相邻的时间点的图,基于时间轴的方法则更加快速、有效。