大数据分析的重要方法之一,能够利用计算机分析和人机交互技术,以可视化形式充分挖掘人对信息的认知能力,辅助人更为直观和高效地洞悉大数据背后的信息、知识与智慧。18世纪,随着数学和物理学等自然科学的发展、更多数据分析需求的出现,在统计学的基础上,利用多元化图形手段开始表现数据结构。经过发展,已形成了一套完善的理论体系,并发展了众多方法及其在各个领域的应用。随着数据规模的不断扩张,实际问题也越来越复杂,数据分析中的模型和结果在应对实时处理的要求、多维数据的丰富展现以及异构信息集成数据的多种处理方式等特点下,大数据可视化技术应运而生。
基本要素是表达、交互、感知。数据可视化技术关键问题在于:如何将数据表达为人眼可观的、认知可理解的图像形式;何种形式的可视化图形更有利于数据表达和人机交互;怎样帮助人们感知实际问题,理解数据和模型。
基本目标是对信息的交流和传播要清晰且有效,不仅形式上要符合审美,功能上更要做到有效表达观点,通过更直观的方式传达出信息的关键方面。实现信息的交流和传播是数据可视化的基本任务,最终目标是实现更多信息化支撑的商务决策。不是所有数据都必须可视化,对关键信息的合理表达才是商务智能中成功实现数据可视化的途径。
将结构化和非结构化数据转换成适当的可视化图表,然后将隐藏在数据中的信息直接呈现出来,有助于决策者理解数据模型,并根据结果指导下一步的数据处理工作。因此,在开始创建一个大数据可视化项目时,首先要明确可视化目的,即这个可视化形式和结果将如何帮助决策者。清晰的问题有助于避免大数据可视化过程中出现所有变量都放在一张表中,导致不相干的事物被放在一起比较,得到毫无价值的结果。在明确问题目标的基础上,需要构建有助于决策者理解的信息指标显示在最终的可视化图表中,并选择恰当的图表类型予以表现。最后,对可视化图表中的关键信息进行标注和解释,着重表现该项目问题中关心的要素,有利于用户有效获取知识和信息。大数据可视化是大数据分析与挖掘的结果,也是实现人机交互的重要途径,通过人的认知来指导计算机选择合适的算法进行更深层次的数据挖掘工作。