大数据具有“4V”特征:①大量(volume),数据量巨大。②多样化(variety),数据类型多且十分复杂。③快速(velocity),处理速度要求快。④价值密度低(value),虽然数据采集量巨大,但有用信息少。
大数据涉及的技术包括:数据挖掘与关联分析技术、机器学习、模式识别、预测模型、时序分析以及可视化处理等。数据挖掘是一个知识发现的过程,即从大量的数据中自动搜索隐藏在其中的知识或特殊关系信息的过程。关联分析是从大量数据中分析各数据项之间有价值的相关关系。机器学习主要研究如何使用计算机(电脑)来模拟和实现人类学习时获取知识的过程,重构已有知识,提升自身处理问题能力,其最终目的是从数据中自动分析获取规律性知识,并用于对未知数据进行预测、判断和评估。
土木工程建设与运维中产生大量数据,包括地质数据、掘进施工数据、工程监测数据、结构病害数据等,并逐渐呈现出多源、多维、多态的大数据特征。借助于土木信息大数据技术可以更加全面地认识和监测岩土介质与土木工程结构的施工动态响应、长期服役性能变化,有效利用数据来动态优化设计、控制施工成本和运营成本,并高效管理工作人员、避免事故。