随着数据库在信息管理领域的广泛应用,大量数据通常以结构化、非结构化或半结构化的形式存储在数据库中。而非结构化数据通常指相对于关系数据而言没有固定的显式结构的数据,如视频、音频、图像、文档等。支持非结构化数据的数据库采用多值字段、子字段和变长字段机制进行数据项的创建和管理,广泛应用于全文检索和各种多媒体信息处理领域。也可将非结构化数据按照专业术语的要求转变成可用于查询、统计和分析的数据,并将这些语义结构最终以关系型结构的方式保存到数据库中。全结构化存储是指所有的文档信息都可以转化为结构化的数据存储,而半结构化存储是指有部分文档信息可以转化为结构化数据存储。
企业管理中通常接触的数据库信息主要属于显性的结构化数据,包括生产、业务、交易、客户信息等忠实记录了企业生产交易活动的数据,而大量隐性的非结构化数据会制约企业规模化高效预处理的收益,对各个业务需求的响应时间以及业务分析团队员工的技能提出更高要求。管理数据结构化将大量数据转换为中等大小、部分结构化或完全结构化的数据,通过引入业务逻辑与相关术语,提炼常规所需的结构,使数据对象在格式和数值范围上趋于稳定,同时对有用的信息进行筛选、分类,从而转换成有严格定义和变量类型、对组织有价值的数据。一般说来,结构是收集特定现象或领域中信息的一套系统化方法,是一套对现象准确需求的描述,管理数据的系统需要提供数据对象的信息,并在其中包含相应属性(即数据类型),对结构的特征进行定义和聚类。组织的关键业绩指标、用户、业务、产品维度,甚至一般用户行为数据等结构都有重要作用。通过管理数据结构化,有助于企业内部、企业与供应商、客户、合作伙伴和员工等数字化共享并重复利用所有形式的数据和知识资源,节约应对业务问题的时间与人力,从而更好地支持组织决策判断。