网络导航系统和网络信息检索系统均采用计算机软件程序自动抽取、排序与归并网址及网页信息,自动建立索引数据库。它把网址及相关信息的描述数据及机读字段标识符按一定方式或结构组建成索引模块,然后与查询模块在检索时实现自动匹配以检出相关信息。数据库组织是组织网络环境巨量信息资源的重要工具。
数据库组织模式的优点主要包括:有成熟的理论支持,适宜对大数据的处理,利用信息项之间的联系进行信息的重组和查询,增强了信息操作的灵活性;效率高、占用空间小、共享性好,降低了网络传输的负载。缺点主要包括:专业性强,对信息资源有规范要求,数据库自动扩充困难;这种组织模式应该解决的问题是,在数据库服务端自动利用数据模型对信息进行规范化处理。
随着网络数据结构的变化,数据库组织的技术也在不断更新。传统的关系数据库是针对结构化数据的,对海量的结构化数据的处理效率高。随着半结构化数据和非结构化数据的指数增长,能够对半结构化和非结构化信息进行处理的非结构化数据库应运而生,并成为组织海量半结构以及非结构化信息资源的重要工具。
数据库组织实现了文本单元组织方式的超越,实现了各种网络文本信息的跨文本自由链接,同时也实现了信息组织内容上的深化,从微观信息单元水平上组织信息。