传统信息采集途径包括:①直接采集。通过实地调查、采访、亲身经历、目睹等方法以获得第一手资料。②间接采集。通过书刊、报纸、电视、电脑、手机等获得各种信息。
随着互联网的广泛普及,网络信息采集已成为最主要的信息采集途径。网络信息采集是将非结构化信息从大量的网页中抽取出来保存到结构化的数据库中的过程。主要途径有以下几种:①信息采集系统。即以网络信息抓取引擎为基础,从不同的互联网站点上采集信息,存储为统一格式进行发布。优点是提高了信息采集即时性,节省或减少了工作量。②网络信息采集员。即通过人工方式从网上采集有价值信息。优点是确保了信息采集的准确性和相关性。③网络信息采集软件。即通过实用软件进行定向数据采集。优点是采集范围广、目的性强。
信息采集的基本原则包括以下方面:①可靠性。保证信息来源于真实对象或环境,能够反映采集对象的客观状况。②完整性。保证采集内容完整无缺,能够反映事物全貌。③实时性。保证信息即时获取,包括3层含义:一是指信息采集与信息发布同步;二是指采集行为与采集任务同步;三是指采集效率与采集目标同步。④准确性。保证采集信息与应用目标一致、无误,能够反映其应用价值。⑤易用性。保证采集信息表达形式的适用性,易于用户理解和使用。⑥计划性。保证信息采集规划的长期性,符合信息增长的客观规律。⑦预见性。保证信息采集的超前性,预测信息的动态发展。