首页 . 管理学 . 情报学 . 信息组织 . 信息构建 . 【信息构建流程和方法】

搜索日志分析

/search log analysis/
条目作者陈兰杰

陈兰杰

最后更新 2022-03-26
浏览 189
最后更新 2022-03-26
浏览 189
0 意见反馈 条目引用

通过记录和分析用户的行为特征,认识用户意图和兴趣来改善搜索引擎的性能,为用户提供个性化信息服务的方法。

英文名称
search log analysis
所属学科
情报学

搜索日志是搜索者在搜索过程中留下的客观痕迹,记录用户与搜索引擎交互的主要行为信息,是分析研究真实的网络用户行为的主要途径和载体。这些文件包含大量的用户访问信息,如用户的互联网协议地址所访问的统一资源定位符、访问日期和时间、访问路径等。搜索日志挖掘是将现有的数据挖掘技术应用于网络应用程序的日志分析过程中,旨在挖掘用户的行为特点、使用规律、兴趣偏好等,并用来改进网络应用的性能。

搜索日志分析是从网络的存取模式中获取有价值信息的过程,通常是对用户访问因特网时在服务器留下的访问记录进行分析,寻找其中蕴含的规律。用户在访问因特网时可产生三种网络日志:服务器端日志、浏览器端日志、代理服务器端日志。①服务器端日志。文件获得的信息可能会由于本地缓存技术而出现失真;而且有许多重要数据,诸如用户的各种浏览行为、页面驻留时间等并不能从服务器端日志中获取,因此对客户端日志文件的挖掘显得尤为重要。②浏览器端日志。可以详细记录用户搜索的完整过程,包括搜索时间、输入的查询词、点击的URL、浏览时长等。对浏览器端日志的分析,可以挖掘用户搜索特点,研究用户的搜索规律,揭示用户的搜索意图,为研究用户的探索式搜索行为提供参考。③代理服务器端日志。可以为保证其安全功能提供一定的历史记录。

搜索日志分析能够深入地研究用户搜索行为的特点,挖掘用户的搜索规律,揭示用户的搜索意图,为提高搜索引擎的信息检索质量提供参考。

  • 周晓英.基于信息理解的信息构建.北京:中国人民大学出版社,2005.
  • 赵龙,江荣安.基于Hive的海量搜索日志分析系统研究.计算机应用研究,2013,30(11):3343-3345.
  • 冯佳,张云秋.基于浏览器日志分析的探索式搜索行为研究.图书情报工作,2014,58(11):13-20,129.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!