早在1996年,当谷歌创始人L.佩奇和S.布林还是斯坦福大学研究生时,就提出了扫描并通过网络提供人类历史上出版过的所有图书的想法。2002年谷歌团队一个小组发起了“秘密图书项目”。谷歌将来自“图书馆项目”和“图书合作伙伴项目”的书籍和杂志进行扫描,并采用光学字符识别技术将其转换为文本,建立全文索引。第一批谷歌“图书馆项目”的参与者均为美国知名图书馆,包括哈佛大学、斯坦福大学、密歇根大学、牛津大学等大学图书馆和纽约公共图书馆,后来又陆续有十几家图书馆加入。
2003年12月,谷歌推出谷歌打印试用版,包括与出版商合作的“谷歌打印出版商”子项目和与图书馆合作的“谷歌打印图书馆”子项目。2004年10月,谷歌与美国兰登书屋合作,正式启动搜索图书全文服务的谷歌图书计划。2005年11月,谷歌打印更名为谷歌图书搜索,提供图书的封面页、目录页、版权页及部分内容页。谷歌图书计划截至2015年9月,已扫描2500万种图书。
谷歌图书的检索结果以通用的谷歌搜索以及专用的谷歌图书搜索网站呈现。谷歌图书上使用的4个访问级别是:①全文浏览。即使用者可以全文阅读图书,并免费下载。②预览。即使用者可以预览图书的部分内容,可以预览的比例通常由出版商确定。③片段预览。即使用者可以预览2~3行文本。这可能是因为谷歌没有得到著作权人许可。④无法预览。即谷歌仅提供没有数字化图书的搜索结果。由于这些图书还没有扫描,仅有书名、作者、出版商和页数等基本信息。