【发布时间】:2020-11-23 09:27:23
【问题描述】:
我正在制作搜索引擎。但我想知道,google是如何抓取stackoverflow的所有数据的。
根据我的直觉,
他们是否将所有stackoverflow 数据保存在csv 文件中?
当用户输入一些编码问题时,使用一些算法并推荐用户。
或其他任何东西,
还是别的? 谢谢你的帮助。
【问题讨论】:
标签: web-scraping recommendation-engine
我正在制作搜索引擎。但我想知道,google是如何抓取stackoverflow的所有数据的。
根据我的直觉,
他们是否将所有stackoverflow 数据保存在csv 文件中?
当用户输入一些编码问题时,使用一些算法并推荐用户。
或其他任何东西,
还是别的? 谢谢你的帮助。
【问题讨论】:
标签: web-scraping recommendation-engine
将每个数据存储在 csv 中并运行搜索可能会花费您数小时来检索结果。
Google 搜索引擎分 3 个阶段工作,即抓取、索引和服务。
在这 3 个阶段工作的这些算法使 Google 如此强大。由于经过多年的优化和学习,它们经过微调,可以准确地索引每个网页并对其进行分析,而无需像您建议的那样简单地存储所有内容。
【讨论】: