【发布时间】:2011-03-27 05:37:32
【问题描述】:
我正在用 C 语言编写一个带有 curl、libxml2 和 mysql 的小型搜索引擎。基本计划是用 curl 抓取页面,用 libxml2 解析它们,然后遍历 DOM 并找到所有链接。然后遍历其中的每一个并重复,同时更新维护 URL 之间关系的 SQL 数据库。
我的问题是:如何才能最好地表示 URL 之间的关系?
【问题讨论】:
-
您重新发明搜索引擎有什么特别的原因吗?有许多强大的解决方案。