【发布时间】:2012-08-14 13:52:31
【问题描述】:
我正在开展一个项目,该项目显示来自不同站点的 RSS 提要。 我将它们保存在数据库中,我的程序每 3 小时提取一次并将它们插入到 sql 数据库中。 我希望提供者的唯一记录不显示重复的内容。
但问题是一些提供者不提供 GUID 字段,而另一些提供者提供 GUID 字段但不提供 pubdate。还有一些提供者甚至不提供 GUID 或 PubDate 只是标题和链接。
那么在 sql server 中保持 rss feed uniqe 最好的方法是什么?
我应该检查第一个 guid,然后是 pubbdate,然后是链接,然后是标题吗?比较 SQL 中的链接字段以检查唯一性是否是一种好习惯?
谢谢。
【问题讨论】: