【发布时间】:2020-05-25 19:17:38
【问题描述】:
您好我正在设计一个系统,它从 API 中获取文章链接,将文章分类,然后根据用户指定的过滤参数向用户发送推荐文章链接列表。
我计划的最初方法是使用 SQL 数据库来存储排序的文章以及用户信息。然后每天我都会在文章数据库上运行一个 SQL 查询,让每个用户获取相关的文章链接。我需要弄清楚的一件事是处理重复的文章/用户,但即使假设存在独特的实例,这种方法似乎效率也很低。
我想知道是否有更好的方法来设计系统以实现规模化,即系统是否必须处理数百万篇文章和数百万用户的范围?
根据相似的文章过滤参数将用户分组是否会有所帮助(因此,如果两个或更多用户具有相同的文章数据库查询,则可能需要运行更少的查询)?还是这种努力太复杂,不值得?
【问题讨论】:
标签: sql database database-design architecture recommendation-engine