【问题标题】:Recommend cache updating strategy推荐缓存更新策略
【发布时间】:2011-01-20 07:53:33
【问题描述】:

我们的站点最近被分成了几个较小的站点,然后分布在不同的 IDC。

其中一个站点提供用户身份验证和其他与用户相关的服务,其他站点通过网络服务访问它。

在每个远程获取数据的站点上,我们都会创建一个本地缓存,这样我们就不必在每次需要用户信息时都去远程。

您会推荐什么缓存更新策略来确保数据完整性?

【问题讨论】:

  • 您是否需要实时数据完整性,或者在“发布”实际数据时可能存在一些延迟?
  • 谢谢回复 :) 是的,至少它应该接近实时,因为它是一个 SNS 应用程序,如果用户在一个站点更新她的昵称,则应该发生更改尽快在其他网站上。

标签: performance caching architecture distributed-computing distributed-caching


【解决方案1】:

由于您需要接近实时的更新策略,因此您肯定需要缓存失效通知引擎。

它有两种可能的实现模型:

1.拉 主服务器使用"resourceID=34392 not more valid in your cache" 等通知消息拉取子服务器。 此消息应在主服务器上的每次数据更新时发送。

  1. 投票 每个子服务器在将缓存项提供给用户之前就向主服务器询问缓存项的有效性。 当然,在这种情况下,主服务器应该在最后一个缓存生命周期内保持更新的对象列表,并非常快速地响应"If-object-was-updated"请求。

正如您在这两种情况下看到的那样,您的主服务器应该在每次数据更改时触发一个事件。 在第一种情况下,此事件将通过“通知总线”传输到子服务器,在第二种情况下,此事件将存储在recently-updated-objects 列表中。 所以这两个选项都需要在主服务器上进行一些代码更改。

就我而言,第二个选项通常更容易实现,但这很大程度上取决于您使用的软件堆栈。

【讨论】:

  • 我们的应用是用Python写的,不知道有没有第三方库可以用作通知引擎。
  • 不幸的是,我不熟悉 Python 技术,但我看到的最简单的实现方式是:将要重新缓存的 objectID 存储在 memcached 中;将 nginx 设置为子服务器和主服务器之间的反向代理;使 nginx 维护对象缓存并直接与列表一起工作,存储在 memcached 中。无论如何,正如我所说,这是非常具体的任务,需要更多的调查。如果您想更详细地讨论这个问题,可以联系我。
猜你喜欢
  • 1970-01-01
  • 2021-12-29
  • 2010-10-06
  • 2021-02-12
  • 2019-07-20
  • 1970-01-01
  • 2012-09-05
  • 2020-08-03
  • 2011-11-12
相关资源
最近更新 更多