【发布时间】:2021-02-22 06:32:11
【问题描述】:
我正在对我的应用程序的数据进行建模以使用 DynamoDB。 我的数据模型相当简单:
- 我有用户和项目
- 每个用户可以有多个项目
用户可以是数百万,每个用户的项目可以是数千。
我的访问模式也比较简单:
- 通过 id 获取用户
- 获取按名称或创建日期排序的分页用户列表
- 通过 id 获取项目
- 按日期排序的用户获取项目
我的这个数据模型的单表如下:
我可以使用表 PK/SK 和 GSI 轻松实现我的所有访问模式,但我对第 2 个问题有疑问。 根据文档和最佳实践,获取分页用户的排序列表:
- 我无法使用扫描,因为不支持排序
- 我不应该使用带有 PK 的 GSI,它会将我的所有用户放在同一个分区中(例如 GSI PK = "sorted_user", SK = "name"),因为这会使我的单个分区变热并且无法扩展
- 我无法创建“组织”类型的新实体,将所有用户放入其中,并通过 PK =“org” 进行查询,因为这会出现与上述相同的热分区问题
我可以存储用户并使用write sharding,但我真的不知道如何实际查询分页排序的用户,因为存储桶 PK 可能需要是随机的,我必须查询所有存储桶才能将所有用户排序在一起。我还认为桶 PK 可以是字母,但这也可能会产生热分区,因为字母“A”可能会受到很大的打击。
我的应用程序模型相当简单。但是,在阅读了所有文档和最佳实践并观看了许多在线视频之后,我发现自己陷入了 DynamoDB 似乎无法很好支持的最基本用例中。我想对于几乎任何现代应用程序来说,必须在某种管理面板中获取用户列表一定很常见。
在这种情况下其他人会怎么做?我真的很想使用 DynamoDB 来获得它带来的所有好处,尤其是在成本方面。
编辑
因为有人问我,在我的应用程序中,2) 的主要用例是这样的:https://stackoverflow.com/users?tab=Reputation&filter=all。 至于规模,它需要很好地扩展,至少到几万。
【问题讨论】:
-
我不确定 2) 的用例,因为具有数百万用户的应用程序的管理面板通过这些分页似乎不切实际:-) - 也许还有另一种表达方式您的需求可以更轻松地实现,同时仍然足以满足您的需求。
-
我们需要两个 GSI,一个 by_name PK 为 'name' ,第二个 by_date PK 为 created_date 并使用
query操作进行分页 -
@Maurice,它不一定是管理面板,在我的应用程序中,主要用例是这样的:stackoverflow.com/users?tab=Reputation&filter=all。至于规模,它需要很好地扩展,至少到数万。
-
@BaluVyamajala,这将如何满足访问模式 2)?要使用您建议的 GSI,应用程序需要知道用户的名称和创建日期(作为 PK)并由他们查询。你说的是SK吗?在这种情况下,你会使用哪个 PK?
标签: amazon-web-services sorting database-design amazon-dynamodb