【问题标题】:What broad concepts are involved while designing a real time statistics system? [closed]设计实时统计系统时涉及哪些广泛的概念? [关闭]
【发布时间】:2012-09-01 20:21:34
【问题描述】:

我需要为一个在线广告项目设计一个实时统计系统。我需要存储一个 url 的展示次数、点击次数、每次展示的关键字数量等的计数器。流量可以假设为每秒大约 15000 次展示,但应该可以扩展到 > 100000 次展示第二。数据库操作显然是高度写入密集型的,需要快速的并发写入。我应该使用什么样的数据库,我将如何设计数据库架构?

我是这个领域的真正菜鸟,我不确定如何进行。我对 NoSql 数据库没有太多经验,我不确定这种规模的操作是否可以使用 MySql 或 MS SQL Server 之类的关系数据库来实现。

任何帮助将不胜感激!

谢谢。

【问题讨论】:

  • 我还没有真正尝试过实现任何东西,我只是在设计系统的过程中。我的问题是,因为我没有使用过这种规模的任何东西,所以我无法继续。我从未使用过分布式数据库等。这就是为什么我的问题更多是关于设计这样一个广泛的概念将涉及系统,以便我可以阅读它们。我不需要直接回答。

标签: database nosql real-time


【解决方案1】:

我应该使用什么样的数据库

平均使用 4 年的运行 Windows 的台式电脑,ESENT NoSQL 为capable of 70k inserts/second(用于小记录)。进行快速并发写入肯定没问题。它甚至具有“托管更新列”功能,允许您在不锁定记录的情况下更新 int32 列值,即同时更新。

数据库架构仅取决于您要收集的确切数据。

附:你的任务对我来说听起来很难。一个问题是可扩展性:您最好尽早决定是否要水平扩展,即通过添加服务器。如果是,它将对架构产生很大影响。另外,您将如何获得 量的数据? Web 服务器无法处理 100k 请求/秒。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-05-02
    • 2016-06-15
    • 2010-10-16
    • 2018-05-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多