【发布时间】:2019-05-05 09:47:32
【问题描述】:
我们正在开发一个审计系统,让审计员可以访问上一季度处理的交易。审计员对数据进行各种分析,以找出有一些异常的无效/错误交易。
通常,这些分析需要在某些图表上显示数据以查看外层,或者有时基于多个列进行重复检测。 有时异常检测算法非常复杂,需要使用存储过程的多个处理步骤。 请注意,分析很少涉及大行的聚合。
有时,如果他们发现某些数据丢失或不正确,他们可以更改这些数据。 我们正在评估基于行(sql 和 nosql 数据库)和列存储(如数据仓库系统)。
这是数据仓库或基于行的存储(如 nosql 或某些 RDBMS)的用例吗?
简而言之,要求是: - 不定期更新 - 主要读取过去 3 个/月数据的查询 - 读取数据需要几个消息传递步骤,例如在步骤 1 中创建临时表,在步骤规则中与另一个表形成连接,删除一些行等。
谢谢
【问题讨论】:
-
“分享他/她的想法以供选择”不是主题问题。 How to Ask
-
我已将问题编辑得更具体
-
您的“要求”中没有任何内容可以让人们选择一种 DBMS 或 DBMS 实现风格而不是另一种——而且无论你如何编辑它们都不会——直到你完成大量的研究、调查和估计——然后你就不需要我们了——即使这样,如果没有实际的多重实施和测量,你也不会确定正确的答案。看我的下一条评论。这种问题太笼统了。而且也没有经过研究——您需要了解和总结您的需求、可用的 DBMS 和您的成本/收益,而不是要求我们这样做。
-
我目前的通用评论是“更好”/“最好”等:除非你定义它,否则工程中没有“更好”/“最好”之类的东西。同样不幸的是,所有合理的实际定义都需要大量的经验,以及与对细节的混乱敏感度相互作用的大量因素。进行简单的设计。当您通过测量证明您可以想到的设计和所有替代方案都存在问题时(无论当时意味着什么),然后提出一个非常具体的问题。这也应该定义“更好”/“最好”。 meta.stackexchange.com/q/204461
-
亲爱的philipxy,我只是询问了一些方向。请检查 RADO 答案。在回答这个问题时,他很到位。我们不是生活在一个理想的世界里,在那里你有时间进行“大量的研究和估计”。我们肯定会从一些基于 POC 的东西开始,并在一段时间后重新评估我们的决定。我知道这个问题并不具体,但我相信,它是一个重要的问题,对其他问题也很有用。
标签: nosql bigdata analytics rdbms data-warehouse