【发布时间】:2015-08-25 19:17:59
【问题描述】:
让我们考虑以下问题。我们有一个包含大量数据(大数据)的系统。所以,实际上我们有一个数据库。作为第一个要求,我们希望能够快速写入和读取数据库。我们还希望有一个到数据库的网络接口(以便不同的客户端可以远程写入和读取数据库)。
但是我们想要拥有的系统应该不仅仅是一个数据库。首先,我们希望能够对数据运行不同的数据分析算法,以发现规律性、相关性、异常性等(就像以前我们非常关心性能一样)。其次,我们希望将机器学习机器绑定到数据库。这意味着我们希望对数据运行机器学习算法,以便能够学习数据上存在的“关系”,并据此预测尚未在数据库中的条目的值。
最后,我们希望有一个漂亮的基于点击的界面来可视化数据。使用户能够以漂亮的图形、图形和其他交互式可视化对象的形式看到数据。
解决上述问题的标准和广泛认可的方法是什么。必须使用哪些编程语言来处理所描述的问题?
【问题讨论】:
标签: database machine-learning bigdata data-visualization data-analysis