【发布时间】:2014-08-09 08:01:47
【问题描述】:
我想就在我的一个项目场景中使用像 Hadoop 这样的大数据平台获得一些专家意见。尽管我非常了解 MySQL 之类的数据库,但我完全是这项技术的新手。
我们正在开发一种产品,用于分析来自社交媒体的数据。因此,输入数据将是大量推文、Facebook 帖子、用户个人资料、YouTube 数据和博客数据等。除此之外,我将拥有一个 Web 应用程序来帮助我查看和分析这些数据。正如需求所表明的那样,我需要一种实时系统。因此,如果我有一条推文进来,我希望它可以方便地用于我的网络应用程序以进行处理。批处理数据处理可能不适合我的应用程序。
我的问题是:
- Hadoop 引擎是否适合我?
- 我应该根据哪些参数做出决定?
- 相对于 Hadoop,使用多集群 MySQL 引擎是否也是一个不错的选择?
- 在数据大小和速度方面是否有任何基准测试可以让 Hadoop 成为不错的选择?
【问题讨论】: