【发布时间】:2017-03-26 08:49:34
【问题描述】:
对于通过 Spark Streaming 处理的数据的长期存储(多次写入,少量读取),有什么更好的选择:Parquet、HBase 或 Cassandra?或者是其他东西?有哪些取舍?
【问题讨论】:
-
我建议使用 cassandra,因为它拥有所有数据库功能,并且在所有数据库中它的写入速度最快。
-
请检查我的答案。希望这会有所帮助!
标签: apache-spark cassandra hbase spark-streaming parquet