【发布时间】:2017-11-29 15:29:46
【问题描述】:
我们正在使用 java rest 服务从头开始构建一个新的电子商务门户,并且我们计划使用 MySQL(目前,未来是 Oracle)。我们也在使用 ElasticSearch。我们正在将整个门户构建为微服务。我的问题是,我是否需要从一开始就处理分析(如 hadoop 和 HDFS 集成)?
【问题讨论】:
标签: java rest hadoop e-commerce microservices
我们正在使用 java rest 服务从头开始构建一个新的电子商务门户,并且我们计划使用 MySQL(目前,未来是 Oracle)。我们也在使用 ElasticSearch。我们正在将整个门户构建为微服务。我的问题是,我是否需要从一开始就处理分析(如 hadoop 和 HDFS 集成)?
【问题讨论】:
标签: java rest hadoop e-commerce microservices
单一关系数据库运行良好,但扩展性较差。特别是对于大型 Web 服务。
您需要测量数据摄取量/大小,以确定是否需要 Hadoop(更具体地说是 HDFS)在 Elasticsearch 之上进行批量分析。但很可能不会。您可以使用独立的 Apache Spark 集群直接针对 Elasticseach 运行。
不过,您也可以use Kafka as a message bus between your JDBC compatible database as well as loading an Elasticsearch index。 Spark Streaming 与 Kafka 配合得很好。
如果您想将 Hadoop 添加到组合中,您可以从 Kafka 中提取相同的数据来填充 HDFS 目录。
有很多博客都在谈论通过 Kafka 进行微服务通信
【讨论】: