spark是採用scala语言开发的基于内存的计算框架,作者Matei Zaharia,在未来的发展方向:

1、spark streaming:提高spark的流处理能力,使得spark更适于通过一套代码进行大数据流处理和批量计算;

2、MLlib:spark0.8增加了MLlib,下一步会在MLlib中增加很多其它的机器学习算法,使得spark更适于分布式机器学习;

3、GraphX:是基于spark的图计算框架,当前非常多社交网络分析,机器学习和图的相关算法终于完毕推荐系统的工作,终于想达到让用户仅仅通过几行简单的

                        代码可以实现图算法;

4、稳定性:与用户和开源社区合作,部署在多种应用场景下,包含ETL、SQL、机器学习、图分析等,使其更加稳定;

5、易用性:继续完好spark的python/java API,同一时候使其安装部署更加方便。

努力将spark打造成大数据时代的智能手机。

相关文章:

  • 2021-12-25
  • 2021-06-14
  • 2021-12-03
  • 2021-07-14
  • 2021-08-06
  • 2021-05-08
猜你喜欢
  • 2021-08-14
  • 2022-01-02
  • 2021-09-01
  • 2021-05-13
  • 2021-10-21
  • 2021-12-21
相关资源
相似解决方案