Apache CarbonData 是一种新的大数据文件格式,利用先进的列式存储,索引,压缩和编码技术提高计算效率,从而加快查询速度,其查询速度比 PetaBytes 数据快一个数量级。
鉴于目前使用 Apache CarbonData 用户越来越多,其中就包含了大量的中国用户,这些中国用户可能有很多人英文不是特别好,或者没那么多时间去看英文文档。基于这些原因,我特意抽了点时间将 Apache CarbonData 的英文文档全部翻译成中文了,自己也借此机会将文档全部看了一遍。
不要犹豫,赶紧点击这个地址访问:Apache CarbonData 中文文档地址 - http://carbondata.iteblog.com。点击下面 阅读原文 即可进入体验。
本中文文档是基于目前最新发行的 Apache CarbonData 1.3.1 进行的,文档共包含 13 个页面:
快速开始
CarbonData 文件结构
数据类型
CarbonData 数据管理
安装
CarbonData 配置
Streaming 指南
CarbonData 预聚合 DataMap
CarbonData 时间序列 DataMap
常见问题解答
故障排除
常用技巧
文档详细地介绍了 Apache CarbonData 的文件结构,数据管理、配置等信息,对于刚刚接触 Apache CarbonData 的同学来说值得一读。
由于本人英文功底有限,以及对 Carbondata 有些地方不是很了解,所以翻译的文档难免会出现一些不正确或者不切当的地方,还请大家多多指正。后面我会跟踪 Apache Carbondata 的更新,也欢迎大家关注本博客(https://www.iteblog.com)。
猜你喜欢
欢迎关注本公众号:iteblog_hadoop:
0、回复 电子书 获取 本站所有可下载的电子书
3、盘点2017年晋升为Apache TLP的大数据相关项目
5、Apache Spark 黑名单(Blacklist)机制介绍
7、Apache CarbonData里程碑式版本1.3发布,多个重要新特性
8、干货 | Apache Spark 2.0 作业优化技巧
10、干货 | 如何使用功能强大的 Apache Flink SQL
11、更多大数据文章欢迎访问https://www.iteblog.com及本公众号(iteblog_hadoop)12、Flink中文文档:http://flink.iteblog.com13、Carbondata 中文文档:http://flink.iteblog.com