array(2) {
["docs"]=>
array(10) {
[0]=>
array(10) {
["id"]=>
string(3) "428"
["text"]=>
string(77) "Visual Studio 2017 单独启动MSDN帮助(Microsoft Help Viewer)的方法"
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(8) "DonetRen"
["tagsname"]=>
string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer"
["tagsid"]=>
string(23) "[401,402,403,"300",404]"
["catesname"]=>
string(0) ""
["catesid"]=>
string(2) "[]"
["createtime"]=>
string(10) "1511400964"
["_id"]=>
string(3) "428"
}
[1]=>
array(10) {
["id"]=>
string(3) "427"
["text"]=>
string(42) "npm -v;报错 cannot find module "wrapp""
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(4) "zzty"
["tagsname"]=>
string(50) "node.js|npm|cannot find module "wrapp“|node"
["tagsid"]=>
string(19) "[398,"239",399,400]"
["catesname"]=>
string(0) ""
["catesid"]=>
string(2) "[]"
["createtime"]=>
string(10) "1511400760"
["_id"]=>
string(3) "427"
}
[2]=>
array(10) {
["id"]=>
string(3) "426"
["text"]=>
string(54) "说说css中pt、px、em、rem都扮演了什么角色"
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(12) "zhengqiaoyin"
["tagsname"]=>
string(0) ""
["tagsid"]=>
string(2) "[]"
["catesname"]=>
string(0) ""
["catesid"]=>
string(2) "[]"
["createtime"]=>
string(10) "1511400640"
["_id"]=>
string(3) "426"
}
[3]=>
array(10) {
["id"]=>
string(3) "425"
["text"]=>
string(83) "深入学习JS执行--创建执行上下文(变量对象,作用域链,this)"
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(7) "Ry-yuan"
["tagsname"]=>
string(33) "Javascript|Javascript执行过程"
["tagsid"]=>
string(13) "["169","191"]"
["catesname"]=>
string(0) ""
["catesid"]=>
string(2) "[]"
["createtime"]=>
string(10) "1511399901"
["_id"]=>
string(3) "425"
}
[4]=>
array(10) {
["id"]=>
string(3) "424"
["text"]=>
string(30) "C# 排序技术研究与对比"
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(9) "vveiliang"
["tagsname"]=>
string(0) ""
["tagsid"]=>
string(2) "[]"
["catesname"]=>
string(8) ".Net Dev"
["catesid"]=>
string(5) "[199]"
["createtime"]=>
string(10) "1511399150"
["_id"]=>
string(3) "424"
}
[5]=>
array(10) {
["id"]=>
string(3) "423"
["text"]=>
string(72) "【算法】小白的算法笔记:快速排序算法的编码和优化"
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(9) "penghuwan"
["tagsname"]=>
string(6) "算法"
["tagsid"]=>
string(7) "["344"]"
["catesname"]=>
string(0) ""
["catesid"]=>
string(2) "[]"
["createtime"]=>
string(10) "1511398109"
["_id"]=>
string(3) "423"
}
[6]=>
array(10) {
["id"]=>
string(3) "422"
["text"]=>
string(64) "JavaScript数据可视化编程学习(二)Flotr2,雷达图"
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(7) "chengxs"
["tagsname"]=>
string(28) "数据可视化|前端学习"
["tagsid"]=>
string(9) "[396,397]"
["catesname"]=>
string(18) "前端基本知识"
["catesid"]=>
string(5) "[198]"
["createtime"]=>
string(10) "1511397800"
["_id"]=>
string(3) "422"
}
[7]=>
array(10) {
["id"]=>
string(3) "421"
["text"]=>
string(36) "C#表达式目录树(Expression)"
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(4) "wwym"
["tagsname"]=>
string(0) ""
["tagsid"]=>
string(2) "[]"
["catesname"]=>
string(4) ".NET"
["catesid"]=>
string(7) "["119"]"
["createtime"]=>
string(10) "1511397474"
["_id"]=>
string(3) "421"
}
[8]=>
array(10) {
["id"]=>
string(3) "420"
["text"]=>
string(47) "数据结构 队列_队列实例:事件处理"
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(7) "idreamo"
["tagsname"]=>
string(40) "C语言|数据结构|队列|事件处理"
["tagsid"]=>
string(23) "["246","247","248",395]"
["catesname"]=>
string(12) "数据结构"
["catesid"]=>
string(7) "["133"]"
["createtime"]=>
string(10) "1511397279"
["_id"]=>
string(3) "420"
}
[9]=>
array(10) {
["id"]=>
string(3) "419"
["text"]=>
string(47) "久等了,博客园官方Android客户端发布"
["intro"]=>
string(288) "目录
ECharts
异步加载
ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
color: [
"
["username"]=>
string(3) "cmt"
["tagsname"]=>
string(0) ""
["tagsid"]=>
string(2) "[]"
["catesname"]=>
string(0) ""
["catesid"]=>
string(2) "[]"
["createtime"]=>
string(10) "1511396549"
["_id"]=>
string(3) "419"
}
}
["count"]=>
int(200)
}
222
Hadoop学习(1)——MapReduce的原理和操作 - 爱码网
MapReduce的流程图

名词解释:
Map的过程 :
- 每个输入分片会让一个map任务来处理,默认情况下,以HDFS的一个块的大小(默认为64M)为一个分片,当然我们也可以设置块的大小。map输出的结果会暂且放在一个环形内存缓冲区中(该缓冲区的大小默认为100M,由io.sort.mb属性控制),当该缓冲区快要溢出时(默认为缓冲区大小的80%,由io.sort.spill.percent属性控制),会在本地文件系统中创建一个溢出文件,将该缓冲区中的数据写入这个文件;
- 在写入磁盘之前,线程首先根据reduce任务的数目将数据划分为相同数目的分区,也就是一个reduce任务对应一个分区的数据。这样做是为了避免有些reduce任务分配到大量数据,而有些reduce任务却分到很少数据,甚至没有分到数据的尴尬局面。其实分区就是对数据进行hash的过程。然后对每个分区中的数据进行排序,如果此时设置了Combiner,将排序后的结果进行Combia操作,这样做的目的是让尽可能少的数据写入到磁盘;
-
当map任务输出最后一个记录时,可能会有很多的溢出文件,这时需要将这些文件合并。合并的过程中会不断地进行排序和combia操作,目的有两个:
(1) 尽量减少每次写入磁盘的数据量
(2) 尽量减少下一复制阶段网络传输的数据量。最后合并成了一个已分区且已排序的文件。为了减少网络传 输的数据量,这里可以将数据压缩,只要将mapred.compress.map.out设置为true就可以了
将分区中的数据拷贝给相对应的reduce任务。有人可能会问:分区中的数据怎么知道它对应的reduce是哪个呢?其实map任务一直和其父TaskTracker保持联系,而TaskTracker又一直和JobTracker保持心跳。所以JobTracker中保存了整个集群中的宏观信息。只要reduce任务向JobTracker获取对应的map输出位置就可以了。
相关文章: