array(2) { ["docs"]=> array(10) { [0]=> array(10) { ["id"]=> string(3) "428" ["text"]=> string(77) "Visual Studio 2017 单独启动MSDN帮助(Microsoft Help Viewer)的方法" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(8) "DonetRen" ["tagsname"]=> string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer" ["tagsid"]=> string(23) "[401,402,403,"300",404]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511400964" ["_id"]=> string(3) "428" } [1]=> array(10) { ["id"]=> string(3) "427" ["text"]=> string(42) "npm -v;报错 cannot find module "wrapp"" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(4) "zzty" ["tagsname"]=> string(50) "node.js|npm|cannot find module "wrapp“|node" ["tagsid"]=> string(19) "[398,"239",399,400]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511400760" ["_id"]=> string(3) "427" } [2]=> array(10) { ["id"]=> string(3) "426" ["text"]=> string(54) "说说css中pt、px、em、rem都扮演了什么角色" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(12) "zhengqiaoyin" ["tagsname"]=> string(0) "" ["tagsid"]=> string(2) "[]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511400640" ["_id"]=> string(3) "426" } [3]=> array(10) { ["id"]=> string(3) "425" ["text"]=> string(83) "深入学习JS执行--创建执行上下文(变量对象,作用域链,this)" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(7) "Ry-yuan" ["tagsname"]=> string(33) "Javascript|Javascript执行过程" ["tagsid"]=> string(13) "["169","191"]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511399901" ["_id"]=> string(3) "425" } [4]=> array(10) { ["id"]=> string(3) "424" ["text"]=> string(30) "C# 排序技术研究与对比" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(9) "vveiliang" ["tagsname"]=> string(0) "" ["tagsid"]=> string(2) "[]" ["catesname"]=> string(8) ".Net Dev" ["catesid"]=> string(5) "[199]" ["createtime"]=> string(10) "1511399150" ["_id"]=> string(3) "424" } [5]=> array(10) { ["id"]=> string(3) "423" ["text"]=> string(72) "【算法】小白的算法笔记:快速排序算法的编码和优化" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(9) "penghuwan" ["tagsname"]=> string(6) "算法" ["tagsid"]=> string(7) "["344"]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511398109" ["_id"]=> string(3) "423" } [6]=> array(10) { ["id"]=> string(3) "422" ["text"]=> string(64) "JavaScript数据可视化编程学习(二)Flotr2,雷达图" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(7) "chengxs" ["tagsname"]=> string(28) "数据可视化|前端学习" ["tagsid"]=> string(9) "[396,397]" ["catesname"]=> string(18) "前端基本知识" ["catesid"]=> string(5) "[198]" ["createtime"]=> string(10) "1511397800" ["_id"]=> string(3) "422" } [7]=> array(10) { ["id"]=> string(3) "421" ["text"]=> string(36) "C#表达式目录树(Expression)" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(4) "wwym" ["tagsname"]=> string(0) "" ["tagsid"]=> string(2) "[]" ["catesname"]=> string(4) ".NET" ["catesid"]=> string(7) "["119"]" ["createtime"]=> string(10) "1511397474" ["_id"]=> string(3) "421" } [8]=> array(10) { ["id"]=> string(3) "420" ["text"]=> string(47) "数据结构 队列_队列实例:事件处理" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(7) "idreamo" ["tagsname"]=> string(40) "C语言|数据结构|队列|事件处理" ["tagsid"]=> string(23) "["246","247","248",395]" ["catesname"]=> string(12) "数据结构" ["catesid"]=> string(7) "["133"]" ["createtime"]=> string(10) "1511397279" ["_id"]=> string(3) "420" } [9]=> array(10) { ["id"]=> string(3) "419" ["text"]=> string(47) "久等了,博客园官方Android客户端发布" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(3) "cmt" ["tagsname"]=> string(0) "" ["tagsid"]=> string(2) "[]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511396549" ["_id"]=> string(3) "419" } } ["count"]=> int(200) } 222 sed与gawk - 爱码网

SED

sed编辑器被称作流编辑器(stream editor),与vim等交互式编辑器不同,它会在编辑器处理数据之前基于预先提供的一组规则来编辑数据流,每次从输入中读取一行,用提供的编辑器命令匹配数据、按命令中指定的方式修改流中的数据,然后将生成的数据输出到STDOUT,由于命令都是一行一行顺序处理的,sed编辑器必须一次就完成对文本的修改。

格式: sed options script file

 在命令行定义编辑器命令

默认情况下,sed编辑器会将指定的命令应用到STDIN输入流上。如下:

sed与gawk

这里使用了s命令,它会用斜线间指定的第二个文本字符串来替换第一个文本字符串,例如这里的Hello被替换成了Hi。

注意,sed对一个文件内容的改变并不影响原本内容,仅输出改变后的内容到STDOUT:

sed与gawk

如上文件,如果即需要替换int,又需要替换abc,可以加-e选项从而可以执行多个命令:

sed与gawk

注意,命令之间必须用分号分隔,并且在命令末尾和分号之间不能有空格。

再来看看下面的例子:

sed与gawk

发现第二个test没有被替换。这是s命令默认只替换第一个出现的文本字符串,如果要整行都出现的,需要加替换标记,有如下4中标记:

1. 数字:表明新文本将替换第几处模式匹配的地方

2. g:表明新文本将会替换所有已有文本出现的地方

3. p:  表明原来行的内容要打印出来

4. w file:将替换的结果写到文件中

sed与gawk

有时会遇到替换路径,因为需要加转移字符的斜杠,看起来很别扭,可以加感叹号来作为字符串分隔符:

sed与gawk

在文件中获取编辑器命令

如果命令比较多,可以把它放在文件,然后通过-f选型来指定文件:

sed与gawk

指定行处理文本

默认情况,sed编辑器中使用的命令会作用于文本数据所有行,如果需要作用于指定行,需要指定行范围。

示例一,只替换一行指定行的数据:

sed与gawk

示例二, 替换行范围内的文本数据:

sed与gawk

示例三, 替换行到文件末尾的文本数据:

sed与gawk

示例四, 单行数据执行多条命令:

sed与gawk

示例五,删除行:

sed与gawk

插入和追加文本

插入(insert): 命令i会在指定行前增加一个新行

追加(append): 命令a会在指定行后增加一个新行

不能在单个命令行上使用这两条命令,必须指定是要将行插入还是附加到另一行,格式:

sed '[address]command new line'

sed与gawk

sed与gawk

插入多行数据,需要在每行数据后用'\'分隔:

sed与gawk

修改数据行

可以修改整行数据,与替换稍微不一样。

sed与gawk

转换命令

转换(transform, y)可以处理单个字符的sed编辑器命令,它是一个全局命令,不需要指定行,它会处理所有文本行数据。

注意:转换的输入输出字符长度必须一致,否则会产生错误。

sed与gawk

可以看到,输入输出是对应的,3换成了9,4换成了0。

输出信息

输出原来的和替换后的文本信息:

sed与gawk

这里加了-n选项,屏蔽了其他行的输出,只打印包含匹配文本模式的行,这里首先用p打印原来的行(这里是找到包含数字3的行),然后's/test/line/p'打印替换后的行信息。

从文件读取信息

sed与gawk

这里读取234.txt文本的信息,插入到123.txt文件的末尾。

例如,现在只想插入到There一行:

sed与gawk

第一条命令是匹配There插入,因此找到第二行插入,第二条命令是同时匹配There和第三行,因为第三行没有There,所有没有插入。

GAWK

gawk主要用处在于程序脚本,使得我们可以编写脚本来读取文本行的数据,然后处理并显示数据,创建任何类型的输出报告,它的程序脚本使用一对花括号来定义,而且由于gawk命令行假定脚本是单个文本字符串,因此必须将脚本放到单引号中。

格式: gawk options program file

从命令行读取程序脚本

sed与gawk

这里输出df -h命令输出的第一列的数据内容,第一列代表第一列,以此类推,然后$0代表整个文本行,这里能获取到第一列,是因为df -h命令输出内容默认以空格或制表符分隔,而gawk处理文本时默认也是这样,如果不是空格,需要加-F选项指定分隔符,比如/etc/passwd是以冒号(:)来分隔的:

sed与gawk

(如果要中止gawk程序,可以使用组合键Ctrl+D来发送EOF字符。)

类似sed,如果在gawk执行多个命令,使用分号分隔多个命令即可:

sed与gawk

文件中读取程序

类似sed,gawk也可以把程序脚本放到文件,然后通过-f选项来引用:

sed与gawk

注意,这里引用变量r_text与shell需要加$符号才能引用变量不同,这里直接应用即可。

在处理数据前运行脚本

BEGIN关键字可以强制gawk在读取数据前执行BEGIN关键字后指定的程序脚本:

sed与gawk

在处理数据后运行脚本

END关键字会在gawk读取完数据后执行指定脚本。

sed与gawk


以上是sed和gawk的基本用法,当这两个命令结合正则表达式后,就可以为提取和处理文本文件中数据创建定制过滤器的关键,从而更加功能强大。

相关文章: