[转帖]Linux文本处理三剑客sed详解(正则匹配、命令示例)

linux,文本处理,三剑客,sed,详解,正则,匹配,命令,示例 · 浏览次数 : 0

小编点评

#生成内容时需要带简单的排版 #1、定义变量 sed -r '3a$var' passwd.txt #2、多重编辑 sed -r '1,5s/(.*)/\\2/' passwd.txt #3、删除注释行 sed -r '/^#$/d' /etc/vsftpd/vsftpd.conf #4、将开头为SELINUX的行整个换成SELINUX=disbaled sed -r '1,5s/(.*)/\\t#\\1/;3s/(.*)/#\\1/' passwd.txt #5、将以空格制表符#出现0到多次替换成# sed -r '1,3s/^[ \\t]*#*/#/' passwd.txt #6、将以空格制表符#出现0到多次替换成# sed -r '1,3s/^[ \\t#]*/#/' passwd.txt #7、将以空格制表符#出现0到多次替换成# sed -r '1,3s/^[ \\t#]*/#/' passwd.txt

正文

https://developer.aliyun.com/article/885609?spm=a2c6h.24874632.expert-profile.312.7c46cfe9h5DxWK

 

简介: sed读一行放到模式空间进行处理 sed是一种在线的、非交互式的编辑器,它一次处理一行内容,处理时,把当前处理的行存储在临时缓冲区中,成为模式空间,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾,文件内容并没有更改,除非使用重定向存储输出。 sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序

文本处理:sed

1.sed工作流程

sed读一行放到模式空间进行处理

 

sed是一种在线的、非交互式的编辑器,它一次处理一行内容,处理时,把当前处理的行存储在临时缓冲区中,成为模式空间,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾,文件内容并没有更改,除非使用重定向存储输出。

 

sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序

 

sed -ri.bak

 

sed -ric --follow-symlinks

 

2.命令格式

sed [options] ‘command’ file(s) //选项后面跟命令

 

sed [options] -f scriptfile file(s) //选项后面跟sed命令的脚本

 

注意:

 

sed中空格也算一个字符

 

sed和grep不一样,不管是否找到指定的模式,它的退出转态都是0,只有当命令存在语法错误时,sed的退出状态码才是非0

 

sed命令在使用命令时,不加数字的话默认对每一行都进行模式匹配

 

例如 sed -r ‘4p’ //p命令表示打印,4p就是对第四行进行打印,其他行不会执行这个命令,如果是sed -r 'p’则是对每一行都执行此命令

 

3.支持正则表达式

与grep一样,sed在文件中查找模式时也可以使用正则表达式(RE)和各种元字符。正则表达式是括在斜杠间的面膜是,用于查找和替换,以下是sed支持的元字符。

使用基本元字符集^,$,.,*,[],[^],\<\>,\(\),\{\}
使用扩展元字符集?,+,{},|,()=

使用扩展元字符的方式:

\+
sed -r

4.sed基本用法

sed -r 'p' passwd.txt       //打印所有行,会出现之前行的两倍,因为是原理就是先将一行放到屏幕然后在执行p命令,p命令是打印所以又会显示一行
sed -rn 'p' passwd.txt        //使用-n选项,可以忽略执行命令之前的行
sed -rn '/root/p' passwd.txt    //命令中的/root/p是指找到root的行进行打印
sed -r 's/root/jxl/' passwd.txt   //找到root的行替换成jxl,仅限第一个找到的
sed -r 's/root/jxl/g' passwd.txt    //全局替换
sed -r '1s/root/jxl/g' passwd.txt   //在第一行查找并替换
sed -r '1s/Root/jxl/gi' passwd.txt    //i表示忽略大小写
sed -r '/root/d/' passwd.txt  //找到root的行然后删除
sed -r '\#root#d' passwd.txt  //斜线可以换成任意符号一般想换建议使用#号

如果文件中需要修改的内容带有"/"斜线,可以使用下面的方法进行修改
sed -r 's/\/etc\/abc/\/var\/lib/' passwd.txt    //将/etc/abc改成/var/lib,主要除了s///其他的斜线要用反斜线转义
sed -r 's#/etc/abc#var/lib#' passwd.txt     //可以将斜线换成#,也可以是@,在这里的其他符号可以不用转义因为后面有了/

5.sed扩展

地址(定址)

地址用于决定对那些行进行编辑,地址形式可以是数组、正则表达式或二者的组合,如果没有设定地址,sed将处理输入文件中的所有行

sed -r 'd' passwd.txt   //删除所有行
sed -r '3d' passwd.txt    //删除第三行
sed -r '1,3d' passwd.txt  //删除一到三行
sed -r '/^root/d' passwd.txt  //删除以root开头的行
sed -r '/bash$/d' passwd.txt    //删除以bash结尾的行
sed -r '/\<root\>/d' passwd.txt   //删除是root这个单词的行
sed -r '/root/,5d' passwd.txt   //从root行开始删除到第5行
sed -r '/root/,+5d' passwd.txt    //删除root行后在删除5行
sed -r 'root/!d' passwd.txt   //!取反,只保留root行

sed -r '1~2d' passwd.txt    //删除奇数行
sed -r '0~2d' paswd.txt   //删除偶数行
sed -r '1~3d' passwd.txt    //删掉一行后留两行在删一行留两行

6.sed命令

sed命令告诉sed对指定行进行何种操作,包括打印、删除、修改等

 

a 在当前行后添加一行或多行

 

c 用新文本修改替换当前行中的文本

 

d 删除行

 

i 在当前行之前插入文本

 

l 列出非打印字符 多打印一行,并在后面加上$

 

p 打印行

 

n 获取下一行的内容,常用于要处理的行没有明显特征,可以借助上一行在使用n对下一行进行处理

 

q 结束或退出sed

 

! 对所选航意外的所有行应用命令

 

S 用一个字符串替换另一个

 

s 替换标志

 

g 全局替换

 

i 忽略大小写

 

r 从文件中读

 

w 将行写入文件

 

y 将字符转换为另一字符

 

h 把模式空间里的内容复制到暂存缓冲区(覆盖)

 

H 把模式空间里的内容追加到暂存缓冲区

 

G 取出暂存缓冲区的内容,将其复制到模式空间,追加在原有内容后面

 

g 取出暂存空间的内容,将其复制到模式空间中,原来的内容会被覆盖

 

x 交换暂存缓冲区与模式空间的内容

 

选项

 

-e 允许多项编辑,使用多个命令

 

-f 指定sed脚本文件名

 

-n 取消默认的输出

 

-i inplace,就地编辑也就是在文件中直接修改

 

-r 支持扩展元字符

 

7.命令示例

删除命令:d

如果想要多个命令同时使用就在{}中以分号分隔

sed -r '3d' passwd.txt    //删除第三行
sed -r '3{d;}' passwd.txt   //花括号中的d;其实表示可以使用多个命令选项,例如sed -r '3{p;d;}' passwd.txt
sed -r '3p;3d' passwd.txt   //多个命令使用,等同于3{p;d}
sed -r '3{d}' passwd.txt    //效果与3d一样
sed -r '3,$d' passwd.txt    //从第三行开始一直删除到最后一行
sed -r '$d' passwd.txt      //删除最后一行
sed -r '/norrth/d' datafile   //删除匹配north的行

替换命令:s

sed -r 's/west/north/g' datafile      //将west替换成north
sed -r 's/^west/north/' datafile      //将west开头的行换成north
sed -r 's/[0-9][0-9]$/&.5/' datafile    //&表示在查找串中匹配的内容,也就是将查找出来的内容再次调用,以二个数字为结尾的换成原行在跟一个.5
sed -r 's/(.*)/#\1\'    //在每一行前面加上#号
sed -r '1,5s/.*/#&/'    //将一到五行开头加上#号
sed -r '1,5s/^/#'   //也是1-5行前面加#号
sed -r 's/Hemenway/Jones/g' datafile    //将Hemenway换成jones
sed -r 's/(Mar)got/\1ianne/g' datafile    //将Mar做成组字符,在ianne前面调用也就是将margot换成morianne
sed -r 's#3#88#g'   //将3换成88
sed -r 's/[0-9]+$/&.5/' passwd.txt  //将结尾是数字的一个或多个的行在后面加上.5
sed -r 's/(.)(.)(.*)/\1\2jiang\3/' passwd.txt   //第一个.表示第一个字符第二个.表示第二个字符第三个.*表示整行,也就是在第二个字符后面加其他内容可以在调用完1,2后跟上所需内容在调用3
sed -r 's/(.*)(.)(.)/\1jiang\2\3/' passwd.txt //在最后二个字符前加其他内容

======================================================================================
sed -r 's/root/jiangxiaolong/g' passwd.txt                 //将root换成jiangxiaolong
sed -r 's/^root/jiangxiaolong/g' passwd.txt               //将root开头的行换成jiangxiaolong
sed -r 's/[0-9][0-9]$/&.5/' passwd.txt            //两个数字结尾的行换成原行内容在跟一个.5   &代表匹配的内容再次调用出来
sed -r 's/(.*)/#\1/'  passwd.txt           //将所有行前面加#
sed -r 's/.*/#&/' passwd.txt         //将所有行前面加#,使用&方式调用获得结果
sed -r 's/^/#/' passwd.txt                 //将所有行前面加#
sed -r 's/^(ro)ot/\1jiang/' passwd.txt    //将ro做成组字符,然后后面调用,也就是将root改成rojiangxiaolong
sed -r 's/(.)(.)(.*)/\1\2jiang\3/' passwd.txt    //在每一行的第二个字符前面加上任意内容,空格也代表一个字符
sed -r 's/(.*)(.)(.)/\1jiang\2\3/' passwd.txt     //在每一行结尾的最后两个字符前加其他内容

读文件命令:r

sed -r '/lp/r /etc/hosts' passwd.txt  //在lp行后面插入/etc/hosts/文件的内容
sed -r '2r /etc/hosts' passwd.txt  //在第二行后面读入/etc/hosts/中的内容
sed -r '/2/r /etc/hosts' passwd.txt   //这个跟2r有区别,这里是2在//中表示正则匹配,只有出现2的地方就会读入/etc/host

写文件命令:w

另存为的文件必须要有写入权限

每次另存到同一个文件,之前文件的内容会被覆盖掉

sed -r '/root/w /tmp/a.txt' passwd.txt  //查找包含root的行,并保存到/tmp/a.txt文件中
sed -r '3,$w /tmp/a.txt' passwd.txt   //从第三行一直到最后一行保存到/tmp/a.txt文件中

追加命令:a

sed -r '2a chkconfig 35 21 85' passwd.txt  //在第二行后面追加内容
sed -r '/root/a jiangxiaolong' passwd.txt  //在包含root的行后面加内容
sed -r '2a jiang\
>xiao\
>long' passwd.txt   //第二行后面追加多行

插入命令:i

sed -r '2i jiang' passwd.txt      //在第二行插入内容
sed -r '/root/i jiang' passwd.txt   //在包含root的行插入内容,会在root行前面插入
sed -r '2i jiang\
>xiao\
>long' passwd.txt       //在二行插入这些内容,这些内容会从第二行开始插入

修改命令:c

sed -r '/root/c jiang' passwd.txt     //将root行换成jiang
sed -r '1c jiang' passwd.txt      //将第一行的内容换成jiang
sed -r '1c 1111\
> 222\
> 333' passwd.txt         //将第一行的内容换成1111并添加222 333

获取下一行:n

获取下一行的内容,常用于要处理的行没有明显特征,可以借助上一行在使用n对下一行进行处理,类似于隔山打牛,实际上匹配的这一行但是不对这一行做操作而是对下一行

sed -r '/lp/{n;d}'      //查找lp的行并对下一行执行d命令
sed -r 'lp{n;s/sbin/bin/}'    //查找lp的行并对下一行执行s命令
sed -r '/lp/{n;n;s/sbin/bin/}' passwd.txt //查找lp的行在它的下两行执行s命令,n可以使用多个,一个表示下一行,二个表示下二行

暂存和取用命令:h H g G

sed命令除了模式空间还有暂存空间,所谓暂存空间就是把一行处理后放到一个暂存空间,在需要的时候进行调用,在暂存空间里小写的命令比如说h、g都是具有覆盖的功能,而大写的命令例如H、G都表示追加,暂存空间默认只有换行符

 

一般第一次放入暂存空间会使用覆盖的方式,因为默认会有一个空行

sed -r '1h;$G' passwd.txt     //把第一行覆盖到暂存空间,在最后一行的时候将模式空间的内容追加到最后一行下面
sed -r '1{h;d};$G' passwd.txt   //把第一行覆盖到暂存空间并删除,在最后一行在调用追加,相当于把第一行剪切到最后一行
sed -r '1h;2,$g' passwd.txt     //把第一行覆盖到暂存空间,从第二行到最后一行,每读一行就从暂存空间调回来,这里用的g表示覆盖,因此每调用一次都会把原来的内容覆盖掉,这样整个文本都会和第一行一样
sed -r '1h;2,3H;$G' passwd.txt    //把第一行覆盖到暂存空间,第二行第三行追加到暂存空间,在最后一行的时候在调用暂存空间的内容,这里的动作是追加

暂存空间与模式空间互换:x

互换是指,将暂存空间的内容换到模式空间,再将模式空间的内容放到了暂存空间

sed -r '3h;5x;$G' passwd.txt    //将第3行覆盖到暂存空间,读到第5行时将暂存空间与模式空间的内容互换,也就是处理完后第五行的

取反命令:!

!一般放在命令前面

sed -r '1!a jiang' passwd.txt   //除了第一行都追加

-e多重编辑

-e选项完全用不着可以说,可以使用;将每个命令隔开即可

如果要对同一行进行操作还可以用{}方式

sed -r -e '1,3d' -e 's/bin/aaa/g' passwd.txt
sed -r '1,3d;s/sbin/bin/g' passwd.txt
sed -r '2s/bin/jiang/g;2s/x/aaa/g' passwd.txt
sed -r '2{s/bin/jiang/g;s/x/aaa/g}' passwd.txt

8.sed常见操作

删除配置文件中#号注释行

sed -r '/^#/d' /etc/vsftpd/vsftpd.conf      //只删除文件中以#开头的行
sed -r '/^[ \t]*#/d' /etc/vsftpd/vsftpd.conf    //删除以空格或者制表符出现0次或多次在跟一个#的行
sed -r '/^[ \t]*#d;/^[ \t]*$/d' /etc/vsftpd/vsftpd.conf   //删除以空格或者制表符出现0次或多次在跟一个#的行并且删除只以空格或者制表符出现0次到多次结尾的行,也就是既删除注释行也删除空行

 sed -r '/^[ \t]*#/!d' /etc/vsftpd/vsftpd.conf  //取反只留下了注释行

删除配置文件中的//号注释行

sed -r '\#^[ \t]*//#d' szlxwj.txt
• 1

删除无内容的空行

sed -r '/^$/d'  /etc/vsftpd/vsftpd.conf
sed -r '/^[ \t]*$/d'  /etc/vsftpd/vsftpd.conf

删除注释行及空行

sed -r '/^[ \t]*#/d;/^[ \t]*$/d' /etc/vsftpd/vsftpd.conf    

sed -r '/^[ \t]*#|^[ \t]*$/d'  /etc/vsftpd/vsftpd.conf    //将两部分合为一部分,用|元字符代表或者的意思

sed -r '/^[ \t]*(#|$)/d'  /etc/vsftpd/vsftpd.conf   //利用元字符,因为前部分都一样只需要把不一样的地方用或者表示即可

修改文件

sed -ri '$a chroot_local_user=YES' /etc/vsftpd/vsftpd.conf    //在最后一行追加内容
sed -ri '/^SELINUX=/cSELINUX=disabled' /etc/sysconfig/selinux   //将开头为SELINUX的行整个换成SELINUX=disbaled
sed -ri '/UseDNS/cUseDNS no' /etc/ssh/sshd_config

给文件行增加注释

sed -r '1,5s/(.*)/#\1/' passwd.txt
sed -r '1,5s/.*/#&/' passwd.txt
sed -r '1,5s/^/#$/' passwd.txt
sed -r '1,5s/^#*/#/' passwd.txt     //查找1到5行如果是以0到一个#号卡头的行换成一个#号
sed -ri '1,2s/(.*)/\t#\1/;3s/(.*)/#\1/' passwd.txt    //1,2行增加一个制表符在加一个#号,3行只加一个#号
sed -r '1,3s/^[ \t]*#*/#/' passwd.txt   //将1到3行中以空格或者制表符0个或多个开头的在跟一个#0个或多个替换成#
sed -r '1,3s/^[ \t#]*/#/' passwd.txt    //将以空格制表符#出现0到多次替换成#
删掉一个注释行
sed -ri '1,3s/(.)(.*)/\2/' passwd.txt

sed中引入变量

var=1111jiang     //先定义变量

sed -r '3a$var' passwd.txt    //这种方式是错误的,因为单引号是强引用,直接就会追加$var而不是对应的值
sed -r "3a$var" passwd.txt    //使用双引号即可
sed -r 3a$var passwd.txt    //不适用任何引号也可以

sed -r "$a$var" passwd.txt    //这里双引号会把$a误以为是变量,也是错误的
sed -r '$a'"$var" passwd.txt    //可以各自使用各自的引号
sed -r "\$a$var" passwd.txt     //也可以使用\进行转义

文件内容倒转

sed -r '1!G;$!h;$!d' 12345.txt

l

var=1111jiang //先定义变量

 

sed -r '3av a r ′ p a s s w d . t x t / / 这 种 方 式 是 错 误 的 , 因 为 单 引 号 是 强 引 用 , 直 接 就 会 追 加 var' passwd.txt //这种方式是错误的,因为单引号是强引用,直接就会追加var

passwd.txt//这种方式是错误的,因为单引号是强引用,直接就会追加var而不是对应的值

sed -r "3av a r " p a s s w d . t x t / / 使 用 双 引 号 即 可 s e d − r 3 a var" passwd.txt //使用双引号即可 sed -r 3avar"passwd.txt//使用双引号即可sed−r3avar passwd.txt //不适用任何引号也可以

 

sed -r “a aavar” passwd.txt //这里双引号会把a 误 以 为 是 变 量 , 也 是 错 误 的 s e d − r ′ a误以为是变量,也是错误的 sed -r 'a误以为是变量,也是错误的sed−r

a’"$var" passwd.txt //可以各自使用各自的引号

sed -r “$a$var” passwd.txt //也可以使用\进行转义


文件内容倒转

```shell
sed -r '1!G;$!h;$!d' 12345.txt

与[转帖]Linux文本处理三剑客sed详解(正则匹配、命令示例)相似的内容:

[转帖]Linux文本处理三剑客sed详解(正则匹配、命令示例)

https://developer.aliyun.com/article/885609?spm=a2c6h.24874632.expert-profile.312.7c46cfe9h5DxWK 简介: sed读一行放到模式空间进行处理 sed是一种在线的、非交互式的编辑器,它一次处理一行内容,处理时

[转帖] jq命令用法总结

https://www.cnblogs.com/codelogs/p/16324928.html 原创:扣钉日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。 简介# 如果说要给Linux文本三剑客(grep、sed、awk)添加一员的话,我觉得应该是jq命令,因为jq命令是用来处

[转帖]Linux文本处理三剑客之awk学习笔记05:getline用法详解

https://www.cnblogs.com/alongdidi/archive/2021/01/19/awkGetline.html getline用法详解 在默认情况下,awk支持从文件或者STDIN中读取数据。我们也可以使用getline来灵活读取数据,例如在main代码块执行过程中读取某个

[转帖]Linux文本处理三剑客之awk学习笔记05:getline用法详解

https://www.cnblogs.com/alongdidi/p/awkGetline.html getline用法详解 在默认情况下,awk支持从文件或者STDIN中读取数据。我们也可以使用getline来灵活读取数据,例如在main代码块执行过程中读取某个非待处理文件的数据,或者从某个读取

[转帖]Linux-文本处理三剑客awk详解+企业真实案例(变量、正则、条件判断、循环、数组、分析日志)

https://developer.aliyun.com/article/885607?spm=a2c6h.24874632.expert-profile.313.7c46cfe9h5DxWK 简介: 文本处理 awk 1.awk简介 awk是一种编程语言,用于在Linux/unix下对文本和数据进

[转帖]Linux-文本处理三剑客grep详解

https://developer.aliyun.com/article/885611?spm=a2c6h.24874632.expert-profile.311.7c46cfe9h5DxWK 简介: grep家族 grep:在文件中全局查找指定的正则表达式,并打印所有包含该表达的行 egrep:扩

[转帖]Shell三剑客之awk

目录 awk简述awk的工作过程awk的工作原理awk的基本格式及其内置变量getline文本内容匹配过滤打印对字段进行处理打印条件判断打印awk的三元表达式与精准筛选用法awk的精准筛选:awk的分隔符用法指定输出的分隔符awk结合数组运用面试题 awk简述 在 Linux/UNIX 系统中,aw

[转帖]Linux系统awk命令详解

AWK 是一种处理文本文件的语言,是一个强大的文本分析工具。 之所以叫 AWK 是因为其取了三位创始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的 Family Name 的首字符。 实际上 AWK 的确拥有自己的语言: AWK程序设计语言,三位

【转帖】【奇淫技巧】Linux | 查找文件,无所遁形

theme: channing-cyan 本文正在参与 “走过Linux 三十年”话题征文活动 在Linux系统上,最常见的操作莫过于处理文本。常见文件操作陈列、查找、排序、格式转换、数据流处理等等。这篇文章着眼于文件查找,分析locate和find命令的使用方法,和运用原理以及缺陷不足。 一、导读

[转帖] Linux命令拾遗-文本处理篇

https://www.cnblogs.com/codelogs/p/16060413.html 简介# 这是Linux命令拾遗系列的第二篇,本篇主要介绍Linux中与文本处理相关的命令,如xargs、grep、sed、awk等。 本系列文章索引Linux命令拾遗-入门篇 常用文本相关命令# cat