服务器 Servers

Centos7 Shell编程之正则表达式、文本处理工具详解

Posted in Servers onAugust 05, 2022

1. 正则表达式

正则表达式可以很灵活的提供各种模糊匹配的筛选规则。常被用来检索、替换那些符合某个模式的文本。grep、sed、awk等文本处理工具都支持通过正则表达式进行模式匹配

1.1 常规匹配

一串不包含特殊字符的正则表达式，匹配包含它自己的字符，例如：

[root@bigdata001 ~]# cat /etc/passwd | grep root
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
[root@bigdata001 ~]#

1.2 常用特殊字符

特殊字符：^：匹配一行的开头，例如：

[root@bigdata001 ~]# cat /etc/passwd | grep ^root
root:x:0:0:root:/root:/bin/bash
[root@bigdata001 ~]#

特殊字符：$：匹配一行的结束，例如：

[root@bigdata001 ~]# cat /etc/passwd | grep bash$
root:x:0:0:root:/root:/bin/bash
[root@bigdata001 ~]#

特殊字符：.：匹配一个任意的字符，例如：

[root@bigdata001 ~]# cat /etc/passwd | grep r..t
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
[root@bigdata001 ~]#

特殊字符：*：不单独使用，和上一个字符连用，表示匹配上一个字符0次或多次，例如

[root@bigdata001 ~]# cat /etc/passwd | grep ro*t
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
[root@bigdata001 ~]#

字符区间：[ ]：表示匹配某个范围内的一个字符

[68]：匹配6或者8
[0-9]：匹配一个0-9的数字
[0-9]*：匹配任意长度的数字字符串
[a-z]：匹配一个a-z之间的字符
[a-c, e-f]-匹配a-c或者e-f之间的任意一个字符

[root@bigdata001 ~]# echo 12345 | grep "[0-9]*"
12345
[root@bigdata001 ~]#

**特殊字符：**：表示转义，并不会单独使用。由于所有特殊字符都有其特定匹配模式，当我们想匹配某一特殊字符本身时(例如我想找出所有包含’$'的行)，就会碰到困难。此时我们就要将转义字符和特殊字符连用，来表示特殊字符本身，例如：

[root@bigdata001 ~]# echo -e 'abc$def'"\n123456" | grep '\$'
abc$def
[root@bigdata001 ~]#

实战练习：

[root@bigdata001 ~]# echo 13667894536 | grep -E ^1[34578][0-9]{9}$
13667894536
[root@bigdata001 ~]#

grep默认是不支持正则特殊字符{}的，需要开启拓展正则表达式功能

2. 文本处理工具

2.1 cut

cut可以将文件中内容(也可以通过管道符传输)，按照指定分隔符将每一行进行切割，然后取指定字节、字符、字段进行输出

基本语法： cut [选项参数] filename

选项参数如下：

-d 分隔符：按照指定分隔符分割每行数据，默认是制表符\t

-f 列号：取第几列。可以使用3,5表示取第三列和第五列，-3、3-5、5-分布表示取前三列、第三列到第五列、第五列和后面所有列

-c 字符号：表示取第个字符。不能指定分隔符

-b 字节号：表示取第个字节。不能指定分隔符

示例：

[root@bigdata001 ~]# cat /etc/passwd | grep bash$ | cut -d ":" -f 1
root
bigdata
[root@bigdata001 ~]# 
[root@bigdata001 ~]# cat /etc/passwd | grep bash$ | cut -d ":" -f 6-
/root:/bin/bash
/home/bigdata:/bin/bash
[root@bigdata001 ~]#
[root@bigdata001 ~]# cat /etc/passwd | grep bash$ | cut -c 1
r
g
[root@bigdata001 ~]#

实战示例：

[root@bigdata001 ~]# ifconfig ens33 | grep netmask | cut -d " " -f 10
192.168.8.111
[root@bigdata001 ~]#

2.2 awk

awk把文件逐行的读入(文件名或通过管道符传输)，以空格为默认分隔符将每行切片，切开的部分再进行分析处理

基本语法：awk [选项参数] ‘/pattern1/{action1} /pattern2/{action2} …’ filename

pattern：表示awk在数据中查找的内容，就是正则表达式匹配
action：在找到匹配内容时所执行的一系列命令

选项参数说明

-F 分隔符：指定输入文件每行分隔符
-v 变量名=变量值：赋值一个用户定义变量

awk的内置变量

FILENAME：文件名NR：数据所在的行号NF：每行切割后的列数

示例1：

[root@bigdata001 ~]# cat /etc/passwd | grep bash$
root:x:0:0:root:/root:/bin/bash
bigdata:x:996:1000::/home/bigdata:/bin/bash
[root@bigdata001 ~]# 
[root@bigdata001 ~]# awk -F ":" -v my_var=1 'BEGIN{print "begin line"} /bash$/{print $3+my_var", "$1", 文件名: "FILENAME", 行号: "NR",  列数: "NF} END{print "end line"}' /etc/passwd
begin line
1, root, 文件名: /etc/passwd, 行号: 1, 列数: 7
997, gpadmin, 文件名: /etc/passwd, 行号: 22, 列数: 7
end line
[root@bigdata001 ~]#

BEGIN和END都是可选的，表示在所有数据行读取之前或之后执行的操作
可以不定义pattern，只定义action
print是awk内部的命令
$1表示第一列，$2表示第二列，依次类推

示例2：

[root@bigdata001 ~]# ifconfig | awk '/netmask/{print $2}'
192.168.8.111
127.0.0.1
[root@bigdata001 ~]#

前面的多个空格会当作一个空格，且只统计有内容的列所在的位置

示例3：

[root@bigdata001 ~]# cat test.awk
#!/bin/awk -f
# 在所有数据行读取之前的操作
BEGIN {
    # 定义变量
    math = 0
    english = 0
 
    printf "name         math   english   total\n"
}

# 对每行数据进行的操作
{
    math+=$2
    english+=$3
    printf "%-10s %6d %9d %7d\n", $1, $2, $3, $2+$3
}
# 在所有数据行读取之后的操作
END {
    printf "total:     %6d %9d\n", math, english
    printf "average:   %6.2f %9.2f\n", math/NR, english/NR
}
[root@bigdata001 ~]# 
[root@bigdata001 ~]# echo -e "zhang_san 60 80\nli_si 70 90" | awk -f test.awk
name         math   english   total
zhang_san      60        80     140
li_si          70        90     160
total:        130       170
average:    65.00     85.00
[root@bigdata001 ~]#

printf是wak内置命令
printf中-表示左对齐，默认右对齐。数字表示宽度。s表示字符串，d表示数字，f表示浮点数(数字1.数字2：数字1表示宽度，数字2表示小数点位数)

到此这篇关于Centos7 Shell编程之正则表达式、文本处理工具的文章就介绍到这了,更多相关正则表达式、文本处理工具内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

Centos7 Shell编程之正则表达式、文本处理工具详解

- Author -

Bulut0907

- Original Sources -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Tags in this post...

Servers 相关文章推荐

使用Apache的rewrite

Mar 09 Servers

Nginx反向代理多个服务器的实现方法

Mar 31 Servers

nginx 多个location转发任意请求或访问静态资源文件的实现

Mar 31 Servers

Nginx 过滤静态资源文件的访问日志的实现

Mar 31 Servers

Linux安装apache服务器的配置过程

Nov 27 Servers

Minikube搭建Kubernetes集群

Mar 31 Servers

如何通过cmd 连接阿里云服务器

Apr 18 Servers

鲲鹏 CentOS 7 安装Python3.7

May 11 Servers

基于docker安装zabbix的详细教程

Jun 05 Servers

Linux中各个目录的作用与内容

Jun 28 Servers

设置IIS Express并发数

Jul 07 Servers

Nginx跨域问题解析与解决

Aug 05 Servers

Nginx使用ngx_http_upstream_module实现负载均衡功能示例

Aug 05 #Servers

Nginx跨域问题解析与解决

Aug 05 #Servers

win10搭建配置ftp服务器的方法

Aug 05 #Servers

windows系统搭建WEB服务器详细教程

Aug 05 #Servers

Win10系统搭建ftp文件服务器详细教程

Aug 05 #Servers

Linux在两个服务器直接传文件的操作方法

Aug 05 #Servers

windows10 家庭版下FTP服务器搭建教程

Aug 05 #Servers

希腊购物网站(6) 冰岛购物网站(1) 白俄罗斯购物网站(3) 保加利亚购物网站(3) 乌克兰购物网站(27) 约旦购物网站(1) 罗马尼亚购物网站(10) PHP面试题(54) 马耳他购物网站(1) 哈萨克斯坦购物网站(2)

You might like

PHP中strtotime函数使用方法详解

2011/11/27 PHP

查找php配置文件php.ini所在路径的二种方法

2014/05/26 PHP

smarty模板引擎中内建函数if、elseif和else的使用方法

2015/01/22 PHP

用roll.js实现的图片自动滚动+鼠标触动的特效

2007/03/18 Javascript

基于jQuery的让非HTML5浏览器支持placeholder属性的代码

2011/05/24 Javascript

网页广告中JS代码的信息监听示例

2014/04/02 Javascript

jQuery实现鼠标双击Table单元格变成文本框及输入内容后更新到数据库的方法

2015/11/25 Javascript

详解js图片轮播效果实现原理

2015/12/17 Javascript

js实现纯前端的图片预览

2016/04/27 Javascript

jQuery+Ajax实现限制查询间隔的方法

2016/06/07 Javascript

js仿小米官网图片轮播特效

2016/09/29 Javascript

canvas绘制多边形

2017/02/24 Javascript

微信小程序实现单列下拉菜单效果

2019/04/25 Javascript

vue 解决文本框被键盘遮住的问题

2019/11/06 Javascript

JS自定义右键菜单实现代码解析

2020/07/16 Javascript

如何在面试中手写出javascript节流和防抖函数

2020/10/22 Javascript

Vue-router中hash模式与history模式的区别详解

2020/12/15 Vue.js

Python 爬虫的工具列表大全

2016/01/31 Python

Python基于Socket实现的简单聊天程序示例

2017/08/05 Python

Java及python正则表达式详解

2017/12/27 Python

Python实现读取Properties配置文件的方法

2018/03/29 Python

Python中.join()和os.path.join()两个函数的用法详解

2018/06/11 Python

Python 动态导入对象,importlib.import_module()的使用方法

2019/08/28 Python

python super的使用方法及实例详解

2019/09/25 Python

北美领先的智能产品购物网站：Wellbots

2018/06/11 全球购物

世界领先的电子书网站：eBooks.com（在线购买小说、非小说和教科书）

2019/03/30 全球购物

人事主管岗位职责范本

2013/12/04 职场文书

2013年员工自我评价范文

2013/12/27 职场文书

工作会议欢迎词

2014/01/16 职场文书

小学毕业典礼主持词

2014/03/27 职场文书

美术课外活动总结

2014/07/08 职场文书

乡镇党的群众路线对照检查材料

2014/09/24 职场文书

离婚协议书格式

2014/11/21 职场文书

低端且暴利的线上线下创业项目分享

2019/09/03 职场文书

导游词之台湾安平古堡

2019/12/25 职场文书

pycharm安装深度学习pytorch的d2l包失败问题解决

2022/03/25 Python