一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務器之家:專注于服務器技術及軟件下載分享
分類導航

Linux|Centos|Ubuntu|系統進程|Fedora|注冊表|Bios|Solaris|Windows7|Windows10|Windows11|windows server|

服務器之家 - 服務器系統 - Linux - linux shell 正則表達式(BREs,EREs,PREs)差異比較

linux shell 正則表達式(BREs,EREs,PREs)差異比較

2019-11-24 19:34Linux教程網 Linux

在計算機科學中,是指一個用來描述或者匹配一系列符合某個句法規則的字符串的單個字符串。在很多文本編輯器或其他工具里,正則表達式通常被用來檢索和/或替換那些符合某個模式的文本內容

在計算機科學中,是指一個用來描述或者匹配一系列符合某個句法規則的字符串的單個字符串。在很多文本編輯器或其他工具里,正則表達式通常被用來檢索和/或替換那些符合某個模式的文本內容。許多程序設計語言都支持利用正則表達式進行字符串操作。例如,在Perl中就內建了一個功能強大的正則表達式引擎。正則表達式這個概念最初是由Unix中的工具軟件(例如sed和grep)普及開的。正則表達式通常縮寫成“regex”,單數有regexp、regex,復數有regexps、regexes、regexen。這些是正則表達式的定義。 由于起源于unix系統,因此很多語法規則一樣的。但是隨著逐漸發展,后來擴展出以下幾個類型。了解這些對于學習正則表達式。

一、正則表達式分類:

1、基本的正則表達式(Basic Regular Expression 又叫 Basic RegEx  簡稱 BREs) 
2、擴展的正則表達式(Extended Regular Expression 又叫 Extended RegEx 簡稱 EREs) 
3、Perl 的正則表達式(Perl Regular Expression 又叫 Perl RegEx 簡稱 PREs)

說明:只有掌握了正則表達式,才能全面地掌握 Linux 下的常用文本工具(例如:grep、egrep、GUN sed、 Awk 等) 的用法

二、Linux 中常用文本工具與正則表達式的關系 

常握 Linux 下幾種常用文本工具的特點,對于我們更好的使用正則表達式是很有幫助的

grep , egrep 正則表達式特點:

 

復制代碼代碼如下:

1)grep 支持:BREs、EREs、PREs 正則表達式 
grep 指令后不跟任何參數,則表示要使用 ”BREs“  
grep 指令后跟 ”-E" 參數,則表示要使用 “EREs“ 
grep 指令后跟 “-P" 參數,則表示要使用 “PREs" 

2)egrep 支持:EREs、PREs 正則表達式 
egrep 指令后不跟任何參數,則表示要使用 “EREs” 
egrep 指令后跟 “-P" 參數,則表示要使用 “PREs" 

3)grep 與 egrep 正則匹配文件,處理文件方法 
a. grep 與 egrep 的處理對象:文本文件 
b. grep 與 egrep 的處理過程:查找文本文件中是否含要查找的 “關鍵字”(關鍵字可以是正則表達式) ,如果含有要查找的 ”關健字“,那么默認返回該文本文件中包含該”關健字“的該行的內容,并在標準輸出中顯示出來,除非使用了“>" 重定向符號, 
c. grep 與 egrep 在處理文本文件時,是按行處理的 

 

sed 正則表達式特點

 

復制代碼代碼如下:

1)sed 文本工具支持:BREs、EREs 
sed 指令默認是使用"BREs" 
sed 命令參數 “-r ” ,則表示要使用“EREs" 
2)sed 功能與作用 
a. sed 處理的對象:文本文件 
b. sed 處理操作:對文本文件的內容進行 --- 查找、替換、刪除、增加等操作 
c. sed 在處理文本文件的時候,也是按行處理的 

 

Awk(gawk)正則表達式特點

 

復制代碼代碼如下:

1)Awk 文本工具支持:EREs 
awk 指令默認是使用 “EREs" 
2)Awk 文本工具處理文本的特點 
a. awk 處理的對象:文本文件 
b. awk 處理操作:主要是對列進行操作 

 

三、常見3中類型正則表達式比較
 

字符

說明

Basic RegEx

Extended RegEx

python RegEx

Perl regEx

轉義

 

\

\

\

\

^

匹配行首,例如'^dog'匹配以字符串dog開頭的行(注意:awk 指令中,'^'則是匹配字符串的開始)

^

^

^

^

$

匹配行尾,例如:'^、dog$'匹配以字符串 dog 為結尾的行(注意:awk 指令中,'$'則是匹配字符串的結尾)

$

$

$

$

^$

匹配空行

^$

^$

^$

^$

^string$

匹配行,例如:'^dog$'匹配只含一個字符串 dog 的行

^string$

^string$

^string$

^string$

\<

匹配單詞,例如:'\<frog' (等價于'\bfrog'),匹配以 frog 開頭的單詞

\<

\<

不支持

不支持(但可以使用\b來匹配單詞,例如:'\bfrog')

\>

匹配單詞,例如:'frog\>'(等價于'frog\b '),匹配以 frog 結尾的單詞

\>

\>

不支持

不支持(但可以使用\b來匹配單詞,例如:'frog\b')

\<x\>

匹配一個單詞或者一個特定字符,例如:'\<frog\>'(等價于'\bfrog\b')、'\<G\>'

\<x\>

\<x\>

不支持

不支持(但可以使用\b來匹配單詞,例如:'\bfrog\b'

()

匹配表達式,例如:不支持'(frog)'

不支持(但可以使用\(\),如:\(dog\)

()

()

()

\(\)

匹配表達式,例如:不支持'(frog)'

\(\)

不支持(同())

不支持(同())

不支持(同())

匹配前面的子表達式 0 次或 1 次(等價于{0,1}),例如:where(is)?能匹配"where" 以及"whereis"

不支持(同\?)

\?

匹配前面的子表達式 0 次或 1 次(等價于'\{0,1\}'),例如:'where\(is\)\? '能匹配 "where"以及"whereis"

\?

不支持(同?)

不支持(同?)

不支持(同?)

?

當該字符緊跟在任何一個其他限制符(*, +, ?, {n},{n,}, {n,m}) 后面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串,而默認的貪婪模式則盡可能多的匹配所搜索的字符串。例如,對于字符串 "oooo",'o+?' 將匹配單個"o",而 'o+' 將匹配所有 'o'

不支持

不支持

不支持

不支持

.

匹配除換行符('\n')之外的任意單個字符(注意:awk 指令中的句點能匹配換行符)

.

.(如果要匹配包括“\n”在內的任何一個字符,請使用:'(^$)|(.)

.

.(如果要匹配包括“\n”在內的任何一個字符,請使用:' [.\n] '

*

匹配前面的子表達式 0 次或多次(等價于{0, }),例如:zo* 能匹配 "z"以及 "zoo"

*

*

*

*

\+

匹配前面的子表達式 1 次或多次(等價于'\{1, \}'),例如:'where\(is\)\+ '能匹配 "whereis"以及"whereisis"

\+

不支持(同+)

不支持(同+)

不支持(同+)

+

匹配前面的子表達式 1 次或多次(等價于{1, }),例如:zo+能匹配 "zo"以及 "zoo",但不能匹配 "z"

不支持(同\+)

+

+

+

{n}

n 必須是一個 0 或者正整數,匹配子表達式 n 次,例如:zo{2}能匹配

不支持(同\{n\})

{n}

{n}

{n}

{n,}

"zooz",但不能匹配 "Bob"n 必須是一個 0 或者正整數,匹配子表達式大于等于 n次,例如:go{2,}

不支持(同\{n,\})

{n,}

{n,}

{n,}

{n,m}

能匹配 "good",但不能匹配 godm 和 n 均為非負整數,其中 n <= m,最少匹配 n 次且最多匹配 m 次 ,例如:o{1,3}將配"fooooood" 中的前三個 o(請注意在逗號和兩個數之間不能有空格)

不支持(同\{n,m\})

{n,m}

{n,m}

{n,m}

x|y

匹配 x 或 y,例如: 不支持'z|(food)' 能匹配 "z" 或"food";'(z|f)ood' 則匹配"zood" 或 "food"

不支持(同x\|y)

x|y

x|y

x|y

[0-9]

匹配從 0 到 9 中的任意一個數字字符(注意:要寫成遞增)

[0-9]

[0-9]

[0-9]

[0-9]

[xyz]

字符集合,匹配所包含的任意一個字符,例如:'[abc]'可以匹配"lay" 中的 'a'(注意:如果元字符,例如:. *等,它們被放在[ ]中,那么它們將變成一個普通字符)

[xyz]

[xyz]

[xyz]

[xyz]

[^xyz]

負值字符集合,匹配未包含的任意一個字符(注意:不包括換行符),例如:'[^abc]' 可以匹配 "Lay" 中的'L'(注意:[^xyz]在awk 指令中則是匹配未包含的任意一個字符+換行符)

[^xyz]

[^xyz]

[^xyz]

[^xyz]

[A-Za-z]

匹配大寫字母或者小寫字母中的任意一個字符(注意:要寫成遞增)

[A-Za-z]

[A-Za-z]

[A-Za-z]

[A-Za-z]

[^A-Za-z]

匹配除了大寫與小寫字母之外的任意一個字符(注意:寫成遞增)

[^A-Za-z]

[^A-Za-z]

[^A-Za-z]

[^A-Za-z]

\d

匹配從 0 到 9 中的任意一個數字字符(等價于 [0-9])

不支持

不支持

\d

\d

\D

匹配非數字字符(等價于 [^0-9])

不支持

不支持

\D

\D

\S

匹配任何非空白字符(等價于[^\f\n\r\t\v])

不支持

不支持

\S

\S

\s

匹配任何空白字符,包括空格、制表符、換頁符等等(等價于[ \f\n\r\t\v])

不支持

不支持

\s

\s

\W

匹配任何非單詞字符 (等價于[^A-Za-z0-9_])

\W

\W

\W

\W

\w

匹配包括下劃線的任何單詞字符(等價于[A-Za-z0-9_])

\w

\w

\w

\w

\B

匹配非單詞邊界,例如:'er\B' 能匹配 "verb" 中的'er',但不能匹配"never" 中的'er'

\B

\B

\B

\B

\b

匹配一個單詞邊界,也就是指單詞和空格間的位置,例如: 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的'er'

\b

\b

\b

\b

\t

匹配一個橫向制表符(等價于 \x09和 \cI)

不支持

不支持

\t

\t

\v

匹配一個垂直制表符(等價于 \x0b和 \cK)

不支持

不支持

\v

\v

\n

匹配一個換行符(等價于 \x0a 和\cJ)

不支持

不支持

\n

\n

\f

匹配一個換頁符(等價于\x0c 和\cL)

不支持

不支持

\f

\f

\r

匹配一個回車符(等價于 \x0d 和\cM)

不支持

不支持

\r

\r

\\

匹配轉義字符本身"\"

\\

\\

\\

\\

\cx

匹配由 x 指明的控制字符,例如:\cM匹配一個Control-M 或回車符,x 的值必須為A-Z 或 a-z 之一,否則,將 c 視為一個原義的 'c' 字符

不支持

不支持

 

\cx

\xn

匹配 n,其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長,例如:'\x41' 匹配 "A"。'\x041' 則等價于'\x04' & "1"。正則表達式中可以使用 ASCII 編碼

不支持

不支持

 

\xn

\num

匹配 num,其中 num是一個正整數。表示對所獲取的匹配的引用

不支持

\num

\num

 

[:alnum:]

匹配任何一個字母或數字([A-Za-z0-9]),例如:'[[:alnum:]] '

[:alnum:]

[:alnum:]

[:alnum:]

[:alnum:]

[:alpha:]

匹配任何一個字母([A-Za-z]), 例如:' [[:alpha:]] '

[:alpha:]

[:alpha:]

[:alpha:]

[:alpha:]

[:digit:]

匹配任何一個數字([0-9]),例如:'[[:digit:]] '

[:digit:]

[:digit:]

[:digit:]

[:digit:]

[:lower:]

匹配任何一個小寫字母([a-z]), 例如:' [[:lower:]] '

[:lower:]

[:lower:]

[:lower:]

[:lower:]

[:upper:]

匹配任何一個大寫字母([A-Z])

[:upper:]

[:upper:]

[:upper:]

[:upper:]

[:space:]

任何一個空白字符: 支持制表符、空格,例如:' [[:space:]] '

[:space:]

[:space:]

[:space:]

[:space:]

[:blank:]

空格和制表符(橫向和縱向),例如:'[[:blank:]]'ó'[\s\t\v]'

[:blank:]

[:blank:]

[:blank:]

[:blank:]

[:graph:]

任何一個可以看得見的且可以打印的字符(注意:不包括空格和換行符等),例如:'[[:graph:]] '

[:graph:]

[:graph:]

[:graph:]

[:graph:]

[:print:]

任何一個可以打印的字符(注意:不包括:[:cntrl:]、字符串結束符'\0'、EOF 文件結束符(-1), 但包括空格符號),例如:'[[:print:]] '

[:print:]

[:print:]

[:print:]

[:print:]

[:cntrl:]

任何一個控制字符(ASCII 字符集中的前 32 個字符,即:用十進制表示為從 0 到31,例如:換行符、制表符等等),例如:' [[:cntrl:]]'

[:cntrl:]

[:cntrl:]

[:cntrl:]

[:cntrl:]

[:punct:]

任何一個標點符號(不包括:[:alnum:]、[:cntrl:]、[:space:]這些字符集)

[:punct:]

[:punct:]

[:punct:]

[:punct:]

[:xdigit:]

任何一個十六進制數(即:0-9,a-f,A-F)

[:xdigit:]

[:xdigit:]

[:xdigit:]

[:xdigit:]


四、三種不同類型正則表達式比較

 

 

復制代碼代碼如下:


注意: 當使用 BERs(基本正則表達式)時,必須在下列這些符號前加上轉義字符('\'),屏蔽掉它們的 speical meaning  “?,+,|,{,},(,)” 這些字符,需要加入轉義符號”\”

 

注意:修飾符用在正則表達式結尾,例如:/dog/i,其中 “ i “ 就是修飾符,它代表的含義就是:匹配時不區分大小寫,那么修飾符有哪些呢?常見的修飾符如下:

g   全局匹配(即:一行上的每個出現,而不只是一行上的第一個出現)
s    把整個匹配串當作一行處理
m    多行匹配
i    忽略大小寫
x    允許注釋和空格的出現
U    非貪婪匹配

 

以上就是linux 常見3種類型正則表達式異同之處,整體了解這些,我相信在使用這些工具的時候,就可以更加清楚明晰了。

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 欧美日韩第二页 | 91视频国产一区 | 亚洲激情 欧美 | 亚洲青草视频 | 春宵福利网站在线观看 | 国产成人在线综合 | 国产欧美另类 | 午夜一级影院 | 久久精品熟女亚洲AV国产 | 草免费视频 | 日本视频在线免费播放 | 好大用力深一点女公交车 | 免费二级毛片免费完整视频 | 好大好爽好硬我要喷水了 | 激情综合站 | 成人欧美一区二区三区白人 | 成人在线播放 | 亚洲精品视频在线 | 99久久综合九九亚洲 | 日韩色图区 | 国产在线一区二区视频 | 教师波多野结衣在线播放 | youporn在线 | 亚洲黄色小视频 | 精品国产成a人在线观看 | 精品视频一区二区三区 | 91在线视频免费观看 | 日韩欧美中文字幕出 | 黄动漫车车好快的车车a | 成人免费草草视频 | 国产在线精品成人一区二区三区 | 嫩草影院永久一二三入口 | 国产第一页在线视频 | 国产精品麻豆 | 荷兰艾优apiyoo | 亚洲 欧美 国产 综合 在线 | 色综合中文字幕在线亚洲 | 国产精品高清一区二区三区不卡 | 午夜爱| 亚洲日本va中文字幕 | 国内精品在线观看视频 |