快速開始
教學
工具和語言
範例
參考
書籍評論
正規表示式參考
簡介
目錄
快速參考
字元
基本功能
字元類別
簡寫
錨點
字詞邊界
量詞
Unicode
擷取群組和反向參照
命名群組和反向參照
特殊群組
模式修改器
遞迴和平衡群組
替換參考
字元
配對文字和反向參照
內容和大小寫轉換
條件
本網站更多資訊
簡介
正規表示式快速開始
正規表示式教學
替換字串教學
應用程式和語言
正規表示式範例
正規表示式參考
替換字串參考
書籍評論
可列印 PDF
關於本網站
RSS 饋送和部落格
RegexBuddy—Better than a regular expression reference!

正規表示式 Unicode 語法參考

此參考頁面說明在字元類別外使用 Unicode 標記時,這些標記的作用。除了 \X 之外,所有這些標記都可以在字元類別內使用。在字元類別內,這些標記會將它們通常配對的字元新增到字元類別中。

功能語法說明範例JGsoft .NET Java Perl PCRE PCRE2 PHP Delphi R JavaScript VBScript XRegExp Python Ruby std::regex Boost Tcl ARE POSIX BRE POSIX ERE GNU BRE GNU ERE Oracle XML XPath
音位 \X 配對單一 Unicode 音位,無論是以單一碼點或使用組合標記編碼為多個碼點。音位最接近日常概念中的「字元」。 \X 配對編碼為 U+0061 U+0300 的 à、編碼為 U+00E0 的 à© 等。 95.05.0.52.0ECMA
延伸
egrep
awk
代碼點 \uFFFF 其中 FFFF 為 4 個十六進位數字 比對特定 Unicode 代碼點。 \u00E0 僅比對編碼為 U+00E0 的 à\u00A9 僅比對 © 3.3
2.4 字串
1.9ECMA
代碼點 \u{FFFF} 其中 FFFF 為 1 至 4 個十六進位數字 比對特定 Unicode 代碼點。 \u{E0} 僅比對編碼為 U+00E0 的 à\u{A9} 僅比對 © V27.0.0 字串31.9
代碼點 \xFFFF 其中 FFFF 為 4 個十六進位數字 比對特定 Unicode 代碼點。 \x00E0 僅比對編碼為 U+00E0 的 à\x00A9 僅比對 © 字串8.4–8.5
代碼點 \x{FFFF} 其中 FFFF 為 1 至 4 個十六進位數字 比對特定 Unicode 代碼點。 \x{E0} 僅比對編碼為 U+00E0 的 à\x{A9} 僅比對 © 7ECMA
延伸
egrep
awk
Unicode 類別 \pL 其中 L 是 Unicode 類別 比對指定 Unicode 類別中的單一 Unicode 代碼點。 \pL 比對編碼為 U+00E0 的 à\pS 比對 © 5.05.0.53
Unicode 類別 \PL 其中 L 是 Unicode 類別 比對不在指定 Unicode 類別中的單一 Unicode 代碼點。 \PS 比對編碼為 U+00E0 的 à\PL 比對 © 5.05.0.53
Unicode 類別 \p{L} 其中 L 是 Unicode 類別 比對指定 Unicode 類別中的單一 Unicode 代碼點。 \p{L} 比對編碼為 U+00E0 的 à\p{S} 比對 © 5.05.0.51.9
Unicode 類別 \p{IsL} 其中 L 是 Unicode 類別 比對指定 Unicode 類別中的單一 Unicode 代碼點。 \p{IsL} 比對編碼為 U+00E0 的 à\p{IsS} 比對 ©
Unicode 類別 \p{Category} 比對指定 Unicode 類別中的單一 Unicode 代碼點。 \p{Letter} 比對編碼為 U+00E0 的 à\p{Symbol} 比對 © 1.9
Unicode 類別 \p{IsCategory} 比對指定 Unicode 類別中的單一 Unicode 代碼點。 \p{IsLetter} 符合編碼為 U+00E0 的 à\p{IsSymbol} 符合 ©
Unicode 碼 \p{Script} 符合屬於指定 Unicode 碼的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個碼。碼從不包含未指派的碼點。 \p{Greek} 符合 Ω 6.55.1.31.9
Unicode 碼 \p{IsScript} 符合屬於指定 Unicode 碼的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個碼。碼從不包含未指派的碼點。 \p{IsGreek} 符合 Ω 7
Unicode 區塊 \p{Block} 符合屬於指定 Unicode 區塊的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個區塊。區塊可能包含未指派的碼點。 \p{Arrows} 符合從 U+2190 到 U+21FF () 的任何碼點
Unicode 區塊 \p{InBlock} 符合屬於指定 Unicode 區塊的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個區塊。區塊可能包含未指派的碼點。 \p{InArrows} 符合從 U+2190 到 U+21FF () 的任何碼點 2–42.0
Unicode 區塊 \p{IsBlock} 符合屬於指定 Unicode 區塊的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個區塊。區塊可能包含未指派的碼點。 \p{IsArrows} 符合從 U+2190 到 U+21FF () 的任何碼點
否定的 Unicode 屬性 \P{Property} 符合不具備指定屬性(類別、碼或區塊)的單一 Unicode 碼點。 \P{L} 符合 © 5.05.0.51.9ECMA
延伸
egrep
awk
否定的 Unicode 屬性 \p{^Property} 符合不具備指定屬性(類別、碼或區塊)的單一 Unicode 碼點。 \p{^L} 符合 © 5.05.0.51.9
Unicode 屬性 \P{^Property} 符合具有指定屬性(類別、碼或區塊)的單一 Unicode 碼點。雙重否定視為肯定。 \P{^L} 符合 q V25.05.0.51.9
功能語法說明範例JGsoft .NET Java Perl PCRE PCRE2 PHP Delphi R JavaScript VBScript XRegExp Python Ruby std::regex Boost Tcl ARE POSIX BRE POSIX ERE GNU BRE GNU ERE Oracle XML XPath