正規表示式參考 |
簡介 |
目錄 |
快速參考 |
字元 |
基本功能 |
字元類別 |
簡寫 |
錨點 |
字詞邊界 |
量詞 |
Unicode |
擷取群組和反向參照 |
命名群組和反向參照 |
特殊群組 |
模式修改器 |
遞迴和平衡群組 |
替換參考 |
字元 |
配對文字和反向參照 |
內容和大小寫轉換 |
條件 |
本網站更多資訊 |
簡介 |
正規表示式快速開始 |
正規表示式教學 |
替換字串教學 |
應用程式和語言 |
正規表示式範例 |
正規表示式參考 |
替換字串參考 |
書籍評論 |
可列印 PDF |
關於本網站 |
RSS 饋送和部落格 |
此參考頁面說明在字元類別外使用 Unicode 標記時,這些標記的作用。除了 \X 之外,所有這些標記都可以在字元類別內使用。在字元類別內,這些標記會將它們通常配對的字元新增到字元類別中。
功能 | 語法 | 說明 | 範例 | JGsoft | .NET | Java | Perl | PCRE | PCRE2 | PHP | Delphi | R | JavaScript | VBScript | XRegExp | Python | Ruby | std::regex | Boost | Tcl ARE | POSIX BRE | POSIX ERE | GNU BRE | GNU ERE | Oracle | XML | XPath |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
音位 | \X | 配對單一 Unicode 音位,無論是以單一碼點或使用組合標記編碼為多個碼點。音位最接近日常概念中的「字元」。 | \X 配對編碼為 U+0061 U+0300 的 à、編碼為 U+00E0 的 à、© 等。 | 是 | 否 | 9 | 是 | 5.0 | 是 | 5.0.5 | 是 | 是 | 否 | 否 | 否 | 否 | 2.0 | 否 | ECMA 延伸 egrep awk | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
代碼點 | \uFFFF 其中 FFFF 為 4 個十六進位數字 | 比對特定 Unicode 代碼點。 | \u00E0 僅比對編碼為 U+00E0 的 à。 \u00A9 僅比對 © | 是 | 是 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 是 | 是 | 是 | 3.3 2.4 字串 | 1.9 | ECMA | 否 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
代碼點 | \u{FFFF} 其中 FFFF 為 1 至 4 個十六進位數字 | 比對特定 Unicode 代碼點。 | \u{E0} 僅比對編碼為 U+00E0 的 à。 \u{A9} 僅比對 © | V2 | 否 | 否 | 否 | 否 | 否 | 7.0.0 字串 | 否 | 否 | 否 | 否 | 3 | 否 | 1.9 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
代碼點 | \xFFFF 其中 FFFF 為 4 個十六進位數字 | 比對特定 Unicode 代碼點。 | \x00E0 僅比對編碼為 U+00E0 的 à。 \x00A9 僅比對 © | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 字串 | 否 | 8.4–8.5 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
代碼點 | \x{FFFF} 其中 FFFF 為 1 至 4 個十六進位數字 | 比對特定 Unicode 代碼點。 | \x{E0} 僅比對編碼為 U+00E0 的 à。 \x{A9} 僅比對 © | 是 | 否 | 7 | 是 | 是 | 是 | 是 | 是 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | ECMA 延伸 egrep awk | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 類別 | \pL 其中 L 是 Unicode 類別 | 比對指定 Unicode 類別中的單一 Unicode 代碼點。 | \pL 比對編碼為 U+00E0 的 à;\pS 比對 © | 是 | 否 | 是 | 是 | 5.0 | 是 | 5.0.5 | 是 | 是 | 否 | 否 | 3 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 類別 | \PL 其中 L 是 Unicode 類別 | 比對不在指定 Unicode 類別中的單一 Unicode 代碼點。 | \PS 比對編碼為 U+00E0 的 à;\PL 比對 © | 是 | 否 | 是 | 是 | 5.0 | 是 | 5.0.5 | 是 | 是 | 否 | 否 | 3 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 類別 | \p{L} 其中 L 是 Unicode 類別 | 比對指定 Unicode 類別中的單一 Unicode 代碼點。 | \p{L} 比對編碼為 U+00E0 的 à;\p{S} 比對 © | 是 | 是 | 是 | 是 | 5.0 | 是 | 5.0.5 | 是 | 是 | 否 | 否 | 是 | 否 | 1.9 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 是 | 是 |
Unicode 類別 | \p{IsL} 其中 L 是 Unicode 類別 | 比對指定 Unicode 類別中的單一 Unicode 代碼點。 | \p{IsL} 比對編碼為 U+00E0 的 à;\p{IsS} 比對 © | 是 | 否 | 是 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 類別 | \p{Category} | 比對指定 Unicode 類別中的單一 Unicode 代碼點。 | \p{Letter} 比對編碼為 U+00E0 的 à;\p{Symbol} 比對 © | 是 | 否 | 否 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 是 | 否 | 1.9 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 類別 | \p{IsCategory} | 比對指定 Unicode 類別中的單一 Unicode 代碼點。 | \p{IsLetter} 符合編碼為 U+00E0 的 à;\p{IsSymbol} 符合 © | 是 | 否 | 否 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 碼 | \p{Script} | 符合屬於指定 Unicode 碼的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個碼。碼從不包含未指派的碼點。 | \p{Greek} 符合 Ω | 是 | 否 | 否 | 是 | 6.5 | 是 | 5.1.3 | 是 | 是 | 否 | 否 | 是 | 否 | 1.9 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 碼 | \p{IsScript} | 符合屬於指定 Unicode 碼的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個碼。碼從不包含未指派的碼點。 | \p{IsGreek} 符合 Ω | 是 | 否 | 7 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 區塊 | \p{Block} | 符合屬於指定 Unicode 區塊的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個區塊。區塊可能包含未指派的碼點。 | \p{Arrows} 符合從 U+2190 到 U+21FF (← 到 ⇿) 的任何碼點 | 是 | 否 | 否 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 區塊 | \p{InBlock} | 符合屬於指定 Unicode 區塊的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個區塊。區塊可能包含未指派的碼點。 | \p{InArrows} 符合從 U+2190 到 U+21FF (← 到 ⇿) 的任何碼點 | 是 | 否 | 是 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 2–4 | 否 | 2.0 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 區塊 | \p{IsBlock} | 符合屬於指定 Unicode 區塊的單一 Unicode 碼點。每個 Unicode 碼點都屬於一個區塊。區塊可能包含未指派的碼點。 | \p{IsArrows} 符合從 U+2190 到 U+21FF (← 到 ⇿) 的任何碼點 | 是 | 是 | 否 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 是 | 是 |
否定的 Unicode 屬性 | \P{Property} | 符合不具備指定屬性(類別、碼或區塊)的單一 Unicode 碼點。 | \P{L} 符合 © | 是 | 是 | 是 | 是 | 5.0 | 是 | 5.0.5 | 是 | 是 | 否 | 否 | 是 | 否 | 1.9 | 否 | ECMA 延伸 egrep awk | 否 | 否 | 否 | 否 | 否 | 否 | 是 | 是 |
否定的 Unicode 屬性 | \p{^Property} | 符合不具備指定屬性(類別、碼或區塊)的單一 Unicode 碼點。 | \p{^L} 符合 © | 是 | 否 | 否 | 是 | 5.0 | 是 | 5.0.5 | 是 | 是 | 否 | 否 | 是 | 否 | 1.9 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
Unicode 屬性 | \P{^Property} | 符合具有指定屬性(類別、碼或區塊)的單一 Unicode 碼點。雙重否定視為肯定。 | \P{^L} 符合 q | V2 | 否 | 否 | 是 | 5.0 | 是 | 5.0.5 | 是 | 是 | 否 | 否 | 否 | 否 | 1.9 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
功能 | 語法 | 說明 | 範例 | JGsoft | .NET | Java | Perl | PCRE | PCRE2 | PHP | Delphi | R | JavaScript | VBScript | XRegExp | Python | Ruby | std::regex | Boost | Tcl ARE | POSIX BRE | POSIX ERE | GNU BRE | GNU ERE | Oracle | XML | XPath |
| 快速開始 | 教學 | 工具與語言 | 範例 | 參考 | 書籍評論 |
| 簡介 | 目錄 | 快速參考 | 字元 | 基本功能 | 字元類別 | 簡寫 | 錨點 | 字詞邊界 | 量詞 | Unicode | 擷取群組與反向參照 | 命名群組與反向參照 | 特殊群組 | 模式修改器 | 遞迴與平衡群組 |
頁面網址:https://regular-expressions.dev.org.tw/refunicode.html
頁面最後更新時間:2021 年 8 月 13 日
網站最後更新時間:2024 年 3 月 15 日
版權所有 © 2003-2024 Jan Goyvaerts。保留所有權利。