Regular Expressions 101

Save & Manage Regex

Current Version: 1
Save & Share
Community Library
Flavor

PCRE2 (PHP)
ECMAScript (JavaScript)
Python
Golang
Java
.NET 7.0 (C#)
Rust
PCRE (Legacy)
Regex Flavor Guide
Function

Match
Substitution
List
Unit Tests
Tools

Regular Expression
Processing...

Test String

Code Generator

Language

Generated Code

import re

regex = re.compile(r"([ぁ-ゟ])", flags=re.MULTILINE | re.UNICODE | re.IGNORECASE)

test_str = ("Regex for matching ALL Japanese common & uncommon Kanji (4e00 – 9fcf) ~ The Big Kahuna!\n"
	"([一-龯])\n\n"
	"Regex for matching Hirgana or Katakana\n"
	"([ぁ-んァ-ン])\n\n"
	"Regex for matching Non-Hirgana or Non-Katakana\n"
	"([^ぁ-んァ-ン])\n\n"
	"Regex for matching Hirgana or Katakana or basic punctuation (、。’)\n"
	"([ぁ-んァ-ン\\w])\n\n"
	"Regex for matching Hirgana or Katakana and random other characters\n"
	"([ぁ-んァ-ン！：／])\n\n"
	"Regex for matching Hirgana\n"
	"([ぁ-ん])\n\n"
	"Regex for matching full-width Katakana (zenkaku 全角)\n"
	"([ァ-ン])\n\n"
	"Regex for matching half-width Katakana (hankaku 半角)\n"
	"([ｧ-ﾝﾞﾟ])\n\n"
	"Regex for matching full-width Numbers (zenkaku 全角)\n"
	"([０-９])\n\n"
	"Regex for matching full-width Letters (zenkaku 全角)\n"
	"([Ａ-ｚ])\n\n"
	"Regex for matching Hiragana codespace characters (includes non phonetic characters)\n"
	"([ぁ-ゞ])\n\n"
	"Regex for matching full-width (zenkaku) Katakana codespace characters (includes non phonetic characters)\n"
	"([ァ-ヶ])\n\n"
	"Regex for matching half-width (hankaku)\n"
	"Katakana codespace characters (this is an old character set so the order is inconsistent with the hiragana)\n"
	"([ｦ-ﾟ])\n\n"
	"Regex for matching Japanese Post Codes\n"
	"/^¥d{3}¥-¥d{4}$/\n"
	"/^¥d{3}-¥d{4}$|^¥d{3}-¥d{2}$|^¥d{3}$/\n\n"
	"Regex for matching Japanese mobile phone numbers (keitai bangou)\n"
	"/^¥d{3}-¥d{4}-¥d{4}$|^¥d{11}$/\n"
	"/^0¥d0-¥d{4}-¥d{4}$/\n\n"
	"Regex for matching Japanese fixed line phone numbers\n"
	"/^[0-9-]{6,9}$|^[0-9-]{12}$/\n"
	"/^¥d{1,4}-¥d{4}$|^¥d{2,5}-¥d{1,4}-¥d{4}$/\n\n"
	"Match all English alphanumerics, Japanese katakana,hiragana,multibytes of alphanumerics [hankaku and zenkaku],dashes\n"
	"/[一-龠]+|[ぁ-ゔ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[ａ-ｚＡ-Ｚ０-９]+[々〆〤]+/u\n"
	"========================================================\n"
	"--------------------------------------------------------\n"
	"Half-width alphanumeric characters\n"
	"([!-~])\n\n"
	"!\"#$%&'()*+,-./0123456789:;<=>?\n"
	"@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_\n"
	"`abcdefghijklmnopqrstuvwxyz{|}~\n\n"
	"--------------------------------------------------------\n"
	"Half-width KANA (hard)\n\n"
	"｡｢｣､･ｦｧｨｩｪｫｬｭｮｯｰｱｲｳｴｵｶｷｸｹｺｻｼｽｾｿ\n"
	"ﾀﾁﾂﾃﾄﾅﾆﾇﾈﾉﾊﾋﾌﾍﾎﾏﾐﾑﾒﾓﾔﾕﾖﾗﾘﾙﾚﾛﾜﾝﾞﾟ\n\n"
	"--------------------------------------------------------\n"
	"Full-width alphanumeric characters\n\n"
	"０１２３４５６７８９\n"
	"ＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯＰ\n"
	"ＱＲＳＴＵＶＷＸＹＺａｂｃｄｅｆ\n"
	"ｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖ\n"
	"ｗｘｙｚ\n\n"
	"--------------------------------------------------------\n"
	"full-width KANA (soft)\n\n"
	"ぁあぃいぅうぇえぉおかがきぎくぐ\n"
	"けげこごさざしじすずせぜそぞただ\n"
	"ちぢっつづてでとどなにぬねのはば\n"
	"ぱひびぴふぶぷへべぺほぼぽまみむ\n"
	"めもゃやゅゆょよらりるれろゎわゐ\n"
	"ゑをん\n\n"
	"--------------------------------------------------------\n"
	"full-width KANA (hard)\n\n"
	"ァアィイゥウェエォオカガキギクグ\n"
	"ケゲコゴサザシジスズセゼソゾタダ\n"
	"チヂッツヅテデトドナニヌネノハバ\n"
	"パヒビピフブプヘベペホボポマミム\n"
	"メモャヤュユョヨラリルレロヮワヰ\n"
	"ヱヲンヴヵヶ\n\n"
	"--------------------------------------------------------\n"
	"Symbol\n\n"
	"、。，．・：；？！゛゜´｀¨＾￣\n"
	"＿ヽヾゝゞ〃仝々〆〇ー―‐／＼～\n"
	"∥｜…‥‘’“”（）〔〕［］｛｝\n"
	"〈〉《》「」『』【】＋－±×÷＝\n"
	"≠＜＞≦≧∞∴♂♀°′″℃￥＄￠\n"
	"￡％＃＆＊＠§☆★○●◎◇◆□■\n"
	"△▲▽▼※〒→←↑↓〓∈∋⊆⊇⊂\n"
	"⊃∪∩∧∨￢⇒⇔∀∃∠⊥⌒∂∇≡\n"
	"≒≪≫√∽∝∵∫∬Å‰♯♭♪\n"
	"---------------------------------------------------------\n\n"
	"Hiragana\n"
	"Unicode code points regex: [\\x3041-\\x3096]\n"
	"Unicode block property regex: \\p{Hiragana}\n"
	"Regex:  ([ぁ-ゟ])\n\n\n"
	"ぁ あ ぃ い ぅ う ぇ え ぉ お か が き ぎ く ぐ け げ こ ご さ ざ し じ す ず せ ぜ そ ぞ た だ ち ぢ っ つ づ て で と ど な に ぬ ね の は ば ぱ ひ び ぴ ふ ぶ ぷ へ べ ぺ ほ ぼ ぽ ま み む め も ゃ や ゅ ゆ ょ よ ら り る れ ろ ゎ わ ゐ ゑ を ん ゔ ゕ ゖ  ゙ ゚ ゛ ゜ ゝ ゞ ゟ\n"
	"---------------------------------------------------------\n"
	"Katakana (Full Width)\n"
	"Unicode code points regex: [\\x30A0-\\x30FF]\n"
	"Unicode block property regex: \\p{Katakana}\n"
	"([ァ-ヿ])\n\n"
	"゠ ァ ア ィ イ ゥ ウ ェ エ ォ オ カ ガ キ ギ ク グ ケ ゲ コ ゴ サ ザ シ ジ ス ズ セ ゼ ソ ゾ タ ダ チ ヂ ッ ツ ヅ テ デ ト ド ナ ニ ヌ ネ ノ ハ バ パ ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ ボ ポ マ ミ ム メ モ ャ ヤ ュ ユ ョ ヨ ラ リ ル レ ロ ヮ ワ ヰ ヱ ヲ ン ヴ ヵ ヶ ヷ ヸ ヹ ヺ ・ ー ヽ ヾ ヿ\n"
	"---------------------------------------------------------\n"
	"Kanji\n"
	"Unicode code points regex: [\\x3400-\\x4DB5\\x4E00-\\x9FCB\\xF900-\\xFA6A]\n"
	"Unicode block property regex: \\p{Han}\n"
	"Regex: ([㐀-䶵一-鿋豈-頻])\n\n"
	"漢字 日本語 文字 言語 言葉 etc. Too many characters to list.\n\n"
	"This regular expression will match all the kanji, including those used in Chinese.\n"
	"---------------------------------------------------------\n"
	"Kanji Radicals\n"
	"Unicode code points regex: [\\x2E80-\\x2FD5]\n"
	"Regex: ([⺀-⿕])\n\n"
	"⺀ ⺁ ⺂ ⺃ ⺄ ⺅ ⺆ ⺇ ⺈ ⺉ ⺊ ⺋ ⺌ ⺍ ⺎ ⺏ ⺐ ⺑ ⺒ ⺓ ⺔ ⺕ ⺖ ⺗ ⺘ ⺙ ⺚ ⺛ ⺜ ⺝ ⺞ ⺟ ⺠ ⺡ ⺢ ⺣ ⺤ ⺥ ⺦ ⺧ ⺨ ⺩ ⺪ ⺫ ⺬ ⺭ ⺮ ⺯ ⺰ ⺱ ⺲ ⺳ ⺴ ⺵ ⺶ ⺷ ⺸ ⺹ ⺺ ⺻ ⺼ ⺽ ⺾ ⺿ ⻀ ⻁ ⻂ ⻃ ⻄ ⻅ ⻆ ⻇ ⻈ ⻉ ⻊ ⻋ ⻌ ⻍ ⻎ ⻏ ⻐ ⻑ ⻒ ⻓ ⻔ ⻕ ⻖ ⻗ ⻘ ⻙ ⻚ ⻛ ⻜ ⻝ ⻞ ⻟ ⻠ ⻡ ⻢ ⻣ ⻤ ⻥ ⻦ ⻧ ⻨ ⻩ ⻪ ⻫ ⻬ ⻭ ⻮ ⻯ ⻰ ⻱ ⻲ ⻳\n"
	"⼀ ⼁ ⼂ ⼃ ⼄ ⼅ ⼆ ⼇ ⼈ ⼉ ⼊ ⼋ ⼌ ⼍ ⼎ ⼏ ⼐ ⼑ ⼒ ⼓ ⼔ ⼕ ⼖ ⼗ ⼘ ⼙ ⼚ ⼛ ⼜ ⼝ ⼞ ⼟ ⼠ ⼡ ⼢ ⼣ ⼤ ⼥ ⼦ ⼧ ⼨ ⼩ ⼪ ⼫ ⼬ ⼭ ⼮ ⼯ ⼰ ⼱ ⼲ ⼳ ⼴ ⼵ ⼶ ⼷ ⼸ ⼹ ⼺ ⼻ ⼼ ⼽ ⼾ ⼿ ⽀ ⽁ ⽂ ⽃ ⽄ ⽅ ⽆ ⽇ ⽈ ⽉ ⽊ ⽋ ⽌ ⽍ ⽎ ⽏ ⽐ ⽑ ⽒ ⽓ ⽔ ⽕ ⽖ ⽗ ⽘ ⽙ ⽚ ⽛ ⽜ ⽝ ⽞ ⽟ ⽠ ⽡ ⽢ ⽣ ⽤ ⽥ ⽦ ⽧ ⽨ ⽩ ⽪ ⽫ ⽬ ⽭ ⽮ ⽯ ⽰ ⽱ ⽲ ⽳ ⽴ ⽵ ⽶ ⽷ ⽸ ⽹ ⽺ ⽻ ⽼ ⽽ ⽾ ⽿ ⾀ ⾁ ⾂ ⾃ ⾄ ⾅ ⾆ ⾇ ⾈ ⾉ ⾊ ⾋ ⾌ ⾍ ⾎ ⾏ ⾐ ⾑ ⾒ ⾓ ⾔ ⾕ ⾖ ⾗ ⾘ ⾙ ⾚ ⾛ ⾜ ⾝ ⾞ ⾟ ⾠ ⾡ ⾢ ⾣ ⾤ ⾥ ⾦ ⾧ ⾨ ⾩ ⾪ ⾫ ⾬ ⾭ ⾮ ⾯ ⾰ ⾱ ⾲ ⾳ ⾴ ⾵ ⾶ ⾷ ⾸ ⾹ ⾺ ⾻ ⾼ ⾽ ⾾ ⾿ ⿀ ⿁ ⿂ ⿃ ⿄ ⿅ ⿆ ⿇ ⿈ ⿉ ⿊ ⿋ ⿌ ⿍ ⿎ ⿏ ⿐ ⿑ ⿒ ⿓ ⿔ ⿕\n"
	"---------------------------------------------------------\n"
	"Katakana and Punctuation (Half Width)\n"
	"Unicode code points regex: [\\xFF5F-\\xFF9F]\n"
	"Regex: ([｟-ﾝ])\n\n"
	"｟ ｠ ｡ ｢ ｣ ､ ･ ｦ ｧ ｨ ｩ ｪ ｫ ｬ ｭ ｮ ｯ ｰ ｱ ｲ ｳ ｴ ｵ ｶ ｷ ｸ ｹ ｺ ｻ ｼ ｽ ｾ ｿ ﾀ ﾁ ﾂ ﾃ ﾄ ﾅ ﾆ ﾇ ﾈ ﾉ ﾊ ﾋ ﾌ ﾍ ﾎ ﾏ ﾐ ﾑ ﾒ ﾓ ﾔ ﾕ ﾖ ﾗ ﾘ ﾙ ﾚ ﾛ ﾜ ﾝ ﾞ\n"
	"---------------------------------------------------------\n"
	"Japanese Symbols and Punctuation\n"
	"Unicode code points regex: [\\x3000-\\x303F]\n"
	"Regex: ([、-〿])\n\n"
	"、 。 〃 〄 々 〆 〇 〈 〉 《 》 「 」 『 』 【 】 〒 〓 〔 〕 〖 〗 〘 〙 〚 〛 〜 〝 〞 〟 〠 〡 〢 〣 〤 〥 〦 〧 〨 〩 〪 〫 〬 〭 〮 〯 〰 〱 〲 〳 〴 〵 〶 〷 〸 〹 〺 〻 〼 〽 〾 〿\n"
	"---------------------------------------------------------\n"
	"Miscellaneous Japanese Symbols and Characters\n"
	"Unicode code points regex: ([\\x31F0-\\x31FF\\x3220-\\x3243\\x3280-\\x337F])\n"
	"Regex: ([ㇰ-ㇿ㈠-㉃㊀-㍿])\n\n"
	"ㇰ ㇱ ㇲ ㇳ ㇴ ㇵ ㇶ ㇷ ㇸ ㇹ ㇺ ㇻ ㇼ ㇽ ㇾ ㇿ\n"
	"㈠ ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩ ㈪ ㈫ ㈬ ㈭ ㈮ ㈯ ㈰ ㈱ ㈲ ㈳ ㈴ ㈵ ㈶ ㈷ ㈸ ㈹ ㈺ ㈻ ㈼ ㈽ ㈾ ㈿ ㉀ ㉁ ㉂ ㉃\n"
	"㊀ ㊁ ㊂ ㊃ ㊄ ㊅ ㊆ ㊇ ㊈ ㊉ ㊊ ㊋ ㊌ ㊍ ㊎ ㊏ ㊐ ㊑ ㊒ ㊓ ㊔ ㊕ ㊖ ㊗ ㊘ ㊙ ㊚ ㊛ ㊜ ㊝ ㊞ ㊟ ㊠ ㊡ ㊢ ㊣ ㊤ ㊥ ㊦ ㊧ ㊨ ㊩ ㊪ ㊫ ㊬ ㊭ ㊮ ㊯ ㊰ ㊱ ㊲ ㊳ ㊴ ㊵ ㊶ ㊷ ㊸ ㊹ ㊺ ㊻ ㊼ ㊽ ㊾ ㊿\n"
	"㋀ ㋁ ㋂ ㋃ ㋄ ㋅ ㋆ ㋇ ㋈ ㋉ ㋊ ㋋  ㋐ ㋑ ㋒ ㋓ ㋔ ㋕ ㋖ ㋗ ㋘ ㋙ ㋚ ㋛ ㋜ ㋝ ㋞ ㋟ ㋠ ㋡ ㋢ ㋣ ㋤ ㋥ ㋦ ㋧ ㋨ ㋩ ㋪ ㋫ ㋬ ㋭ ㋮ ㋯ ㋰ ㋱ ㋲ ㋳ ㋴ ㋵ ㋶ ㋷ ㋸ ㋹ ㋺ ㋻ ㋼ ㋽ ㋾\n"
	"㌀ ㌁ ㌂ ㌃ ㌄ ㌅ ㌆ ㌇ ㌈ ㌉ ㌊ ㌋ ㌌ ㌍ ㌎ ㌏ ㌐ ㌑ ㌒ ㌓ ㌔ ㌕ ㌖ ㌗ ㌘ ㌙ ㌚ ㌛ ㌜ ㌝ ㌞ ㌟ ㌠ ㌡ ㌢ ㌣ ㌤ ㌥ ㌦ ㌧ ㌨ ㌩ ㌪ ㌫ ㌬ ㌭ ㌮ ㌯ ㌰ ㌱ ㌲ ㌳ ㌴ ㌵ ㌶ ㌷ ㌸ ㌹ ㌺ ㌻ ㌼ ㌽ ㌾ ㌿ ㍀ ㍁ ㍂ ㍃ ㍄ ㍅ ㍆ ㍇ ㍈ ㍉ ㍊ ㍋ ㍌ ㍍ ㍎ ㍏ ㍐ ㍑ ㍒ ㍓ ㍔ ㍕ ㍖ ㍗ ㍘ ㍙ ㍚ ㍛ ㍜ ㍝ ㍞ ㍟ ㍠ ㍡ ㍢ ㍣ ㍤ ㍥ ㍦ ㍧ ㍨ ㍩ ㍪ ㍫ ㍬ ㍭ ㍮ ㍯ ㍰ ㍱ ㍲ ㍳ ㍴ ㍵ ㍶  ㍻ ㍼ ㍽ ㍾ ㍿\n"
	"---------------------------------------------------------\n"
	"Alphanumeric and Punctuation (Full Width)\n"
	"Unicode code points regex: [\\xFF01-\\xFF5E]\n"
	"Regex: ([！-～])\n\n\n"
	"！ ＂ ＃ ＄ ％ ＆ ＇ （ ） ＊ ＋ ， － ． ／ ０ １ ２ ３ ４ ５ ６ ７ ８ ９ ： ； ＜ ＝ ＞ ？\n"
	"＠ Ａ Ｂ Ｃ Ｄ Ｅ Ｆ Ｇ Ｈ Ｉ Ｊ Ｋ Ｌ Ｍ Ｎ Ｏ Ｐ Ｑ Ｒ Ｓ Ｔ Ｕ Ｖ Ｗ Ｘ Ｙ Ｚ ［ ＼ ］ ＾ ＿\n"
	"｀ ａ ｂ ｃ ｄ ｅ ｆ ｇ ｈ ｉ ｊ ｋ ｌ ｍ ｎ ｏ ｐ ｑ ｒ ｓ ｔ ｕ ｖ ｗ ｘ ｙ ｚ ｛ ｜ ｝ ～\n"
	"---------------------------------------------------------\n"
	" \n\n\n")

matches = regex.finditer(test_str)

for match_num, match in enumerate(matches, start=1):
    print(f"Match {match_num} was found at {match.start()}-{match.end()}: {match.group()}")
    
    for group_num, group in enumerate(match.groups(), start=1):
        print(f"Group {group_num} found at {match.start(group_num)}-{match.end(group_num)}: {group}")
Please keep in mind that these code samples are automatically generated and are not guaranteed to work. If you find any syntax errors, feel free to submit a bug report. For a full regex reference for Python, please visit: https://docs.python.org/3/library/re.html
Regular Expressions 101

Save & Manage Regex

Flavor

Function

Tools

Explanation

Match Information

Quick Reference

Regular Expression
Processing...

Test String

Code Generator

Language

Generated Code

Save & Manage Regex

Flavor

Function

Tools

Explanation

Match Information

Quick Reference

Regular ExpressionProcessing...

Test String

Regular Expression
Processing...