LANG SELRCT

コードを書く場所

2019年11月16日土曜日

正規表現を使って、漢字+ひらがな1文字で区切りたい


デモ文章
正規表現を使って、漢字+ひらがな1文字で区切ってみたくなった。


上記文章を以下のように区切りたくて

正規表現を,使っ,漢字,文字で,区切っ


作った正規表現がこちら

/[々〆〇〻㐂-頻]+[ぁ-ゟー]|[々〆〇〻㐂-頻]+/g



漢字以外も後ろのひらがなを1文字だけくっつけて区切ってみたくなった。

デモ文章
正規表現を使って、漢字+ひらがな1文字で区切ってみたくなった。漢字以外の文字でもカタカナやハンカクの文字やabcやABCは異なり、数字の1と1も違う。


このように区切りたくて
正規表現を,使っ,て,漢字,ひらがな,1,文字で,区切っ,てみたくなった,漢字以外の,文字で,も,カタカナや,ハンカクの,文字や,abcや,ABCは,異な,り,数字の,1と,1も,違う


書いた正規表現がこちら
/[々〆〇〻㐂-頻]+[ぁ-ゟー]|[々〆〇〻㐂-頻]+|[ぁ-ゟー]+|[゠-ヿ]+[ぁ-ゟー]|[゠-ヿ]|[ヲ-゚]+[ぁ-ゟー]|[゠-ヿ]|[a-zA-Z0-9]+[ぁ-ゟー]|[a-zA-Z0-9]|[a-zA-Z0-9]+[ぁ-ゟー]|[a-zA-Z0-9]/g



関連記事

テキストを漢字、ひらがな、カタカナ、半角カタカナ、半角英数、全角英数に分割したい


デモ環境
正規表現を書いてmatchで抽出する