"遊んで食べて寝る"
というテキストを
[遊, んで, 食, べて, 寝, る]
に分解するコードを書き残しておきます
コード.gs
function split_text() { var str = "遊んで食べて寝る"; var pattern = /[々〆〇〻㐂-頻]+|[ぁ-ゟー]+|[゠-ヿ]+|[ヲ-゚]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+/g; var result = str.match(pattern); Logger.log(result); } |
意訳この機能がやること テキストを用意して どの単位で区切るか指定して 区切って ログに出す |
補足
ここで書いた正規表現は
漢字、ひらがな、カタカナ、半角カタカナ、半角英数、全角英数
の単位で分割するのでそれぞれどうなるか試すために
"漢字ひらがなカタカナカタカナabc123ABC123"
というテキストをstrに入れると
こうなります
関連記事
漢字、ひらがな、カタカナ、英数字を正規表現で区切る
ここで書いた正規表現は
漢字、ひらがな、カタカナ、半角カタカナ、半角英数、全角英数
の単位で分割するのでそれぞれどうなるか試すために
"漢字ひらがなカタカナカタカナabc123ABC123"
というテキストをstrに入れると
コード.gsfunction split_text() { var str = "漢字ひらがなカタカナカタカナabc123ABC123"; var pattern = /[々〆〇〻㐂-頻]+|[ぁ-ゟー]+|[゠-ヿ]+|[ヲ-゚]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+/g; var result = str.match(pattern); Logger.log(result); } |
こうなります
関連記事
漢字、ひらがな、カタカナ、英数字を正規表現で区切る