文字列の中からカタカナを取得したくて調べて書いたコードです
今回書いたカタカナだけを抜き出す正規表現
/[゠-ヿ]+/g
コード.gsfunction get_katakana(){ var str = "abcABC123abcABC123かなカナカナ仮名ひらがなカタカナカタカナ漢字"; var pattern = /[゠-ヿ]+/g; var result = str.match(pattern); Logger.log(result); } | 意訳この機能がやること 探索対象の文字列を用意しておく カタカナのパターン 一致するものを探して ログに出す |
純粋にカタカナだけなら
Unicodeチャートのカタカナから
http://www.unicode.org/charts/PDF/U30A0.pdf
[ァ-ヶ]
まででよさそうですが ゠ から ヿ まで拾って
[゠-ヿ]
までとしました
ちなみに
゠ はダブルハイフンで wikipedia
ヿ は「こと」の組み合わせのようです wikipedia
文字列
var str = "abcABC123abcABC123かなカナカナ仮名ひらがなカタカナカタカナ漢字";
から
カナ, カタカナ
だけを match を使って取得したログです
参考
Unicode 10.0 Character Code Charts
http://www.unicode.org/charts/
katakana
http://www.unicode.org/charts/PDF/U30A0.pdf