LANG SELRCT

Google Apps Scriptのコードを書く場所  (新規作成: スプレッドシート | スクリプトエディタ

2018年1月28日日曜日

正規表現で文章からカタカナだけを抜き出したい /[゠-ヿ]+/g


文字列の中からカタカナを取得したくて調べて書いたコードです

今回書いたカタカナだけを抜き出す正規表現

/[゠-ヿ]+/g



コード.gs
function get_katakana(){
  var str = "abcABC123abcABC123かなカナカナ仮名ひらがなカタカナカタカナ漢字";
  var pattern = /[゠-ヿ]+/g;
  var result = str.match(pattern);
  Logger.log(result);
}
意訳
この機能がやること
探索対象の文字列を用意しておく
カタカナのパターン
一致するものを探して
ログに出す




純粋にカタカナだけなら

Unicodeチャートのカタカナから
http://www.unicode.org/charts/PDF/U30A0.pdf

[ァ-ヶ]

まででよさそうですが ゠ から ヿ まで拾って

[゠-ヿ]

までとしました

ちなみに
 ゠ はダブルハイフンで wikipedia
 ヿ は「こと」の組み合わせのようです wikipedia

文字列
var str = "abcABC123abcABC123かなカナカナ仮名ひらがなカタカナカタカナ漢字";

から

カナ, カタカナ

だけを match を使って取得したログです





参考
Unicode 10.0 Character Code Charts
http://www.unicode.org/charts/

katakana
http://www.unicode.org/charts/PDF/U30A0.pdf

最新の投稿

JIRA APIで選択リスト(複数選択)を課題作成時に選択してPOSTしたい

JIRA APIを利用して選択リスト(複数選択)フィールドに値を入れたくて書いたコードです。 コード.gsのこの部分で複数選択の値を選択できました。 customfield_10043 は手元のJIRAでの選択リスト(複数選択)のフィールドIDなので、各自の環境によって異なります...