LANG SELRCT

コードを書く場所についてはこちら

2018年1月28日日曜日

正規表現で文章から全角記号を抜き出したい /[!-/:-@[-`{-~、-〜”’・]+/g


文字列の中から全角記号を取得したくて調べて書いたコードです
(すべての全角記号は網羅できていない)

Unicode表の中で全角記号はここからここまでという範囲はないため
それらしき範囲とそこから漏れた”’・を追加

 /[!-/:-@[-`{-~、-〜”’・]+/g



コード.gs
function get_symbols(){
  var str = "abcABC123#abcABC123?かなカナカナ仮名]ひらがなカタカナカタカナ漢字}⼀市ヶ谷代々木";
  var pattern = /[!-/:-@[-`{-~、-〜”’・]+/g;
  var result = str.match(pattern);
  Logger.log(result);
}
意訳
この機能がやること
探索対象の文字列を用意しておく
全角記号のパターン
一致するものを探して
ログに出す







参考
Unicode 10.0 Character Code Charts
http://www.unicode.org/charts/

Halfwidth and Fullwidth Forms