LANG SELRCT

Apps Script Reference  (Create: Create new Spreadsheet | Create new Apps Script

Sunday, January 28, 2018

正規表現で文章から半角カタカナだけを抜き出したい /[ヲ-゚]+/g


文字列の中から半角カタカナを取得したくて調べて書いたコードです

今回書いた半角カタカナだけを抜き出す正規表現

/[ヲ-゚]+/g



コード.gs
function get_halfkatakana(){
  var str = "abcABC123abcABC123かなカナカナ仮名ひらがなカタカナカタカナ漢字";
  var pattern = /[ヲ-゚]+/g;
  var result = str.match(pattern);
  Logger.log(result);
}
意訳
この機能がやること
探索対象の文字列を用意しておく
半角カタカナのパターン
一致するものを探して
ログに出す






Unicodeチャートの半角カタカナから
http://www.unicode.org/charts/PDF/UFF00.pdf

[ヲ-゚]

としました

ヲ は FF66 です
FF67 の ァ が先頭かと思いきや ヲ が半角カタカナの先頭のよう


文字列
var str = "abcABC123abcABC123かなカナカナ仮名ひらがなカタカナカタカナ漢字";

から

カナ, カタカナ

だけを match を使って取得したログです





参考
Unicode 10.0 Character Code Charts
http://www.unicode.org/charts/

Halfwidth Katakana
http://www.unicode.org/charts/PDF/UFF00.pdf

Latest post

Extracting data from Google Sheets with regular expressions

Introduction Regular expressions are a powerful tool that can be used to extract data from text.  In Google Sheets, regular expressions ca...