LANG SELRCT

Google Apps Scriptのコードを書く場所  (新規作成: スプレッドシート | スクリプトエディタ

2018年1月28日日曜日

正規表現で文章からひらがなだけを抜き出したい /[ぁ-ゟー]+/g


文字列の中からひらがなを取得したくて調べて書いたコードです

今回書いたひらがなだけを抜き出す正規表現

/[ぁ-ゟー]+/g



コード.gs
function get_hiragana(){
  var str = "abcABC123abcABC123かなカナカナ仮名ひらがなカタカナカタカナ漢字";
  var pattern = /[ぁ-ゟー]+/g;
  var result = str.match(pattern);
  Logger.log(result);
}
意訳
この機能がやること
探索対象の文字列を用意しておく
ひらがなのパターン
一致するものを探して
ログに出す




純粋にひらがなだけなら

Unicodeチャートのひらがなから
http://www.unicode.org/charts/PDF/U3040.pdf

[ぁ-ゟ]

まででよさそうですが長音の ー も一致させたくて

[ぁ-ゟー]

としました


ちなみに ゟ とは 「より」 の組み合わせらしいです wikipedia

文字列
var str = "abcABC123abcABC123かなカナカナ仮名ひらがなカタカナカタカナ漢字";

から

かな, ひらがな

だけを match を使って取得したログです





参考
Unicode 10.0 Character Code Charts
http://www.unicode.org/charts/

Hiragana
http://www.unicode.org/charts/PDF/U3040.pdf


最新の投稿

Google Apps Scriptでドキュメントに画像を配置したい(フォルダ内の複数画像)

Google Apps Scriptでドキュメントに画像を配置したい  では、ひとつの画像をドキュメントに配置しました。 今回は、特定のフォルダ内にある画像を一気に配置したくて書いたコードです。 画像が大きく見えるように画像サイズは1.2倍にしました。 コード.gs...