Apps Scriptリファレンス: Apps Script Reference |障害・課題追跡: IssueTracker |Google Workspace: Status Dashboard - Summary

2019年1月19日土曜日

ドライブ内の画像ファイルをテキストに変換したい(OCR)


Google Drive内の画像ファイルをGoogleドキュメントで開くと、画像内のテキストを抽出することができます。PDF や写真のファイルをテキストに変換する


それをスクリプトで実現する方法を調べて試したので書き残しておきます。


事前準備



コード.gs
function get_ocr() {
  var id = "画像ファイルのID";
  var file = DriveApp.getFileById(id);
  var blob = file.getBlob();
  var name = file.getName();

  var file = {
    title: name,
    mimeType: 'image/png'
  };
  
  var option = {
    ocr: true
  }
  
  file = Drive.Files.insert(file, blob, option);
  var doc = DocumentApp.openByUrl(file.embedLink);
  var text = doc.getBody().getText();
  
  var docUrl = "https://docs.google.com/document/d/" + doc.getId() + "/edit";
  Logger.log(docUrl);
  Logger.log(text);
}


試してみる


スクリプトエディタのスクリーンショットを撮ってDriveにアップロードして、そのファイルを対象にやってみます。


Logger.log(docUrl)に出力したURLにアクセスすると
以下のようにテキストに変換されたドキュメントが開きます

function get_ocr() {
var id = " 771)LOID"; var file = DriveApp.getFileById(id); var blob = file.getBlob();
var file = {
title: "file_name", mimeType: 'image/png
var option = {
ocr: true
file = Drive. Files.insert(file, blob, option); var doc - DocumentApp.openByUrl(file.embedlink); var body = doc.getBody().getText():

var docUrl = "https://docs.google.com/document/d/" + doc.getId() + "/edit"; Logger.log(docUrl);


Latest post

Google Formsで記述式の質問に字数制限を設定したい

記述式の質問には「回答の検証」を設定することができます フォームの編集画面 右下の︙メニューで「回答の検証」を選択します 検証方法には「数値」「テキスト」「長さ」「正規表現」という種類があります 今回は字数制限したいので「長さ」を選びます 長さには「最大文字数」か「最小文字数」を...