Googleドキュメントの「画像からの文字起こし」の実力を「武道館」で試してみた
Googleドキュメントに写真や画像をアップすると、その写真から文字起こしできることをご存じですか? つまり映っている看板などから、そこに映っている文字をテキストに変換できます。 【画像でわかる】意外と知らない、iPhone 8がいまでも中古市場で人気な理由 そこで、どうしても気になったのが「武道館の看板」を文字起こしできるのか。武道館の看板はかなりの達筆ですし、右から左に進む読み方で書かれています。また白地に黒で書かれた文字ではないのに、読み取りづらそうな感じがします。 達筆かつ現代的な日本語と違う書き方で書かれた「武道館」を読み取れたら、さすがGoogle!という感じがします。そこで「武道館」の写真を撮りに、友人と一緒に武道館に行って、写真を撮って試してみました。
【前知識】Googleドキュメントで写真や画像から文字起こしする手順
まず前知識としてお伝えすると、Googleドキュメントの文字起こしは非常に簡単。事前準備としては、Googleアカウントを作成しておくことと、文字起こししたい画像を用意しておくことです。 ■【1】Googleドライブに画像ファイル・PDFをアップする
Googleドライブを開き、左上の①「新規」をクリックします。
②「ファイルのアップロード」をクリックし、テキスト化したいファイルをアップロードしましょう。 ■【2】Googleドキュメントでファイルを開く
アップロードしたファイルの上で右クリック、もしくは「・・・」ボタンをクリックし、③「アプリで開く」→④「Google」ドキュメントをクリックします。以上でテキスト化されたデータが作成されます。
武道館に行って、Googleドキュメントの文字起こしのクオリティを検証
Googleドキュメントで比較的簡単に文字起こしできるのは、前述の通りです。すると気になるのが「どれくらいの難易度の文字起こしができるのか」。 そこで試したのは、武道館で撮影したこちらの写真。「武道館」の入り口で撮った写真なのですが、武道館の文字が達筆だったり、右から左に向かって書かれていてそもそも現代的な書き方をしていない点が特徴。 また同日は「つばきファクトリー」のライブが開催されていて、武道館の看板の下方にライブツアーのタイトルなどが書かれています。達筆な「武道館」と打って変わって、ポップな仕上がりの看板をどこまで読み取れるのかも気がかりですね。 ちなみに写真内にある主な文字情報をまとめると、以下の通り。 ・武道館 ・つばきファクトリー コンサートツアー 2024 Spring ・C’mon Everybody ・西2 結果として、Googleドキュメントでは以下の文字情報が認識されました。 ・Tsubaki Factory(つばきファクトリー) ・Concert Tour 2024 Spring(コンサートツアー 2024 Spring) ・C’mon ・日本武道館 ・西2 写真内のすべての文字情報が認識されたとは言えませんが、それでもかなりの性能です。特に水色の看板に「濃い青色」で書かれた、一見すると視認性が悪い文字情報まで写真から読み取って文字起こししていることには大きな驚きを感じました。 一方で「武道館」の赤い看板を読み取ることは、Googleドキュメントではできませんでした。「日本武道館」の文字列は、武道館の入口や「つばきファクトリー」の水色の看板の中から読み取られた文字列と思われます。 つまり超達筆で右から左に書かれた「武道館」を読み取ることは、今回の検証の限りではGoogleドキュメントでは難しそうでした。 ■手書き文字の文字起こし せっかくなので、追加検証としてお世辞でもこれまで一度も「字が綺麗」と言われたことのない筆者の文字を文字起こししてみました。