AI、細川家文書を解読 「崩し字」5万枚、熊本大など
熊本大とTOPPANが、人工知能(AI)を使ったシステムで、専門家でも解読が困難な「崩し字」で記載された約5万枚の未解読の古文書を読み解いた。約950万字の漢字や片仮名をテキスト化した。キーワード検索もできる。一般公開も検討中で、国内に数十億点残るとされる古文書の解明に活用したいとしている。 同大と同社は2023年4月、古文書の電子データ化に着手。熊本大は公益財団法人「永青文庫」から寄託された細川家関連の古文書のうち、江戸時代前期の細川藩の業務日誌の一種「奉行所日帳」など約90年分を約1カ月かけて解読した。成果をまとめ、7月下旬に公表した。 作成したデータを使い「大雨」「地震」など災害に関する言葉を検索すると、300を超える記述があり、これまで知られていなかった洪水や飢饉などの記録も見つかった。防災研究の発展に資する可能性があるといい、同大は今後、古文書から当時の災害対応を読み解く研究を進める。
研究プロジェクトを指揮する稲葉継陽教授は「崩し字は古文書活用の大きな障壁になっている」と期待した。