「通帳AI-OCR」の開発に「医薬業界の経験」をフル活用
先日リリースしたShuttle Smileは、わずか 1分で 通帳1冊をExcelファイル化する「通帳 AI-OCRクラウド」です。
今日は、弊社の医薬業界で培った経験が、この「Shuttle Smile」に役立っていることについて書きます。
弊社は、医薬品の開発会社様(◯◯製薬、□□薬品など)向けの様々なシステムを開発しています。今日は、病院で受け取る検査表と銀行の預金通帳の共通点と認識・抽出に必要な技術について綴ります。
私達が病院で血液検査などを受けた時に、検査結果として検査表を受け取ります。
また、製薬会社が行う臨床試験(薬や治療法が人に安全で効くかを確かめるために、患者さんや健康な人に協力してもらって行う試験のこと)では、様々な検査値を取得し、その結果を検査表として製薬会社が受取ります。また、薬の副作用が発生した場合に、製薬会社は病院から検査表を受け取ることもあります。
これらの検査表は製薬会社で臨床試験用のデータベースや副作用を管理するためのデータベースに登録されます。電子的に受け取った場合は、直接、システムを介してデータベースに登録されますが、紙で受け取った場合は、人が検査表を見ながらパソコンに向かって検査年月日、検査項目名、検査値などを入力しています。
この入力作業は病気を治療するために必要な非常に重要なデータなので、入力間違いは許されません。しかし、膨大な検査表を人間が入力するのは手間と時間がかかります。そこで、この紙の検査表を短時間で正確に読み取って電子データ(例えば、ExcelファイルやCSVファイルなど)に自動変換する仕組みが必要となってきます。弊社は、この仕組みを生成AIを活用して開発しています。
一方、預金通帳も記帳するために、人間が読み取って、会計ソフトに手入力する必要があります。銀行口座と会計ソフトを連携しておけば、電子的に口座情報が会計ソフトに取り込めますが、様々な事情から銀行口座と会計ソフトを連携していない企業も多々おられます。
検査表と通帳の共通点を以下に記載してみます。
紙に印刷されている。
数列から構成される表形式である。
様式は様々である。(検査表も預金通帳も様式・記載表現が決まっていない)
非常に重要な情報である。
システムに取り込むため、電子データ(ExcelファイルやCSVファイルなど)に変換する必要がある。(臨床試験等のデータベース、会計ソフト)
検査表も通帳も共に「紙に印刷された表を読み取って電子データに変換する仕組み」ですので、同じ技術が適用できることが判ります。
私の娘婿が税理士事務所を経営しているのですが、娘婿から通帳の入力に手間がかかっている話を聞いて、これ、全く同じだよな。と思ったのです。
弊社は、様々な人工知能モデルを使用していることもあり、1年ほど前から生成AIによる表・文字の認識精度の向上が加速していることを感じています。
また、世界中で生成AIの性能向上の競争が激化していることもあり、認識速度の向上と人工知能モデルの利用料金が低下する傾向にあります。そこで、Shuttle Smileを開発した次第です。
しかし、人工知能の性能が向上すれば、表の数字や文字を安定して高精度に抽出できるかというと、そうでもないのが難しいところです。プロンプトの一字一句で認識・抽出精度が大きく変化することもあります。このあたりの難しさは、以下のブログで記載しています。
プロンプトエンジニアリング(その1) ・・・ 言葉の選択
プロンプトエンジニアリング(その2) ・・・ 指示する順序
プロンプトエンジニアリング(その3) ・・・ 限界
プロンプトエンジニアリング(その4) ・・・ 用語の定義
プロンプトエンジニアリング(その5) ・・・ 世話好きなChatGPT
プロンプトエンジニアリング(その6) ・・・ プロンプトの変更が及ぼす影響
弊社はプロンプトエンジニアリングを2年間ほど続けていますが、この経験が今回のShuttle Smileの開発に非常に役立っています。1万回以上、プロンプトを作り続けてきていますが、プロンプトエンジニアリングは奥が深い世界です。
また、プロンプトエンジニアリングだけでは解決できない課題も色々あります。以下はその一例です。
通帳画像データをどのようにして生成AIに渡すと認識精度が向上するのか
プロンプトエンジニアリングだけで解決できない場合は、どう対処すればよいのか
認識・抽出速度を上げるためにはどうすればよいのか
認識・抽出精度はどのように計測するのが合理的なのか
…
加えて、生成AIの活用だけでは、Shuttle Smileは開発できません。
税理士、記帳代行、中小企業の皆様に役立つExcelの形式は、どうあるべきか
税理士事務所の職員、パートタイマー、誰でも簡単に使えるようにするためにはどうすればよいか
多数のユーザが同時使用した場合に、クラウドサービスが耐えれるようにするためにはどうすればよいか
税理士、記帳代行、中小企業の皆様に役立つExcelの形式は、どうあるべきか
…
幸い、弊社は、これまでの知見に加えて、税理士の娘婿の税理士事務所で職員が毎日使用しながら改良を続けていますので、Shuttle Smileは、最強のクラウドサービスではないかと自負しております。
皆さん、是非、無料トライアルで体感してみてください。
少しでも、弊社の経験が記帳業務を楽にすることに繋がればと思いながら開発を続けています。
では、また。