コラム

文字起こしAIの最終目標は人事評価? AI文字起こしサービス「Rimo」が目指す真の業務DXとは

AI Start Lab 編集部 2022.6.20
CONTENTS
  1. 日本語AI文字起こしサービスの現在地
  2. 昔から文字起こしの記録は資産
  3. コロナ禍で露呈した日本的人事評価の矛盾
  4. 飛び抜けて精度の高いAIはもはや存在しない
  5. 文字起こしAIがもたらす未来図
このところ、AIによる動画や音声からの日本語文字起こしサービスや、議事録サービスが話題となっている。

そんな群雄割拠の中で、独自の日本語解析技術を持つ「Rimo」(リモ)というサービスが話題だ。

Rimoは、音声や動画などのデータや動画配信サイトのURLなどの音声データをAIで解析し、日本語テキストデータを生成するクラウドサービス。リリース以来、常に日本語解析精度のアップデートが続けられており、ユーザー自身で誤った表現をフィードバックすることで精度が高くパーソナライズされていく。独自の辞書を追加してユーザーごとに特化した専門的な文字起こしAIに育てることも可能だ。

しかし、Rimo合同会社代表の相川直視(あいかわなおよし)氏によれば、「Rimoが行う日本語文字起こしは手段のひとつ。真の目的は起こした後のデータの活用にあります」という。Rimoが実現する文字起こしの先にある業務DXとはなんなのか。


日本語AI文字起こしサービスの現在地


そもそも文字起こしAIは、「音響モデル」と「言語モデル」という2つのモデルによって実現されている。

録音された音声データは最初から文字や言語として認識されるわけではなく、パソコンから見ればただの音の波形でしかない。その特徴を学習データなどから分析し、音声としてどんなことを言っているのかを認識するのが「音響モデル」、その音声を各言語の辞書に照らし合わせて、単語や文章として最も最適と思われるものを選んでテキスト化するのが「言語モデル」だ。日本語なら日本語に、英語なら英語に、中国語なら中国語にそれぞれ変換される。

日本語が他の言語と比べて複雑なのは、アルファベットのように単語単位だけでなく、かな漢字変換が必要な点。ここが日本語に特化したAI文字起こしサービスが必要な理由でもあるが、だからこそ勝機もあると、グーグル日本法人出身の相川氏は言う。

音声認識AIにはGAFAも取り組んでいて、彼らには資金もあり、抱えているユーザーも多いです。たとえばGoogleなどは、1回の深層学習に1億円とかをかけて実施していますので、到底太刀打ちできません。しかし、日本の人口は世界人口70億人の中のわずか2%弱。Googleからすればインドや中国向けに作った方がいいわけです。

だからこそ、文字起こしの領域で日本語だけに特化したサービスは、彼らとも十分に戦えますし、ビジネスチャンスになります」

昔から文字起こしの記録は資産


実際に、編集部でもデモを使わせていただいたところ、話者が明確に分かれていて文語調の整った会議や会話では、非常に高い精度で文字起こしが完了した。

また、リアルタイムに会話を起こすこともでき、企画会議などで使ってみた印象では、高い精度で文字起こしできた。特定の単語や人名など、誤解を招くような言葉で迷うこともあるものの、大枠では十分に実用的と言えるだろう。

Rimoのインターフェース

そもそも、音声をテキストに変換するニーズは昔からあった。国会の委員会などでは「速記者」と呼ばれる専門職が一言一句漏らさずに、独自の表記方法で国に関わるあらゆる発言を保存し、のちにテキストとして保存してきた。ただ、その用途は限定的でもあった。

「コールセンターなどで録音データを保存することがありますが、証拠として残す以外に意外と使い道がない。それを解析可能な意味のあるテキストにして残しておくことで、もしかしたら将来的には誰が何を話していたかをより高精度に解析できるようになるかもしれない。そうなれば、テキストは資産として活用できるようになります」
文字起こししたデータは、クラウド上で修正することで、用語学習にもつながる


コロナ禍で露呈した日本的人事評価の矛盾


実は、相川氏が「Rimo」で音声をすべてテキスト化したい理由は、働き方改革に活かしたいからだという。そのことを痛感したのが、新型コロナウイルスによるリモートワークで見えてきた、日本の評価制度の弊害だったという。

「たとえばリモートワークで成果を上げていたとしても、『いつも会社にいないから仕事しづらい』といった、人間的な部分で評価が下がることもあります。結局人は、よく話をしている人を高く評価しがちだったりするんですよね。こういった属人的な人事評価をAIで判断したいと考えているんです」
 
一般的な会社組織はマネージャーと一般社員がいるが、人事評価する上司が各社員のすべての行動や言動を把握し、成果と結びつけることは不可能だ。そのため、日々の勤務態度や人間性などで評価するケースも多くなる。

では、もしその人の作業とミーティングをすべて見ることができて、どんな発言をしているのかをすべて把握できたとしたら──そのために、あらゆる会議を可視化し、人にはできない発言や態度の分析をAIにやらせるというのが、相川氏が考える「Rimo」の未来の姿だ。
話者を判別して区切る機能は、社内会議などで活躍する。話者に名前をつけることも可能

「会社が階層構造になっている理由は、社長や代表者の指示を隅々まで理解させて伝達するため。でも、いまや社内ツールでつぶやけば、社長であれ一般社員であれダイレクトに伝えられます。そうなったらマネージャーに求められることは、上意下達に部下に情報を伝えることではなく、社員を評価することだと思うんです」

評価すべきは、ある製品が売れたり、世の中で役に立つことであって、他人を蹴落としたり自分のミスを隠したりすることに無駄な時間を割くような、社内政治的な動きは必要ない。

そのために、「Rimo」であらゆる社内の会議をテキスト化=可視化する。その次の段階では、AIによって今回の会議で決まったことや先送りになったことなどを要約して抜き出す。そしてさらに、誰がどんな仕事をこなしているかを客観的に評価する。

こうした評価システムが根付けば、「社長の肝入り」といった価値は薄れ、社内の人望が厚い人物などもきちんと評価されるようになるかもしれない。


飛び抜けて精度の高いAIはもはや存在しない


こうした未来像を目指して開発されている「Rimo」は、どれくらい特別なAIアルゴリズムを持っているのかとうかがってみたところ、意外にも「もう特別なAI技術なんてものはないんです」と相川氏は言う。

相川氏が例として出したのは、論文とプログラムコードがセットになっており、誰もが最新のAIとコードを閲覧できる『Paper With Code』というサイトだ。横軸が時間経過で、縦軸がエラー率。下にいくほどエラーが減り精度が高いことを意味する。

「たとえば、『Speech Recognition』という領域の「WSJ」(ウォールストリートジャーナル)を見てみると、2015年頃記録が始まってから、2019年くらいでエラーレートが2%を切っています。つまり、ウォールストリートジャーナルの記事に関して、認識率は98%ということです。他にもノイズなどが含まれたより現実の環境に近い音声認識のデータセットはありますが、どのデータセットでも毎年数%の改善はあるので、数年もすれば98%を達成するのではないでしょうか?」

「ウォールストリートジャーナル」の解析結果(https://paperswithcode.com/sota/speech-recognition-on-wsj-eval92


論文とコードがセットになっているということは、実際にこのAIの精度を誰でも試せる。つまり、AIを専門にしている人であれば、音声認識の精度がいまどれくらいなのかは、すぐにわかるのだ。

では、「Rimo」は他のサービスとどのように差別化しているのか。

「論文の精度は当然そのデータセットで算出した値です。なので、他の人が他のデータセットを用いれば数値も変わります。私たちが取り組んでいるのはその部分の精度です。さまざまな文章の違いをとにかく愚直に鍛える作業をしています」


文字起こしAIがもたらす未来図


現在の文字起こしAIは、音声データをPCなどで活用しやすい文字データに置き換えるという作業しかしていない。しかし、将来は扱えるメディア自体も変わっていくだろうと、相川氏は予想する。

「今の技術ではテキストデータが解析に便利ですが、以前は写真とテキストばかりだったレシピサイトなどは、ほとんどが動画に対応しています。もっと未来になれば、動画も音声も直接解析できるようになっているかもしれませんね」

日本語に特化した文字起こしAIの「Rimo」は、単なるデータ化にとどまらず、人事評価といった一見関連が薄そうにも思える、広範囲な使い道を実現するための通過点に過ぎない。

「AI」という言葉だけでサービスに価値が生まれる時期は終わろうとしている。「AI」を用いて実現できる業務・社会はどんなものかを考えていくことこそが、これからのAIに求められるようになっていくだろう。

Rimo
https://rimo.app/
Rimo合同会社
https://rimo.app/about/company

印刷ページを表示
WRITTEN by

AI Start Lab 編集部

AI・人工知能のビジネス活用についての情報をさまざまな視点からお伝えしていきます。

AIのビジネス活用に関する
最新情報をお届け

会員登録

会員登録していただくと、最新記事やAI関連のイベント情報を受け取れたり、その他会員限定コンテンツの閲覧が可能です。是非ご登録ください。