病気で声を失った患者の口元の動きから、話そうとしている内容を人工知能(AI)で推定し、本人そっくりの人工音声を流す「読唇アプリ」を、大阪大などの研究チームが開発した。
声帯を切除して声を失ってしまった場合、代替の発声方法として「食道発声」や「シャント発声」などがあるが、元の声とは異なる上、習得が難しく、体への負担も大きい。
研究チームは、話している口元の膨大な映像と、その動きに対応するコードをAIに学習させ、口元の動きをコードに変換、コードを自然な日本語に置き換える2段階のシステムで、話そうとしている言葉を推定できるようにした。
事前に録音した患者本人の声をもとに、人工音声でそっくりに再現するシステムも組み合わせ、アプリを完成させた。
語尾が不正確になりやすいなどの課題はあるが、大半は意味が伝わる会話ができたという。
【ネットの反応】
・こういう方面でAIは話題になって欲しいです
・まずつんくさんに使ってほしい
・前にトップガンで話題になってたやつみたいな感じ?
・AI技術も悪い事ばかりじゃないんだよな…
元記事はこちら:https://www.yomiuri.co.jp/science/20241126-OYT1T50054/