マサチューセッツ工科大学(MIT)の研究者は、観察を通して学び、子供の言語獲得プロセスを模倣し、コンピューティング能力を大幅に拡張する可能性のあるセマンティックパーサーを開発しました。
伝統的に、語学学習のコンピュータシステムは、人間が構造と言語の意味の注釈を付けた文章を用いて訓練されています。これらの方法は、「Amazon」、「Google」などのWeb検索、自然言語データベースのクエリ、および仮想アシスタントをサポートしています。
このデータアノテーションプロセスは、しばしば時間がかかり、画像に正しくラベルを付ける方法や、自然な発話パターンを正確に反映する方法の複雑さを増大させることがあります。
これらの問題に取り組むために、MITの研究者は、簡単な観察によって言語の構造を学習する自然言語処理パーサーを開発しました。
そのパーサーは、約400の字幕付きのビデオを見て、その言葉を記録されたオブジェクトとアクションに関連付けます。その後、言語の構造についての学びを用いて、新しい文章の意味を正確に予測することができます。
研究者によると、この新しいアプローチは、使用できるデータの種類を広げ、パーサーを訓練するのに必要な労力を減らすことができます。注釈付きのいくつかの文章を、より簡単に取得したキャプション付きのビデオと組み合わせて、パフォーマンスを向上させることができる、”軽い管理”のアプローチです。
このプロセスは、将来人間と個人のロボットとの自然な相互作用を改善し、ロボットが周囲の相互作用を常に観察し、学ぶことを可能にします。
今後、研究者は、受動的観察と同様に、相互作用のモデリングを目指し、子供がどのように環境とやりとりしながら学んでいくのかを再び探求していきます。
(画像引用:https://internetofbusiness.com/mit-semantic-parser-learns-like-child/)