声で動画検索 産総研が実証サイト
IT Media News の記事
http://www.itmedia.co.jp/news/articles/0810/09/news013.html
http://www.itmedia.co.jp/news/articles/0810/09/news013.html
独立行政法人・産業技術総合研究所(産総研)は10月8日、動画を音声で検索できるサイト「VOISER」を公開した。独自の「ユニバーサル符号化技術」を活用。言語に依存せず、辞書不要の音声認識・検索技術を実装した。
ユニバーサル符号化技術とは、検索対象の音声と検索キーワードの音声をそれぞれ、音素より細かい単位「音素片」に分解・符号化し、それぞれをマッチングして高速に検索処理する仕組み。
従来の音声認識技術では、あらかじめ辞書登録した語しか検索できなかったが、ユニバーサル符号化技術なら辞書不要。新語や方言、外国語でも利用できる。辞書いらずのためシステムはコンパクトで、一般的なWebブラウザで利用できる。
サイトでは、産総研が保有している動画などを検索対象とし、音声やテキストで検索できる。ユーザーからの反応をもとに技術を改良。多方面から評価用コンテンツの提供を受けるなどして研究を進め、技術の実用化につなげるとしている。
Web上の動画・音声コンテンツの検索技術としての実用化のほか、コールセンターで録音した音声の検索や、放送事業者がコンテンツ検索する際に活用するといった応用を視野に入れる。
新技術は「産総研オープンラボ」(10月20日~21日、茨城県、産総研つくばセンター)で公開する。
なんだがよくわからないがすごい。メモ。