パスワードを忘れた? アカウント作成
818654 story
インターネット

ニコニコ動画やYouTubeの音声をテキスト化する「PodCastle」 15

ストーリー by headless
認識 部門より
あるAnonymous Coward 曰く、

産総研は、インターネット上の動画音声データを対象とした音声全文検索・書き起こしサービス「PodCastle」を一般公開し、音声情報検索技術の実証実験を開始した(プレスリリース)。

音声認識技術によって動画音声データをテキスト化し、誤りをユーザーに訂正してもらうことで認識結果だけでなく認識精度も向上していくというもの。産総研では2008年から日本語のポッドキャストを対象とした音声全文検索サービスを公開し、ユーザーの協力により認識精度が向上することを実証していた。今回はポッドキャストに加えてニコニコ動画、YouTube、Ustreamに対応し、日本語英語の音声認識および検索が可能となっている。

実際の認識例を見ると、報道系などについては比較的精度良くテキスト化できているが、トーク番組などのバラエティ系はあまり精度が高くないように見受けられる。ユーザーの訂正により、認識精度はどれぐらい向上するのだろうか。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by vikke (8037) on 2011年10月15日 17時09分 (#2035107) 日記

    同じ内容の開発をカタログって会社がやってたんだけど、さっきサイトを見ようとしたら、サイト [catalog.to]が無くなってたでござるの巻。

    --
    安易なAC発言反対運動中
  • by deleted user (13014) on 2011年10月16日 0時09分 (#2035207)

    日本語の音声情報検索技術は使い物にならないとわかりました。ありがとうございました。

    • by Anonymous Coward

      ×日本語の音声情報検索技術は使い物にならないとわかりました。ありがとうございました。
      ○日本語に限らず会話音声認識技術が難しいことは昔から知っていました。がんばってください。

      • by Anonymous Coward

        下手に昔のことを知ってるからそんなふうに思い込まされて予算巻き上げられてんじゃないの?

        • by Anonymous Coward

          研究のセンスの問題だろうね
          この種の手法はやれば何かの結果は出てくるだろうが、音声認識の基本原理の進歩に寄与するようなものじゃない
          どちらかといえば、メーカーの製品開発レベルの段階でやるような仕事でしょう
          あえて産総研でやるのなら製品化まで持っていかないと

  • とおもいました 英語のチュートリアル動画とか書き起こすのに使いたいので
  • by Anonymous Coward on 2011年10月16日 18時17分 (#2035417)

    まったく言葉の形態をなしてなかった

typodupeerror

長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds

読み込み中...