パスワードを忘れた? アカウント作成
11784032 story
インターネット

NTTレゾナント、日本語形態解析APIを公開 12

ストーリー by hylom
デカいデータベースに期待 部門より
あるAnonymous Coward 曰く、

12月3日、NTTレゾナントは日本語の形態解析APIをgooラボで公開した(ITmediaニュースリリース)。

今まではMecabやChaSenといった日本語形態解析エンジンがあったが、技術及びデータベースについてどちらが優れているのだろうか。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 類似サービス (スコア:5, 参考になる)

    by ioaia (40657) on 2014年12月04日 18時12分 (#2722446) ホームページ

    似たようなWebで公開されている形態素解析APIと言うとYahooのデペロッパーネットワーク [yahoo.co.jp]で公開されているものや、MeCabを使えるようにしたMECAPI [chalow.net]なんてのがありますね。
    機能的にはどれもあまり変わらないように見える(yahooのが少し高機能?)ので、比較としては未知語の処理とか辞書の収録語数とかってことになるんでしょうかね。

    • by Anonymous Coward

      こういうのって、辞書が古いと最近のトレンドを分析するのには不適だよね。
      「けいおん」読み込ませたら「けい」「おん」とか返されてもね。

  • by Anonymous Coward on 2014年12月04日 17時03分 (#2722413)

    機械学習のために、形態素解析サービスという名目にしておいてPOSTされた文章を集めるのが主目的なのでは。
    規約にアクセスログ以外での入力情報の扱いについての記述が一切ないのはどうなの?

    https://labs.goo.ne.jp/apiterm/ [goo.ne.jp]

    当社は、利用登録にあたりお客様が登録されたID、お客様によるgooラボおよび本APIへのアクセスログおよびお客様が本APIを通じて当社またはgooラボの提供に必要なサーバに送信された情報を記録・保管しています。これはgooラボの利用傾向の分析、運営および管理のために使用するためであり、個人特定情報の収集のために利用することはありません。

  • 形態素解析とは
    1.文字列を最小単位(形態素)に分割する。
    2.各形態素を原型に復元する。
    3.各形態素に品詞を付与する。
    処理なのでねえ。 

    タイトルの
    ”形態素解析API:日本語文字列を語句に分割する技術” 
    の時点で大きく間違っているので、.内容も推して知るべし。
  • by Anonymous Coward on 2014年12月04日 23時42分 (#2722615)

    >NTTレゾナント
    そういえば、RENAってどこに消えた?

  • by Anonymous Coward on 2014年12月04日 16時05分 (#2722361)

    形態素解析なら知ってる。

  • by Anonymous Coward on 2014年12月04日 16時07分 (#2722364)

    Mecab [google.com]やChaSen [naist.jp]はローカルにセットアップしてるかうタイプで
    件のはオンラインAPIでサーバー型ですよね

    Mecabなんかは棒読みちゃん [usamimi.info]などで
    一般実績ありますけど
    件のは精度を確かめることができません

    現時点では実績など使い勝手として
    一般の自由度皆無な件のは論外かなと

    棒読みちゃんなどのフロントエンドが対応しないと
    一般には忘れ去られるだけだと思います

    業務用としての利用なら
    音声認識を補完する位置づけになるかもだけれど

    てわけで中の人とかでないと
    評価のしようがなさそうなんですが
    何をもって比較すればいいのやら

    • by Anonymous Coward

      「件の」がゲシュタルト崩壊

  • by Anonymous Coward on 2014年12月04日 16時51分 (#2722405)

    不注意なユーザから面白い情報が収集できるといいですね(笑)

typodupeerror

アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家

読み込み中...