Yahoo WEBサービスには日本語文字列からキーワードを抜き出す「日本語形態素解析」の機能が提供されています。
例えば「私の名前は。」という文章を渡すと、文章を構成している単語に分割し、
その読み方、品詞を返します。

例)
 私 > わたし (名詞)
 の > の (助詞)
 名前> なまえ (名詞)
 は > は (助詞)

ここではその利用方法を紹介します。

1. Yahoo デベロッパーネットワークに登録

Yahoo! デベロッパーネットワークを表示し、
左側サイドメニューの「アプリケーションIDの登録」から登録します。
※詳細は画面の指示に従ってください。
※ここでのアプリケーションIDは "amstransit" とします。

2. 日本語形態素解析を試す

こちらのページにインターフェースが公開されています。
日本語形態素解析Webサービス

検索URI
 http://api.jlp.yahoo.co.jp/MAService/V1/parse
必須パラメータ
 解析対象テキスト:sentence
 解析結果の種類:results ( "ma" の場合通常の形態素解析結果、"uniq" の場合形態素解析結果の出現頻度 )
 アプリケーションID : appid

この仕様に従うと"私の名前はパワービーンズです。"を検索するクエリURLは
http://api.jlp.yahoo.co.jp/MAService/V1/parse?appid=amstransit&sentence=私の名前はパワービーンズです。&results=ma
となります。
このURLをURLエンコードすると
http://api.jlp.yahoo.co.jp/MAService/V1/parse?appid=amstransit&sentence=%E7%A7%81%E3%81%AE%E5%90%8D%E5%89%8D%E3%81%AF%E3%83%91%E3%83%AF%E3%83%BC%E3%83%93%E3%83%BC%E3%83%B3%E3%82%BA%E3%81%A7%E3%81%99%E3%80%82&results=ma
となります。

ためしに上記URLをブラウザのURL欄に入力してリクエストしてみてください。
以下のような検索結果がXMLで返却されます。


ここではJAVAとPHPでのサンプルを紹介します。

3. JAVAで形態素検索検索

サンプルコードを公開します。

YahooWebService クラス


実行結果


実行結果を見ると分かるように、単語の読み方も返します。
この読み方を取得する機能だけでも非常に有用かもしれません。
使い方次第では、視覚障害者向け音読ソフト、音読システム
の基本技術としての活用することもできそうです。

4. PHPで形態素検索検索

PHP版サンプルを公開します。




サイト名: 株式会社パワービーンズ   http://153.127.253.173
この記事のURL:   http://153.127.253.173/modules/wssamples/index.php?id=4