Yahoo WEBサービスには日本語文字列からキーワードを抜き出す「日本語形態素解析」の機能が提供されています。
例えば「私の名前は。」という文章を渡すと、文章を構成している単語に分割し、
その読み方、品詞を返します。
例)
私 > わたし (名詞)
の > の (助詞)
名前> なまえ (名詞)
は > は (助詞)
ここではその利用方法を紹介します。
1. Yahoo デベロッパーネットワークに登録
Yahoo! デベロッパーネットワーク
を表示し、
左側サイドメニューの「アプリケーションIDの登録」から登録します。
※詳細は画面の指示に従ってください。
※ここでのアプリケーションIDは "amstransit" とします。
2. 日本語形態素解析を試す
こちらのページにインターフェースが公開されています。
日本語形態素解析Webサービス
検索URI
http://api.jlp.yahoo.co.jp/MAService/V1/parse
必須パラメータ
解析対象テキスト:sentence
解析結果の種類:results ( "ma" の場合通常の形態素解析結果、"uniq" の場合形態素解析結果の出現頻度 )
アプリケーションID : appid
この仕様に従うと"私の名前はパワービーンズです。"を検索するクエリURLは
http://api.jlp.yahoo.co.jp/MAService/V1/parse?appid=amstransit&sentence=私の名前はパワービーンズです。&results=ma
となります。
このURLをURLエンコードすると
http://api.jlp.yahoo.co.jp/MAService/V1/parse?appid=amstransit&sentence=%E7%A7%81%E3%81%AE%E5%90%8D%E5%89%8D%E3%81%AF%E3%83%91%E3%83%AF%E3%83%BC%E3%83%93%E3%83%BC%E3%83%B3%E3%82%BA%E3%81%A7%E3%81%99%E3%80%82&results=ma
となります。
ためしに上記URLをブラウザのURL欄に入力してリクエストしてみてください。
以下のような検索結果がXMLで返却されます。
ここではJAVAとPHPでのサンプルを紹介します。
3. JAVAで形態素検索検索
サンプルコードを公開します。
YahooWebService クラス
実行結果
実行結果を見ると分かるように、単語の読み方も返します。
この読み方を取得する機能だけでも非常に有用かもしれません。
使い方次第では、視覚障害者向け音読ソフト、音読システム
の基本技術としての活用することもできそうです。
4. PHPで形態素検索検索
PHP版サンプルを公開します。
サイト名: 株式会社パワービーンズ
http://153.127.253.173
この記事のURL:
http://153.127.253.173/modules/wssamples/index.php?id=4