Showing posts with label 自然言語処理. Show all posts
Showing posts with label 自然言語処理. Show all posts

Thursday, May 12, 2016

Java: Kuromoji

Installation:

$ wget https://github.com/downloads/atilika/kuromoji/kuromoji-0.7.7.tar.gz
$ gzip -d kuromoji-0.7.7.tar.gz

$ tar -xvf kuromoji-0.7.7.tar

Command:

$ java -cp kuromoji-0.7.7/lib/kuromoji-0.7.7.jar  org.atilika.kuromoji.TokenizerRunner

強制わいせつの疑い、東大4年生の男を逮捕 「胸を触ったりお尻を触ったりしていません」と容疑を否認
強制 名詞,サ変接続,*,*,*,*,強制,キョウセイ,キョーセイ
わいせつ 名詞,一般,*,*,*,*,わいせつ,ワイセツ,ワイセツ
助詞,連体化,*,*,*,*,の,ノ,ノ
疑い 名詞,一般,*,*,*,*,疑い,ウタガイ,ウタガイ
記号,読点,*,*,*,*,、,、,、
東大 名詞,固有名詞,組織,*,*,*,東大,トウダイ,トーダイ
名詞,数,*,*,*,*,4,ヨン,ヨン
年生 名詞,接尾,助数詞,*,*,*,年生,ネンセイ,ネンセイ
助詞,連体化,*,*,*,*,の,ノ,ノ
名詞,一般,*,*,*,*,男,オトコ,オトコ
助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
逮捕 名詞,サ変接続,*,*,*,*,逮捕,タイホ,タイホ
  記号,空白,*,*,*,*, , , 
記号,括弧開,*,*,*,*,「,「,「
名詞,一般,*,*,*,*,胸,ムネ,ムネ
助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
触っ 動詞,自立,*,*,五段・ラ行,連用タ接続,触る,サワッ,サワッ
たり 助詞,並立助詞,*,*,*,*,たり,タリ,タリ
接頭詞,名詞接続,*,*,*,*,お,オ,オ
名詞,一般,*,*,*,*,尻,シリ,シリ
助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
触っ 動詞,自立,*,*,五段・ラ行,連用タ接続,触る,サワッ,サワッ
たり 助詞,並立助詞,*,*,*,*,たり,タリ,タリ
動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
助詞,接続助詞,*,*,*,*,て,テ,テ
動詞,非自立,*,*,一段,連用形,いる,イ,イ
ませ 助動詞,*,*,*,特殊・マス,未然形,ます,マセ,マセ
助動詞,*,*,*,不変化型,基本形,ん,ン,ン
記号,括弧閉,*,*,*,*,」,」,」
助詞,格助詞,引用,*,*,*,と,ト,ト
容疑 名詞,一般,*,*,*,*,容疑,ヨウギ,ヨーギ
助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
否認 名詞,サ変接続,*,*,*,*,否認,ヒニン,ヒニン