2015-06-25 wikipediaからふりがなを抜き出す。 wikipediaから単語とふりがなを抜き出すプログラムを作りました。将来的にmecab辞書になります。 tamanobi/wikipediaFromFuriganagithub.com 作ってから気づいたのですが、IPAから新しい辞書が公開されていたようです。 新語が追加されたmecab-ipadic-neologd辞書 - 自然言語処理 on Macd.hatena.ne.jp mecab-ipadic-neologdがすごいという話 - kivantium活動日記kivantium.hateblo.jp