このリンクの本を購入して勉強中。
以下でここに書いてあるサンプルコードが少し登場します。
Neologdってなに?
簡単に言えば、新語が登録されているMecab用の辞書らしい。
例えば、以下のようにMaCabで辞書を指定せずに形態素解析実行した時に
import MeCab m_t = MeCab.Tagger('-Ochasen') text = '機械学習が好きです。' print(m_t.parse(test))
機械学習
という単語が上記で言う所の 新語
に当たり、 機械
と 学習
に分けられてしまう。
そこで、NEologd を使う。
macでNEologdのインストール(本題)
ここに全部書いてあるんだけど、実行したものだけ抽出。
動作に必要なライブラリのインストール $ brew install mecab mecab-ipadic git curl xz NEologdのGitHubのプロジェクトをclone(よく分からないところにcloneしたくないので、 user root に移動) $ cd $ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git 辞書のインストール $ ./bin/install-mecab-ipadic-neologd 途中でyesを入力
で完了。
ちなみに
以下のコマンドでインストール時のオプション一覧が取得できる。
$ ./bin/install-mecab-ipadic-neologd -h
-p
オプションを使うことで、インストール先のpathを指定出来るらしい。
↓で書いているが、毎度インストール先の確認をするもの面倒なので、指定しちゃうのはアリかも。
インストール後に困ったこと
MeCabで使う辞書を指定する時に、
import MeCab m_t = MeCab.Tagger('-Ochasen - d {dict_path}')
と、辞書をインストールしたpathを書いて上げる必要があった。
どこか分からん...
となった。
以下のコマンドでインストール先が分かる。
$ echo `mecab-config --dicdir`"/mecab-ipadic-neologd" (出力) /usr/local/lib/mecab/dic/mecab-ipadic-neologd