どないブログ

なんでも書く

macでNEologdのインストール

このリンクの本を購入して勉強中。

以下でここに書いてあるサンプルコードが少し登場します。

github.com

Neologdってなに?

簡単に言えば、新語が登録されているMecab用の辞書らしい。

例えば、以下のようにMaCabで辞書を指定せずに形態素解析実行した時に

import MeCab

m_t = MeCab.Tagger('-Ochasen')
text = '機械学習が好きです。'

print(m_t.parse(test))

機械学習 という単語が上記で言う所の 新語 に当たり、 機械学習 に分けられてしまう。

そこで、NEologd を使う。

macでNEologdのインストール(本題)

github.com

ここに全部書いてあるんだけど、実行したものだけ抽出。

動作に必要なライブラリのインストール
$ brew install mecab mecab-ipadic git curl xz

NEologdのGitHubのプロジェクトをclone(よく分からないところにcloneしたくないので、 user root に移動)
$ cd
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git

辞書のインストール
$ ./bin/install-mecab-ipadic-neologd
途中でyesを入力

で完了。

ちなみに

以下のコマンドでインストール時のオプション一覧が取得できる。

$ ./bin/install-mecab-ipadic-neologd -h

-p オプションを使うことで、インストール先のpathを指定出来るらしい。

↓で書いているが、毎度インストール先の確認をするもの面倒なので、指定しちゃうのはアリかも。

インストール後に困ったこと

MeCabで使う辞書を指定する時に、

import MeCab
m_t = MeCab.Tagger('-Ochasen - d {dict_path}')

と、辞書をインストールしたpathを書いて上げる必要があった。

どこか分からん...

となった。

以下のコマンドでインストール先が分かる。

$ echo `mecab-config --dicdir`"/mecab-ipadic-neologd"

(出力) /usr/local/lib/mecab/dic/mecab-ipadic-neologd