CentOSにMeCabをインストールする
白ヤギコーポレーションが公開しているモデルを使用する際に、pipで色々インストールするほかにサーバの方にMeCabをインストールしておく必要があります。インストールしないとエラーになったので多分そうだと思います。
前提¶
- CentOS7
- python 3.6.13
- pip 21.2.4
MeCab のインストール¶
sudo yum install -y https://packages.groonga.org/centos/groonga-release-latest.noarch.rpm
sudo yum makecache
sudo yum install -y mecab mecab-ipadic mecab-devel
gensimのインストール¶
gensimが4.0以降のやつを使うと、よくエラーになるので、3.8.3をインストールにします。 ※エラーになる理由はわかってません。やる気が出たときにデバッグします。
モデルの取得¶
wget http://public.shiroyagi.s3.amazonaws.com/latest-ja-word2vec-gensim-model.zip
unzip latest-ja-word2vec-gensim-model.zip
確認¶
word2vec.gensim.model
と同じ階層に以下コードを書いたpythonファイルを置く。
from gensim.models.word2vec import Word2Vec
model_path = '/path/to/word2vec.gensim.model'
model = Word2Vec.load(model_path)