mecab-ipadic-neologdの辞書データから人名だけを抜き出しました。
フリガナをキーとして、候補となる書き文字をリストで保持するようなJSON形式に整形しています。
sei.json
は姓のデータです。mei.json
は名のデータです。
現在はmecab-user-dict-seed.20200130.csv
からデータを抜き出しました。
scriptsフォルダ以下には人名データを抜き出してJSONに整形するスクリプト(Python)があります。
使い方は以下のとおりです。
- mecab-ipadic-neologdから辞書データをダウンロード、解凍します。
- scripts/jinmei_neologd.pyを実行します。(Python3)
python jinmei_neologd.py '~/mecab-user-dict-seed.yyyyMMdd.csv'
GitHub Pagesでサイトを作成しているので、 姓または名のリンクを押せばそれぞれのJSONファイルが返却されます。