Skip to content

mecab-ipadic-NEologdから人名の読み仮名と表記だけを抜き出したデータ

License

Notifications You must be signed in to change notification settings

s1r-J/jinmei-neologd

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

jinmei-neologd

mecab-ipadic-neologdの辞書データから人名だけを抜き出しました。
フリガナをキーとして、候補となる書き文字をリストで保持するようなJSON形式に整形しています。

Description

sei.jsonは姓のデータです。mei.jsonは名のデータです。
現在はmecab-user-dict-seed.20200130.csvからデータを抜き出しました。

scriptsフォルダ以下には人名データを抜き出してJSONに整形するスクリプト(Python)があります。
使い方は以下のとおりです。

  1. mecab-ipadic-neologdから辞書データをダウンロード、解凍します。
  2. scripts/jinmei_neologd.pyを実行します。(Python3)
python jinmei_neologd.py '~/mecab-user-dict-seed.yyyyMMdd.csv'

Usage

GitHub Pagesでサイトを作成しているので、 姓または名のリンクを押せばそれぞれのJSONファイルが返却されます。

Licence

Apache-2.0

Author

s1r-J

About

mecab-ipadic-NEologdから人名の読み仮名と表記だけを抜き出したデータ

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published