Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
data		data
db		db
eve_script		eve_script
out		out
script		script
LICENSE.md		LICENSE.md
README.md		README.md

Repository files navigation

汉字拼音表

根据网上资料整理的汉字拼音表，主要包括Unicode 0x4E00—0x9FA5中的汉字，其中一些韩国汉字、日本汉字不包含在内。

data目录是原始文本数据，其中hzpy-utf8.txt为汉字列表，每行6列，分别是：

注意：多音字每个读音单独一行。

simplified2traditional.txt是简繁转换表，第一列是简体Unicode编码，第二列是对应的繁体字Unicode编码。

db目录下的hanzi.db是sqlite3数据库，其中数据位于hanzi这个表中。这个数据库是用script中的store-hanzi.py创建的，该表共5列，结构如下：

eve_script目录主要是一个音节统计的脚本，其中包括元音统计，辅音统计等。

out目录即为统计后保存的结果