Skip to content

Latest commit

 

History

History
433 lines (407 loc) · 9.11 KB

ni_dic_stat.md

File metadata and controls

433 lines (407 loc) · 9.11 KB

NIA 사전 통계 정보

전체 사전 품사별 단어 통계량

  • 중복 단어 제거
  • 예) sk 텔레콤, sk텔레콤...

##                       h_tag      N      percent
##  1:                    동사 149465 3.939354e+01
##  2:                보통명사 226290 5.964182e+01
##  3:                연결어미    472 1.244020e-01
##  4:                종결어미    202 5.323986e-02
##  5:              선어말어미     14 3.689891e-03
##  6:                전성어미     57 1.502313e-02
##  7:                  감탄사    195 5.139491e-02
##  8:                  격조사    184 4.849571e-02
##  9:                  보조사     13 3.426327e-03
## 10:                    부사   2149 5.663983e-01
## 11:                  관형사     58 1.528669e-02
## 12:                의존명사     78 2.055796e-02
## 13:                    수사    118 3.110051e-02
## 14:                  대명사     52 1.370531e-02
## 15:                  접미사     16 4.217018e-03
## 16:                  외국어     24 6.325527e-03
## 17:                    쉼표      1 2.635636e-04
## 18: 여는 따옴표 또는 묶음표      1 2.635636e-04
## 19:                단위기호      1 2.635636e-04
## 20:                기타기호     24 6.325527e-03
## 21:                  이음표      1 2.635636e-04
##                       h_tag      N      percent
h_tag N percent
보통명사 226290 59.6418170
동사 149465 39.3935401
부사 2149 0.5663983
연결어미 472 0.1244020
종결어미 202 0.0532399
감탄사 195 0.0513949
격조사 184 0.0484957
수사 118 0.0311005
의존명사 78 0.0205580
관형사 58 0.0152867
전성어미 57 0.0150231
대명사 52 0.0137053
외국어 24 0.0063255
기타기호 24 0.0063255
접미사 16 0.0042170
선어말어미 14 0.0036899
보조사 13 0.0034263
쉼표 1 0.0002636
여는 따옴표 또는 묶음표 1 0.0002636
단위기호 1 0.0002636
이음표 1 0.0002636

각 세그먼트별 통계량

브랜드명

h_tag cnt percentage
보통명사 44562 100

일반상품

h_tag cnt percentage
보통명사 16548 100

인물-이름

h_tag cnt percentage
보통명사 63747 100

인물,일반

h_tag cnt percentage
보통명사 12714 100

고유명사

h_tag cnt percentage
보통명사 44017 100

장소-지명

h_tag cnt percentage
보통명사 42821 100

장소-일반

h_tag cnt percentage
보통명사 777 100

동사

h_tag cnt percentage
동사 149465 100

일반(품사모음)

h_tag cnt percentage
부사 2149 45.6069610
보통명사 1104 23.4295416
연결어미 472 10.0169779
종결어미 202 4.2869270
감탄사 195 4.1383701
격조사 184 3.9049236
수사 118 2.5042445
의존명사 78 1.6553480
관형사 58 1.2308998
전성어미 57 1.2096774
대명사 52 1.1035654
접미사 16 0.3395586
선어말어미 14 0.2971138
보조사 13 0.2758913

특수문자

h_tag cnt percentage
외국어 24 46.153846
기타기호 24 46.153846
쉼표 1 1.923077
여는 따옴표 또는 묶음표 1 1.923077
단위기호 1 1.923077
이음표 1 1.923077