-
Notifications
You must be signed in to change notification settings - Fork 108
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
想请问一下jiebaR分词可以选择分词粒度吗?如何实现 #36
Comments
你好,有多种分词的方法,具体可以参考 这里 。
default 可以设置的值为 c("mix", "query", "hmm", "mp", "tag", "full") 中的一个。 简单的说, hmm 会识别生词,直接用 hmm 模型分词,但是不使用词典,mp 使用词典, mix 使用词典和识别生词,full 是类似搜索引擎模式的分词。query 方法先使用mix方法切词,对于切出来的较长的词再使用 full 方法。 full 方法在 R 包里没有更新出来,但是在最新的 CRAN 版里是可以用的。设置 default 方法为 full 就可以了。
之后我会把文档更新一下。 |
感谢您的细致的回复,最近才看到,不好意思! full模式确实可以得到多种粒度的词,但并没法得到完整句子 比如:
虽然可以得到不同粒度的切词,但并没法得到完整语义的句子 不知道是否有办法在不同粒度下切词,又可以有完整语义的句子? 感谢您的细心解答! 祝好! |
粒度怎么定义? 除了 full,还有 "mix", "query", "hmm", "mp", 这四种方法。full 方法适用于搜索引擎的切词。 |
No description provided.
The text was updated successfully, but these errors were encountered: