在此基础上修改源码,增添了自定义词典,以及介绍了修改源码、安装、再删除的方法
example/dict.txt里自定义词典 需要注意的是要标明词典的性质,如果不标,默认是字符串,即/x,会在Segmentation的segment方法里被当做特殊字符去除,整个程序运行的结果反而没有自定义词汇。
修改TextRank4ZH/textrank4zh相关文件的代码
安装
python setup.py install --record files.txt
卸载
sudo cat files.txt | sudo xargs rm -rf
这种就可以反复按需要调试了