【遗留问题??】如果添加停用词典,据说要调用Lucene接口实现?有时间了去尝试一下 https://github.com/ansjsun/ansj_seg/wiki Ansj 是一个开源的 Java 中文分词工具,基于中科院的 ictclas 中文分词算法,比其他常用的开源分词工具(如mmseg4j)的分词准确率更高。 在线演示:http://ansj.sdapp.cn/demo/seg.jsp 官网地址:http://www.ansj.org/ Github地址:https://github.com/ansjsun/ansj_seg 目前实现了.中文分词. 中文姓名识别 . 用户自定义词典 可以应用到自然语言处理等方面,适用于对分词效果要求搞的各种项目. 如果你第一次下载只想测试测试效果可以调用这个简易接口 String str = “欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!” ; System.out.println(ToAnalysis.paser(str)); //new NatureRecognition(ToAnalysis.paser(str)).recogntion(); //进行词性标注 [欢迎/, 使用/, ansj/, _/, seg/, ,/, (/, ansj/, 中文/, 分词/, )/, 在/, 这里/, 如果/, … 继续阅读 →