NLPIR大数据搜索与挖掘在线平台分词标注组件怎么样,准确吗,有哪位大侠告知小弟一下。

2025-03-12 00:47:14
推荐回答(1个)
回答1:

NLPIR/ICTCLAS分词系统可以支持中英文分词与词性标注,可视化系统可根据词性对不同的分词结果进行区分显示,一般虚词都是浅色,而名词、动词、形容词等实词为显著的颜色。本系统还支持在线用户词典的输入,可以在右下方添加用户词及词性,如“中东呼吸综合征 bing”。
NLPIR/ICTCLAS分词系统,采用层叠隐马模型(算法细节请参照:张华平,高凯,黄河燕,赵燕平。《大数据搜索与挖掘》。科学出版社.2014.5 ISBN:978-7-03-040318-6),分词准确率接近98.23%,具备准确率高、速度快、可适应性强等优势。它能够真正理解中文,利用机器学习的方式解决歧义切分与词性标注歧义问题。NLPIR经过张博士先后倾力打造十余年,内核升级10次,全球用户突破30万,[是张老师获得了,还是分词系统获得了]先后被评为2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。