微信扫码登录

其他登录方式

绑定手机号

注册

我同意用户协议

忘记密码

用户协议

绑定手机号

近期有不法分子打着爱盈利的旗号,制作“爱盈利”名称的App,并伪造爱盈利证件,骗取用户信任,以抖音点赞赚钱或其他方式赚钱为名义,过程中以升级会员获得高佣金为名让用户充值。
爱盈利公司郑重声明:我司没有研发或运营过任何名为“爱盈利”的APP,我司做任务赚钱类产品从没有让任何普通用户充值升级会员。我公司产品均在本网站可查询,请将网站拉至底部,点击“关于我们”可查看爱盈利相关产品与服务。
温馨提示:当遇到此类问题请拨打官方电话或添加官方微信,以免财产损失。爱盈利官网地址:www.aiyingli.com。
  • 推广与合作
X

11大Java开源中文分词器的使用方法和分词效果对比

来源: 2352
爱盈利(aiyingli.com)移动互联网最具影响力的盈利指导网站。定位于服务移动互联网创业者,移动盈利指导。我们的目标是让盈利目标清晰可见!降低门槛,让缺乏经验、资金有限的个人和团队获得经验和机会,提高热情,激发产品。

11大Java开源中文分词器的使用方法和分词效果对比

作者:liuchi1993

本文的目标有两个:

1、学会使用11大Java开源中文分词器

2、对比分析11大Java开源中文分词器的分词效果

本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码,至于效果哪个好,那要用的人结合自己的应用场景自己来判断。

11大Java开源中文分词器,不同的分词器有不同的用法,定义的接口也不一样,我们先定义一个统一的接口:

11大Java开源中文分词器的使用方法和分词效果对比

从上面的定义我们知道,在Java中,同样的方法名称和参数,但是返回值不同,这种情况不可以使用重载。

这两个方法的区别在于返回值,每一个分词器都可能有多种分词模式,每种模式的分词结果都可能不相同,第一个方法忽略分词器模式,返回所有模式的所有不重复分词结果,第二个方法返回每一种分词器模式及其对应的分词结果。

在这里,需要注意的是我们使用了Java8中的新特性默认方法,并使用stream把一个map的value转换为不重复的集合。

下面我们利用这11大分词器来实现这个接口:

1、word分词器

11大Java开源中文分词器的使用方法和分词效果对比

2、Ansj分词器

11大Java开源中文分词器的使用方法和分词效果对比

3、Stanford分词器

11大Java开源中文分词器的使用方法和分词效果对比

4、FudanNLP分词器

11大Java开源中文分词器的使用方法和分词效果对比

5、Jieba分词器

11大Java开源中文分词器的使用方法和分词效果对比

6、Jcseg分词器

11大Java开源中文分词器的使用方法和分词效果对比

7、MMSeg4j分词器

11大Java开源中文分词器的使用方法和分词效果对比

8、IKAnalyzer分词器

11大Java开源中文分词器的使用方法和分词效果对比

9、Paoding分词器

11大Java开源中文分词器的使用方法和分词效果对比

10、smartcn分词器

11大Java开源中文分词器的使用方法和分词效果对比

11、HanLP分词器

11大Java开源中文分词器的使用方法和分词效果对比

现在我们已经实现了本文的第一个目的:学会使用11大Java开源中文分词器。

最后我们来实现本文的第二个目的:对比分析11大Java开源中文分词器的分词效果,程序如下:

11大Java开源中文分词器的使用方法和分词效果对比

运行结果如下:

11大Java开源中文分词器的使用方法和分词效果对比 11大Java开源中文分词器的使用方法和分词效果对比

完整代码看这里

End.

转载请注明来自36大数据(36dsj.com):36大数据 » 11大Java开源中文分词器的使用方法和分词效果对比

爱盈利-运营小咖秀 始终坚持研究分享移动互联网App数据运营推广经验、策略、全案、渠道等纯干货知识内容;是广大App运营从业者的知识启蒙、成长指导、进阶学习的集聚平台;

评论

相关文章推荐

SELECT dw_posts.ID,dw_posts.post_title,dw_posts.post_content FROM dw_posts INNER JOIN dw_term_relationships ON (dw_posts.ID = dw_term_relationships.object_id) WHERE 1=1 AND(dw_term_relationships.term_taxonomy_id = 3413 ) AND dw_posts.post_type = 'post' AND (dw_posts.post_status = 'publish') GROUP BY dw_posts.ID ORDER BY RAND() LIMIT 0, 6

京ICP备15063977号-2 © 2012-2018 aiyingli.com. All Rights Reserved. 京公网安备 11010102003938号