如何利用HanLP计算中文词语语义相似度

60次阅读
没有评论

共计 959 个字符,预计需要花费 3 分钟才能阅读完成。

丸趣 TV 小编给大家分享一下如何利用 HanLP 计算中文词语语义相似度,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

在 java 项目中配置 HanLP 推荐使用 Maven 方法

在 poem.xml 中加入以下代码

dependency 
  groupId com.hankcs /groupId 
  artifactId hanlp /artifactId 
  version portable-1.3.3 /version /dependency

但是在 AndroidStudio 中,没有 Maven,所以在 build.gradle 的 dependencies 中加入如下代码

compile  com.hankcs:hanlp:portable-1.3.3

还可以下载 jar 包和 data 包,使用 hanlp.properties 进行手动配置

在 IntelliJ IDEA 中进入 file – project structure,在 Libraries 中添加 jar 包

更改 hanlp.properties 中的首行,指向 data 包所在的位置

将 hanlp.properties 放在 out – production – name 目录下

调用 HanLP

import com.hankcs.hanlp.dictionary.CoreSynonymDictionary;

只需要以上语句便可以使用 HanLP

// 使用 hanlp 计算语义距离 double[] numarray = new double[title_list.size()]; for (int i = 0; i   results.size(); i++) { for (int j = 0; j   title_list.size(); j++) { numarray[j] += CoreSynonymDictionary.similarity(results.get(i).name().toString(), title_list.get(j).toString());
 }
 }

以上是“如何利用 HanLP 计算中文词语语义相似度”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注丸趣 TV 行业资讯频道!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-24发表,共计959字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)