共计 959 个字符,预计需要花费 3 分钟才能阅读完成。
丸趣 TV 小编给大家分享一下如何利用 HanLP 计算中文词语语义相似度,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
在 java 项目中配置 HanLP 推荐使用 Maven 方法
在 poem.xml 中加入以下代码
dependency
groupId com.hankcs /groupId
artifactId hanlp /artifactId
version portable-1.3.3 /version /dependency
但是在 AndroidStudio 中,没有 Maven,所以在 build.gradle 的 dependencies 中加入如下代码
compile com.hankcs:hanlp:portable-1.3.3
还可以下载 jar 包和 data 包,使用 hanlp.properties 进行手动配置
在 IntelliJ IDEA 中进入 file – project structure,在 Libraries 中添加 jar 包
更改 hanlp.properties 中的首行,指向 data 包所在的位置
将 hanlp.properties 放在 out – production – name 目录下
调用 HanLP
import com.hankcs.hanlp.dictionary.CoreSynonymDictionary;
只需要以上语句便可以使用 HanLP
// 使用 hanlp 计算语义距离 double[] numarray = new double[title_list.size()]; for (int i = 0; i results.size(); i++) { for (int j = 0; j title_list.size(); j++) { numarray[j] += CoreSynonymDictionary.similarity(results.get(i).name().toString(), title_list.get(j).toString());
}
}
以上是“如何利用 HanLP 计算中文词语语义相似度”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注丸趣 TV 行业资讯频道!
正文完