Ubuntu mysql如何使用SphinxSE方式调用Sphinx与中文分词的应用

80次阅读
没有评论

共计 1692 个字符,预计需要花费 5 分钟才能阅读完成。

丸趣 TV 小编给大家分享一下 Ubuntu mysql 如何使用 SphinxSE 方式调用 Sphinx 与中文分词的应用,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!

1、在 Ubuntu mysql 中的使用 SphinxSE 方式调用 Sphinx

首先建立一张索引专用表:

CREATETABLE`sphinx`( `id`int(11)NOTNULL, `weight`int(11)NOTNULL, `query`varchar(255)NOTNULL, `CATALOGID`INTNOTNULL, `EDITUSERID`INTNOTNULL, `HITS`INTNULL, `ADDTIME`INTNOTNULL,KEY `Query`(`Query`) )ENGINE=SPHINXDEFAULTCHARSET=utf8CONNECTION= sphinx://localhost:3312/test1

test1:索引的名称,可以在 sphinx.conf 中查找到建立完索引专用表后,我们就可以在 Ubuntu mysql 中使用它了,例如,在 Ubuntu mysql 中输入

SELECTdoc.*FROMdocumentsdocJOINsphinxON(doc.id=sphinx.id) WHEREquery= doc;mode=any

运行后,结果记录中将会显示包含 doc 字符串的所用记录行关于 query 的语法,还有 sphinx 的配置等信息你可以请参考:http://www.sphinxsearch.com/doc.html 这里有十分详细的介绍,在这里我们只做一个简单的介绍,希望能起到抛砖引玉的效果。

2、Ubuntu mysql 中文分词的应用

在应用之前我们先将 apache2 和 phpmyadmin 装上,以便输入中文进行测试

apt-getinstallapache2 apt-getinstallphpmyadmin

访问:http://192.168.2.249/phpmyadmin/ 出现了熟悉的界面,ok,安装成功.

接着我们需要修改 /etc/php5/apache2/php.ini 中的 mysql.default_socket 值设置成 /tmp/mysql.sock 这样我们就可以在 http://192.168.2.249/phpmyadmin/ 上通过 root 用户 (密码空) 访问 Ubuntu mysql 了

生成和使用分词字典 mmseg-u/root/mmseg-0.7.3/data/unigram.txt 将生成 unigram.txt.lib 文件将文件拷贝到 /usr/local/sphinx/ 下面, 命名为 uni.libcpunigram.txt.lib/usr/local/sphinx/uni.lib 修改 sphinx.conf(/usr/local/sphinx/etc/sphinx.conf)配置文件在索引中加入

charset_type=zh_cn.utf-8 charset_dictpath=/usr/local/sphinx/

配置然后通过 /usr/local/sphinx/bin/indexer–config/usr/local/sphinx/etc/sphinx.conf–all(如果 searchd 已经再运行,先 kill 它再运行, 下一部分,我们会介绍怎样在 searchd 运行的状态下,加载索引)重建索引, 成功后,开启索引监听 /usr/local/sphinx/bin/searchd–config/usr/local/sphinx/etc/sphinx.conf 这样,就可以在 phpmyadmin 中进行测试了。

SELECTdoc.*FROMdocumentsdocJOINsphinxON(doc.id=sphinx.id) WHEREquery= 张学友;mode=any

看完了这篇文章,相信你对“Ubuntu mysql 如何使用 SphinxSE 方式调用 Sphinx 与中文分词的应用”有了一定的了解,如果想了解更多相关知识,欢迎关注丸趣 TV 行业资讯频道,感谢各位的阅读!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-25发表,共计1692字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)