sphinx

  sphinx是一款基于SQL的全文搜索引擎,可以理解为对MySQL等数据库中全文搜索特性的另外一种实现。它本身可被整合到MySQL等数据库中,成为一种新的存储引擎;此外,还为一些脚本语言设计了API接口。sphinx从功能上讲比较全面。
  它的权重算法也是基于BM25的,这个跟xapian一样,都是目前IR-REL(检索相关度)系列算法里最好的。
  目前有两点还搞不太明白:一是它的切词算法,可能它不是通过切词建立索引的,或者是把每个字都切开?二是它的索引如何和MySQL数据库保持同步,是定期同步还是实时同步?准备深入了解一下,虽然不会有实际用途。

历史上的今天

If you like this post and would like to receive updates from this blog, please subscribe our feed. Subscribe via RSS

3 Responses to “sphinx”

  1. is66wan Says:

    是定期同步,需要手工或cron,
    定义一个delta

  2. bluetent Says:

    那看上去还没有跟mysql完全整合到一起。

  3. 匿名 Says:

    他不是有MYSQL插件可以用吗

Leave a Reply