• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

es倒排索引原理

武飞扬头像
langy1990
帮助1

倒排索引原理

       

学新通

   

学新通

   普通的存储方式是给每个文档编一个序号 然后让这个序号对应单个文档的所有内容  如果用这样的方式查找   当需要查找某个单词的时候需要遍历所有的文档集合

   查找文档的效率会非常的慢

   2.基本倒排索引:

        在存储文档的时候不是以单个文档内容来做为一行存储的,而是先把所有的文档内容按照特定的分词器进行分词 以被切分后的单词做为一行来进行存储

        并且在最后一列保存这个被切分后的单词出现的文档编号的集合

   

学新通

      

学新通

    3.完善的倒排索引

    

学新通

分词原理

    1.写时分词

      

学新通

    2.读时分词

     

学新通

    

学新通

    es对文本内容进行分析的三个步骤   链式调用的形式来处理

   

学新通

         

学新通

文档路由原理

     

学新通

    

学新通

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhibgafj
系列文章
更多 icon
同类精品
更多 icon
继续加载