• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

NLP模型笔记2022-32:Sentence-BERT句子语义相似计算和相似句子聚类

武飞扬头像
源代码杀手
帮助1

SentenceTransformers 是一个可以用于句子、文本和图像嵌入的Python库。 可以为 100 多种语言计算文本的嵌入并且可以轻松地将它们用于语义文本相似性、语义搜索和同义词挖掘等常见任务。

论文:https://arxiv.org/abs/1908.10084
官网:https://www.sbert.net/index.html
源码:https://github.com/UKPLab/sentence-transformers
学新通
摘要:

BERT(Devlin等人,2018)和RoBERTa(刘等人,2019)在句子对回归任务(如语义文本相似性(STS))上设定了新的最先进的性能。然而,它需要将两个句子都输入网络,这会导致巨大的计算开销:在10,000个句子的集合中找到最相似的对需要大约5000万次推理计算(约65小时)与BERT。BERT的构造使其不适合语义相似性搜索以及聚类等无监督任务。
在本出版物中,我们提出了句子-BERT(SBERT),这是对预训练的BERT网络的修改,该网络使用暹罗语和三元组网络结构来推导语义上有意义的句子嵌入,可以使用余弦相似性进行比较。这样可以减少查找最相似对的工作量&

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhiabegg
系列文章
更多 icon
同类精品
更多 icon
继续加载