NLP模型笔记2022-32:Sentence-BERT句子语义相似计算和相似句子聚类
SentenceTransformers 是一个可以用于句子、文本和图像嵌入的Python库。 可以为 100 多种语言计算文本的嵌入并且可以轻松地将它们用于语义文本相似性、语义搜索和同义词挖掘等常见任务。
论文:https://arxiv.org/abs/1908.10084
官网:https://www.sbert.net/index.html
源码:https://github.com/UKPLab/sentence-transformers
摘要:
BERT(Devlin等人,2018)和RoBERTa(刘等人,2019)在句子对回归任务(如语义文本相似性(STS))上设定了新的最先进的性能。然而,它需要将两个句子都输入网络,这会导致巨大的计算开销:在10,000个句子的集合中找到最相似的对需要大约5000万次推理计算(约65小时)与BERT。BERT的构造使其不适合语义相似性搜索以及聚类等无监督任务。
在本出版物中,我们提出了句子-BERT(SBERT),这是对预训练的BERT网络的修改,该网络使用暹罗语和三元组网络结构来推导语义上有意义的句子嵌入,可以使用余弦相似性进行比较。这样可以减少查找最相似对的工作量&
这篇好文章是转载于:学新通技术网
- 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
- 本站站名: 学新通技术网
- 本文地址: /boutique/detail/tanhiabegg
系列文章
更多
同类精品
更多
-
photoshop保存的图片太大微信发不了怎么办
PHP中文网 06-15 -
word里面弄一个表格后上面的标题会跑到下面怎么办
PHP中文网 06-20 -
photoshop扩展功能面板显示灰色怎么办
PHP中文网 06-14 -
《学习通》视频自动暂停处理方法
HelloWorld317 07-05 -
Android 11 保存文件到外部存储,并分享文件
Luke 10-12 -
TikTok加速器哪个好免费的TK加速器推荐
TK小达人 10-01 -
微信公众号没有声音提示怎么办
PHP中文网 03-31 -
excel下划线不显示怎么办
PHP中文网 06-23 -
excel打印预览压线压字怎么办
PHP中文网 06-22 -
微信运动停用后别人还能看到步数吗
PHP中文网 07-22