首页 > 网络3.0 > 了解 Transformer 中的位置嵌入:从绝对到旋转

了解 Transformer 中的位置嵌入:从绝对到旋转

WBOY
发布: 2024-07-20 21:49:31
原创
429 人浏览过

通过代码示例深入了解绝对、相对和旋转位置嵌入

Understanding Positional Embeddings in Transformers: From Absolute to Rotary

了解 Transformers 中的位置嵌入:从绝对到旋转

通过代码示例深入了解绝对、相对和旋转位置嵌入

Mina Ghashami

关注

走向数据科学

--

分享

变压器的关键组件之一是位置嵌入。你可能会问:为什么?因为 Transformer 中的 self-attention 机制是排列不变的;这意味着它计算输入中的每个标记从序列中的其他标记接收到的“注意力”量,但它不考虑标记的顺序。事实上,注意力机制将序列视为一袋令牌。因此,我们需要另一个称为位置嵌入的组件,它负责标记的顺序并影响标记嵌入。但是位置嵌入有哪些不同类型以及它们是如何实现的?

在这篇文章中,我们将了解三种主要类型的位置嵌入并深入研究它们的实现。

这是本文的目录:

1。背景和背景

2.绝对位置嵌入

以上是了解 Transformer 中的位置嵌入:从绝对到旋转的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:kdj.com
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板