
为什么我还是无法理解transformer?_湖北省荆州市荆州区秦细水利水电设施有限责任公司
联系人:
手机:
E-mail:
地址:
为什么我还是无法理解transformer?
发布时间:2025-06-24 20:15:16 人气:
不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。
反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。
总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。
。
相关新闻
- 初学CAD,现在下载哪个版本比较好? 二维设计这块,我们公司一直用CAD2007,软件小,不到70...
- Caddy 和 Nginx 比有哪些优点和缺点? 本内容是对知名性能评测博主 Anton Putra Ngin...
- 男朋友因为打游戏骗我去睡觉被我识破,然后我提了分手,他同意了,问问男孩子们他怎么想的? 我家的无线路由器,老婆买的: 音乐播放机,老婆买的: ...
- 如何评价中国电科研发的JY-10防空指挥控制系统成为伊朗防空指挥系统核心? 一个写程序超过二十年的老家伙说: 凡是国企写的软件都是垃圾,...
- 为什么 macOS 并不差,可市场总敌不过 Windows? 我两个都用,有一天忽然想到一个问题,就苹果电脑的体量,愿意做...
- 我特别不明白,我们这边做j***a 的,为什么要用windows 做server? winserver主要是贵 以前2012/r2 的时候 ,一...