
为什么我还是无法理解transformer?_湖北省荆州市荆州区秦细水利水电设施有限责任公司
联系人:
手机:
E-mail:
地址:
为什么我还是无法理解transformer?
发布时间:2025-06-25 04:55:14 人气:
不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。
反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。
总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。
。
相关新闻
- 如何评价 Bilibili 未经用户同意私自开启大量 UPnP 端口,疑似盗用用户的带宽? 哎,用户问的是B站客户端偷偷开UPnP端口的事儿,我得用大白...
- 核聚变是一条死胡同吗? 核聚变是人类文明从1级突破到2级的关键,然而,当下我们的文明...
- 旅行者 1 号飞出太阳系了,它是如何和地球联系的呢? 旅行者一号飞行近50年,距地约233亿公里,为何还能与地球通...
- 怎么判断一个人是否聪明? 不能说绝对啊,但算是一个大概率的观察视角。 就是看:这个人...
- LCD党真的只是少部分人吗? 本人高强度使用了四年LCD手机(vivo x6、iqoo n...
- MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响? 我测试了下做PPT这个需求,并且用Manus做了一样的事,结...