
资料内容:
注意力机制是一个很宽泛(宏大》的一个概念,QKV相乘就是注意力,但是他没有规定 QKV
是怎么来的
通过一个查询变量Q,去找到V里面比较重要的东西
假设K==V,然后 QK 相乘求相似度A,然后 AV相乘得到注意力值Z,这个Z 就是 V的另外一
种形式的表示
Q可以是任何一个东西,V也是任何一个东西,K往往是等同于V的(同源》,K和V不同源
不相等可不可以
他没有规定 QKV 怎么来,他只规定 QKV 怎么做

资料内容:
注意力机制是一个很宽泛(宏大》的一个概念,QKV相乘就是注意力,但是他没有规定 QKV
是怎么来的
通过一个查询变量Q,去找到V里面比较重要的东西
假设K==V,然后 QK 相乘求相似度A,然后 AV相乘得到注意力值Z,这个Z 就是 V的另外一
种形式的表示
Q可以是任何一个东西,V也是任何一个东西,K往往是等同于V的(同源》,K和V不同源
不相等可不可以
他没有规定 QKV 怎么来,他只规定 QKV 怎么做