Ukeate笔记
Search
搜索
暗色模式
亮色模式
探索
Multi-Head Attention
多抽头Attention
优点
找核心特征
用
w
1
同时转换Q、K、V成
w
1
q
,
w
1
k
,
w
1
v
,得到
H
1
w
1
代表一种角度
多个H串联,再用
W
0
降维
关系图谱
反向链接
Attention机制
Transformer