原理 [4]

1727618810727.png

切分

切分权重[3]

设输入数据为X,参数为W。X的维度 = (b, s, h),W的维度 = (h, h')。其中:

则每次forward的过程如下:

vy5h64x7.bmp

按行切分权重[3]

forward

umimebf0.bmp