论文

0x01 Introduction [1]

1.2 数据并行

数据并行扩展通常效果很好,但有两个限制:

1.3 模型并行

模型并行分为两种:流水线并行和张量并行,就是把模型切分的方式。

qiujiqu2.bmp