论文

引言

3en7a4nl.png

一、微调技术:模型的定向进化

1.2.1 LoRA 系列技术

2ot4rkfx.png

60ockija.png

二、强化学习:从对齐到推理

2.1 LLM推理技术全景图