参考

vLLM V1 Scheduler的调度逻辑&优先级分析

Vllm V1 关键技术解读

图解Vllm V1系列7:使用AsyncLLM做异步推理