返回主页
讲义与导论
- 课程导论讲义:PDF
- 第 1 讲 课程导论:PDF
- 第 2 讲 工作负载与评价指标:PDF
- 第 3 讲 请求生命周期:PDF
- 第 4 讲 请求调度:PDF
- 第 5 讲 KV 缓存:PDF
- 第 6 讲 状态管理与记忆组织:PDF
- 第 7 讲 推理系统架构:PDF
- 第 8 讲 执行优化与异构路径:PDF
- 第 9 讲 异构平台适配:PDF
- 第 10 讲 论文比较方法:PDF
- 第 11 讲 实验方法与验证:PDF
- 第 12 讲 开源系统实践:PDF
- 第 13 讲 课程项目工作坊:PDF
- 第 14 讲 课程总结与汇报:PDF
Tutorials
- Tutorial 1 工作负载与评价指标:PDF
- Tutorial 2 请求生命周期与 Prefill / Decode:PDF
- Tutorial 3 调度与连续批处理观察:PDF
- Tutorial 4 KV Cache 与状态组织:PDF
- Tutorial 5 状态管理与记忆组织:PDF
- Tutorial 6 推理系统架构:PDF
- Tutorial 7 执行优化与异构路径:PDF
- Tutorial 8 异构平台适配:PDF
- Tutorial 9 论文比较方法:PDF
- Tutorial 10 实验方法与验证:PDF
- Tutorial 11 开源系统实践:PDF
- Tutorial 12 课程项目工作坊:PDF
- Tutorial 13 课程总结与汇报:PDF
实验单与项目说明
- 实验 1 最小运行与代码地图:PDF
- 实验 2 请求生命周期观察:PDF
- 实验 3 调度与连续批处理实验:PDF
- 实验 4 KV 状态与缓存组织实验:PDF
- 实验 5 指标观测与最小复现实验:PDF
- 课程项目实验说明:PDF