1、为实现类 Sora 模型实时化无损生成研究可行方案, 包括但不限于 步数蒸馏, efficiency-attention 计算, cache-reuse 策略, QAT训练等;
2、为 LLM/MLLM 的高效推理探索前沿解决方案, 包括但不限于 efficiency architecture, sparse attention, fp8/4-tuning, data/model distillation, speculative decoding等;
3、在指导下参与视频生成大模型/多模态大模型的全链路探索。