1、打造最适合短视频、直播、搜索推荐、电商、创作者玩法的多模态大模型,为快手的各项业务提供基座模型技术支持。多模态技术是通向AGI的重要方法和里程碑,期待和更多对多模态技术感兴趣的同学一起打造真正带来价值的模型算法技术;
2、深度探索多模态大模型的多阶段预训练、监督微调和RLHF等技术,打造业界第一梯队的多模态大模型,赶超GPT-4o、Gemini Pro等闭源模型的实际使用效果;
3、图片、语音、音频和视频多种模态信号的高效处理方式探索,提供对各类信号最精准的理解能力;
4、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索。