岗位职责
* 研究大语言模型(LLM)及文生图等生成模型的量化与压缩技术;
* 参与并支持 Intel Neural Compressor、Intel/auto-round 等工具的开发与优化;
* 跟踪并探索模型高效部署与推理加速等前沿方向。
岗位要求
* 熟悉深度学习或大语言模型(LLM)的基本原理与应用;
* 掌握模型压缩相关技术(如量化、剪枝等);
* 熟练使用 Python 或其他深度学习开发语言。
加分项
* 具备较强的自我驱动与问题解决能力;
* 对技术创新和工程实用性充满热情,具备持续探索与突破的动力;
* 有模型微调、推理优化或相关工具开发经验者优先。