1. 负责对话场景专属数据集的构建,包括多轮对话数据的收集、清洗、去重、格式化及高质量标注(如意图、槽位、情感、安全性等)。
2. 负责大模型微调、对齐(如RLHF/DPO)相关实验代码的开发、复现与调试,参与Prompt工程及模型服务化工具链的搭建。
3. 跟踪领域的最新学术进展与技术动态,编写高质量的技术实验报告和项目文档。
1. 硕士及以上在校生,计算机科学、软件工程、人工智能、自然语言处理等相关专业优先。
2. 具备扎实的算法与数据结构基础,优秀的编程能力(Python),具备良好的代码风格和工程实践意识。
3. 熟悉机器学习和深度学习基本原理,对Transformer架构及主流大模型有深入理解。有对话系统、指令微调、人类反馈强化学习(RLHF)相关经验或研究背景者优先。
4. 熟练掌握Python,精通PyTorch或TensorFlow等至少一种主流深度学习框架。熟悉Hugging Face生态及相关工具库者加分。
5. 英语读写能力良好,能够快速阅读和消化中英文学术论文(如arXiv),具备独立开展算法调研和技术复现的能力。
6. 对人工智能技术,特别是大模型与对话AI,怀有强烈的好奇心和探索热情。自我驱动力强,具备出色的逻辑思维、沟通能力和团队协作精神。