岗位定位:
1. 负责数据集工具链设计和开发
2. 负责大模型调优
3. 负责大模型验证与评估
4. 负责智能体设计和开发
核心职责:
1. 负责数据集的收集、清洗、预处理及高效存储方案设计,确保数据质量与训练效率;
2. 负责小模型训练设计、核心模块开发与性能优化;
3. 负责大模型微调,包括微调参数配置、训练策略优化;
4. 负责模型验证与评估,确保模型效果符合业务需求;
5. 负责智能体设计和开发,面向业务场景有效结合大小模型和业务系统,助力业务智能化提升;
6. 跟踪大模型技术前沿,探索高性能计算、多智能体协同等关键技术落地。
任职要求:
1.精通Python及深度学习框架,具备高性能数据处理和分布式训练经验;熟悉Python生态的模型训练工具链。
2.具有NLP/大模型相关经验,熟悉大模型微调项目(如LLaMA、ChatGLM等);掌握LoRA/P-Tuning等高效微调技术,能独立优化训练策略(学习率调度/梯度裁剪)。
3.有基于LangChain/AutoGPT等框架开发智能体的实战经验;熟悉Python多进程/异步编程,实现智能体与业务系统交互。
4.熟练使用Python构建数据管道,设计数据清洗和增强方案。
软性素质要求:
学习能力,技术激情,可实习6个月以上