岗位职责
1. 参与评估和集成第三方大型模型平台,例如ChatGPT等,以扩展模型的功能和性能。
2. 探索大型模型的原生应用,研究并应用语言模型的预训练和微调技术,包括但不限于AutoGPT、Langchain、Prompt引擎等技术。鼓励跨模态研究,将研究成果应用于不同业务领域,以解决实际应用中的问题。
3. 负责研究和应用语言模型相关技术,包括知识注入、指令对齐、工具接口、深度推理和知识围栏等。积极参与对话意图、对话管理、对话生成、人机协作、金融信息检索、情感分析和用户模拟器等产品的开发,以推动技术创新。
4. 紧跟技术前沿,涉及语言模型的训练、评估、量化和部署等方面,建立坚实的工程体系,为模型的持续改进提供技术支持。
5.有卓越的研究成果能够产生论文、专利等,并分享和推广公司的技术成就。
岗位要求
1. 在读计算机/人工智能或相关专业的学生,对语言模型有一定了解和浓厚兴趣,熟练使用Linux和Python
2. 熟练使用至少一种深度学习框架,如PyTorch或TensorFlow。
3. 清晰准确地掌握深度学习的基本概念。
4. 每周能实习5天。