工作职责
1. 文献调研与技术跟踪
· 系统调研国内外大模型安全相关领域最新进展,特别是黑盒对抗样本安全测试、多信源标签合规性差分测试、以及多模态输入侧模型越狱检测技术等。
· 汇编调研成果,形成技术白皮书及文献综述,支持专利与论文撰写。
2. 大模型安全专利申请
· 参与编写并优化大模型安全相关专利申请书材料,包括创新点陈述、技术实现方案、实验验证方案等。
· 跟进专利申请进程,针对专家意见进行发明点细节补充,以及法律合规性审校。
3. 学术论文实验与数据分析
· 设计与实施文本及多模态大模型安全评估实验,包括对抗样本生成、敏感内容检测、模型响应对比等。
· 参与数据清洗、标注与可视化,应用数据科学相关分析工具,对实验结果进行深入剖析。
· 撰写实验方法与结果报告,为学术论文实验与评估章节提供数据支持。
岗位要求
1. 学术背景
· 计算机科学、人工智能、信息安全、数据科学或相关专业硕士/博士在读研究生。
· 有大模型(LLMs)安全或人工智能对抗相关研究经验者优先。
2. 研究能力
· 具备独立阅读和理解英文论文的能力,能快速提炼研究方法和结论。
· 有学术论文撰写或专利撰写经验者优先。
3. 技术能力
· 精通 Python 编程,熟悉 PyTorch、TensorFlow、HuggingFace Transformers 等深度学习框架。
· 掌握常用数据处理与可视化工具(pandas、NumPy、Matplotlib)。
· 有对抗样本生成、大模型价值观对齐、文本/图像处理经验者优先。
4. 团队协作
· 具备良好的团队合作能力和沟通能力,能够高效协同完成任务。
· 具备较强的自驱力,能主动跟进研究进展并输出阶段性成果。
可提供住宿