职位描述
- 参与多模态数据(文本、图像、视频等)的采集、清洗和整理,优化数据质量
- 使用Python(Scrapy/Selenium等)开发爬虫,从公开网站或API获取数据
- LLM 应用开发,包括但不限于Workflow,Agent
- 协助数据标注和预处理,支持AI模型训练
- 编写技术文档(Markdown/LaTeX),记录项目进展
岗位要求
- 学历:计算机相关专业本科或研究生在读
- 技能:
- 熟悉Python编程,有基础工程能力,熟悉Scrapy、Selenium等爬虫框架;
- 了解HTTP协议、JSON、正则表达式等基础知识
- 熟悉MySQL、PostgreSQL、Redis、Elasticsearch等数据库技术;
- 会使用Git版本控制,能协作开发
- 具备文档撰写能力(Markdown/LaTeX)
加分项(非必需):
- 有爬虫、数据库(MySQL/Redis)或AI相关经验
- 了解Android逆向或多模态数据处理
- 对网络安全或前后端开发感兴趣
- 有大模型应用开发经验