【岗位职责】
作为AI数据工程实习生,你将参与一个全球矿业智能化项目,协助团队构建高质量的数据基础设施,为AI模型、技术尽调和矿业运营分析提供可靠的数据支持。主要职责包括:
1. 数据清理与标准化
对矿业上市公司的技术、运营、财务等公开数据进行采集、清洗、结构化整理。
处理年报、技术报告、矿业评估报告(如 JORC、NI 43-101)、新闻稿等多源异构数据。
按照内部数据字典和知识图谱要求建立统一的数据格式。
2. 数据标注与质量管控
对地质、采矿、选厂、资源量、成本等专业字段进行初步标注和分类。
协助构建矿业知识库的 QA/QC(质量检查)流程,确保数据准确性与完整性。
3. 数据管道与工具协助开发
协助搭建和维护 ETL / ELT 数据处理流程。
使用 Python、Pandas、SQL 等工具提高数据整理的效率与自动化程度。
支持 AI 团队进行训练数据集准备,包括分桶、特征抽取、文本结构化等。
4. 行业研究与数据支持
对重点矿种(铜、金、铁、钾盐、稀有金属等)进行基础研究,整理技术指标与运营参数。
根据项目需要制作基础分析表格、数据快报、矿区运营指标数据集。
【岗位要求】
本科及以上学历在读(地质、矿业、数据科学、计算机优先)。
熟练使用 Python(Pandas/Numpy)、Excel,有一定数据处理经验。
逻辑清晰、细致严谨,对数据质量敏感。
对矿业、AI、能源资源行业有兴趣优先。
每周至少 3 天到岗,能实习 3 个月及以上优先。
【加分项】
有地质/采矿相关课程或实习经验。
了解 SQL、正则表达式、数据爬取基础。
有阅读英文技术文档和海外矿业报告的能力。
对 LLM(大模型)、AI 训练流程、数据标注体系有认知者优先。
【实习收获】
参与构建全球领先的矿业智能数据平台。
获得与大型矿业集团、国际投行使用的指标体系同级的数据处理经验。
深度参与 AI 训练数据集构建,对 AI + Mining 的前沿方向有全面认知。
优秀实习生可获得 return offer / 全职优先录用机会。