数据分析工程师
2026-05-22 19:02:19 刷新
100-150/天 上海 本科 5天/周 实习3个月
实习津贴
微信扫码同步查看
投递方便通知及时
扫码手机查看
投个简历
职位描述:
数据处理与清洗:使用 Python 和正则表达式对海量非结构化或半结构化数据(如 txt、json、excel 等)进行高效的清洗、提取和预处理,保障下游数据质量。 大数据管道开发:参与基于 Hadoop 和 Spark 的数据处理流程开发,编写和维护日常数据流转任务,协助构建高效的数据管道。 算法应用与优化:在复杂的数据逻辑处理中,应用双指针、动态规划及图树遍历等算法思想,并对代码的时间与空间复杂度进行持续优化。 工程运维与自动化:在 Linux 环境下进行远程开发(熟练使用 VSCode / PyCharm),编写 Bash 脚本进行日常任务调度与服务器运维。 AI 辅助研发:积极拥抱新技术,在日常开发中熟练借助大语言模型(LLM)辅助编写代码、排查异常及分析复杂技术问题,提升团队整体研发效能。 职位要求 学历背景:计算机科学、软件工程、数据科学、数学等相关专业本科及以上学历在读。 技术能力: 熟练掌握 Python 编程语言,精通各类常用数据文件的读写与解析。 具备扎实的算法和数据结构基础,掌握双指针、动态规划,了解树结构和图结构的遍历算法,对算法复杂度有清晰认知。 熟练使用常见的 Linux 命令与 Bash 脚本,精通正则表达式。 熟悉 Hadoop 常用命令以及 Spark 分布式数据处理框架。 具备现代化的编程习惯,能熟练使用大模型协助编程和分析问题。 项目经验:有数据处理、数据清洗或大数据组件(Hadoop/Spark)相关实践经验者优先。学习能力:具备较强的学习能力和求知欲,能够快速掌握并应用新技术,对探索数据背后的价值充满好奇心。 沟通能力:良好的团队协作能力和沟通能力,具备良好的数据管理习惯和代码规范意识,能够清晰表达技术观点。 加分项 有实际的海量数据处理、复杂文本清洗或网络爬虫项目经验。 熟悉其他大数据生态组件(如 Hive、Kafka、Flink 等)或任务调度工具(如 Airflow)。 在 GitHub 上有开源数据项目贡献,或在 Kaggle、阿里天池等数据竞赛中取得过名次。
投递要求:
简历要求: 中文
截止日期:2027-01-20
工作地点:
上海市/上海市/徐汇区 绿地中心2期
求职中若出现虚假宣传,收取财物等违法情况。请立即举报
投个简历
公司简介

职位百科

为你揭秘各职业的工作内容|薪资水平…

数据分析师

百科详情

在不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。