文本挖掘实习生
2023-08-17 13:54:49 刷新
250-300/天 北京 本科 4天/周 实习3个月 提供转正机会
免费三餐免费班车免费健身房
微信扫码同步查看
投递方便通知及时
扫码手机查看
当前职位已下线
职位描述:
工作职责 从互联网的海量信息中抓取并且筛选出有价值的单语和双语数据,帮助机器翻译及相关产品提高翻译质量和语种支持能力,包括但不限于:  * 机器翻译语料系统的抓取策略设计,模型构建,数据抽取等相关算法设计和开发  * 新增语种的语言检测、分句、词法分析;  * 双语对齐算法的实现和改进;  * 双语数据的清洗和筛选;  * 语料数据的分类;  * 由于需要覆盖大量长尾数据及格式,对内容的抽取涉及到非常多的挑战。  能力要求  * 计算机相关专业本科以上学历;  * 有以下任意领域的实践经验:数据挖掘 / 信息检索 / 自然语言处理 / 机器学习 / 统计分析  / Hadoop / Spark;  * 对技术充满热情,勇于尝试,有较强创新的能力和快速学习能力;  * 较强的发现、分析和解决技术问题的工程能力;  * 熟悉Linux,熟悉java、C/C++、Python开发;  * 良好的主动性、逻辑思维能力和沟通能力。 加分项  * 精通Map-Reduce模型,具有使用Hadoop、Hive、Spark、Nutch等相关平台进行大数据处理和挖掘的经验;  * 有过Office/PDF/HTML/XML等多种格式文档解析经验;  * 懂得英语以外的其他外语;  * 踏实,追求细节和完美。   时间要求   每周保证32小时的工作时间(其中至少12小时为工作日白天),三个月至半年的实习期
投递要求:
简历要求: 中文
截止日期:2022-07-23
工作地点:
北京网易研发中心 收起地图
求职中若出现虚假宣传,收取财物等违法情况。请立即举报

当前职位已下线

公司简介

职位百科

为你揭秘各职业的工作内容|薪资水平…

数据挖掘师

百科详情

运用机器学习技术处理海量数据,发现富有价值的业务信息的工程技术专业人员。