游戏AI算法 (强化学习)实习生(算法/框架)
2022-10-25 03:01:58 刷新
150-200/天 北京 硕士 5天/周 实习6个月 提供转正机会
强化学习上百块V100与玩家对抗比赛奖金分享
微信扫码同步查看
投递方便通知及时
扫码手机查看
当前职位已下线
职位描述:

【职位简介】

-本实习岗位以深度强化学习技术为核心,以训练超越人类智能的游戏AI为目标。你将和团队成员参与国内某重要的人机对抗AI挑战赛,优化alphastar算法在特定复杂博弈环境中与全国选拔的指挥员对抗。

-在这里,你将有机会深入了解深度强化学习及大规模并行训练等技术,参与强化学习前沿算法与应用研究、多机多卡训练框架搭建,更将参与到需求分析、算法设计、代码开发测试、AI交付部署等流程中。

-你将收获1)先进的深度强化学习算法框架和平台经验;2)上百块V100的大规模分布式算法训练经验; 3)AI与玩家对抗的挑战体验;4)并有机会分享10w+的比赛奖金。

-我们确信这次实习机会将为您提供良好的专业学习和挑战。

 

【任职要求】

-计算机、自动化、数学、统计、机器学习等相关专业。

-具备的分析和解决问题的能力、主动积极、有责任心和团队意识。

 

算法方向

- 有扎实的算法功底,对常用的强化学习算法有较深刻的理解,有调参经验.

- 熟练至少一种深度学习框架,如tensorflow、pytorch.

- 编程能力强,代码习惯良好,具备较强的算法复现能力,有魔改经验.

 

框架方向(满足下述一条即可)

- 熟练掌握Ray/RLlib、acme、PARL等分布式强化学习框架中的一种.

- 熟练掌握NCCL、Gloo等分布式训练通信协议中的一种.

- 熟悉并使用过Hovorod、tf.distributed、torch.distributed等深度学习分布式框架中的一种,并对分布式SGD有较为清晰的认识.

- 熟练掌握grpc、RDMA、MPI等通信协议中的一种.

 

投递要求:
简历要求: 中文
截止日期:2021-09-23
工作地点:
中科院自动化所,北京市海淀区中关村东路95号,近10号线知春路/知春里地铁站. 收起地图
求职中若出现虚假宣传,收取财物等违法情况。请立即举报

当前职位已下线

职位百科

为你揭秘各职业的工作内容|薪资水平…

算法工程师

百科详情

利用算法原理处理事物的人员。