-随着AI在云计算,自动驾驶,IOT等众多场景的规模落地,我们需要新的体系结构,新的系统软件和新的芯片,来支撑大规模和多样化的AI计算
- 百度昆仑芯片正式在这样的背景下诞生,基于百度自主知识产权的XPU架构,采用先进工艺制程,高计算能力,高吞吐,面向通用AI计算
- 我们也开发了面向开发者的百度昆仑软件栈,包括编译器,驱动,模拟器,高性能计算库,图编译及优化等,让百度昆仑芯片更好用,更易用
-熟悉计算机体系结构,有异构计算相关经验,熟悉GPU等并行计算架构
-加分项:
1)有芯片驱动,编译器,模拟器等相关工作经验
2)熟悉常用的深度学习算法和框架,有大规模分布式训练优化经验
3)在系统学术会议发表过文章,如SOSP, OSDI, ASPLOS,HPCA,ISCA等,或者ML/CV/data mining领域相关会议等
当前职位已下线