【岗位职责】
1、分析线上各类模型(如分类、检测、序列识别、多模态联合模型、transformer等)的耗时情况,针对性分析pipeline的耗时瓶颈;
2、对模型进行量化加速,采用量化训练或后量化方式提升量化后的模型精度
3、基于tensorRT fp16/int8进行高效率部署;
【任职要求】
1、熟悉主流的深度学习框架训练和部署工具,如Tensorflow、Pytorch、ONNX、TensorRT等。
2、良好的编程能力,熟悉c++, python, 有基于cuda编写高效率layer的经验。
3、对主流网络结构和各类训练任务都有一定的经验。
4、对int8量化原理和量化训练的策略有基本的了解。
当前职位已下线
为你揭秘各职业的工作内容|薪资水平…
利用算法原理处理事物的人员。