1、声学建模算法(CE,sMBR,CTC,Attention),在海量训练数据集上进行模型训练和探索;
2、语言建模算法(N-gram,Rnnlm),在TB规模语料上进行模型训练和改进;
3、通用解码引擎优化,工业级代码加速和调优;
4、说话人识别算法(i-vector,x-vector),在海量实际数据集上进行说话人识别实验和系统优化。
职位要求:
1、研究生在读,具备语音识别,自然语言处理等相关领域教育背景;
2、掌握Kaldi,SRILM,RNNLM,TensorFlow,PyTorch等社区开源工具中的一种及以上;
3、熟练掌握C/C++,Python,Shell编程语言,对数据结构和算法设计有较好的理解;
4、在相关国际会议或主流期刊上发表论文者优先(ICASSP,Interspeech,ASRU);
5、编程能力强,获得过ACM等编程竞赛名次者优先;
6、良好的沟通能力和主动性。
当前职位已下线
为你揭秘各职业的工作内容|薪资水平…
利用算法原理处理事物的人员。