职位描述:
我们正在寻找一位对语音合成(TTS)技术充满热情的实习生,协助我们进行中英粤(特别是香港粤语)语音合成相关的研究与开发工作。你将参与语音数据处理、模型训练、评测与优化等核心环节,支持多语种、多方言语音合成系统的构建与迭代。粤语优先
岗位职责:
协助收集、整理和清洗中英粤(香港粤语)语音数据;
参与语音合成模型的训练、测试与评估;
协助进行文本归一化、音素转换、韵律标注等前端处理工作;
支持粤语发音词典的构建与维护;
协助撰写技术文档与实验报告;
跟踪语音合成领域最新研究进展,提出优化建议。
任职要求:
计算机科学、人工智能、电子工程等相关专业优先;
对语音合成、语音识别或大语言模型有基础了解或浓厚兴趣;
熟悉香港粤语,具备良好的粤语听力和发音判断能力(需听懂并区分粤语发音细节);
英语读写能力良好,能阅读英文技术文献;
熟练使用Python,具备基础编程能力;
能使用 Linux 环境及基本命令;
有语音合成评测经验(如 MOS、CMOS、ABX 测试);
有语音数据处理经验者优先;
具备良好的沟通能力与团队协作精神,责任心强,学习能力强。
加分项:
掌握粤语拼音方案(如 Jyutping);
有机器学习或深度学习项目经验;
了解 TTS 模型如 FastSpeech、VITS、CosyVoice、F5 等;
有处理多语种、多方言语音数据的经验。
有使用Docker的经验。