我们正在寻找一名积极进取的实习生来支持支持语音的 AI 代理的开发。该项目涉及尖端技术,例如低延迟 ASR(自动语音识别)、LLM(大型语言模型)和流式 TTS(文本到语音转换)系统,可能包括多模态 LLM 和 AI 代理到工作原型中。
你的工作内容:
- 开发后端组件以将语音输入/输出与 LLM 连接起来
- 在 Raspberry Pi 上将音频流式传输到云并运行本地脚本
- 集成额外的传感器或执行器以增强代理功能
- 测试和优化系统性能,以实现低延迟响应和交互质量
-涉及 AI 代理的语音用例的端到端开发
教育背景:电气工程或计算机科学研究
特定专业知识
扎实的编程技能(Python 优先)
具有集成 API 的经验,对音频信号处理、ARR、TTS、LLM 和嵌入式系统感兴趣
使用 Raspberry Pi 或类似 Linux 系统进行原型设计的实践经验
较强的解决问题的能力和独立工作的能力
非常好的英语技能(主管只会说英语)