职位详情
岗位职责:
1、参与语音生成方向大模型技术的开发工作,涵盖语音合成、端到端语音对话系统等相关领域;
2、推动先进技术在实际业务场景中的集成与应用,涉及语言、语音及音频的生成与理解等多个方面;
3、跟踪语音生成领域的最新算法进展,持续优化现有模型的推理性能与语音输出质量。
岗位要求:
1、掌握主流大模型语音合成技术(如VALL-E、cosyvoice、indextts等),具备模型训练、调优及实际落地经验;
2、熟悉主流端到端语音大模型方法(如glm-voice、moshi、llama-onmi等),有实际训练与优化实践;
3、了解传统TTS各模块核心技术并具备相关项目经验,包括语音前端处理(G2P、TN、多音字、韵律预测等)、声学模型(vits、fastspeech、glowtts等)以及声码器(hifigan、vocos、bigvgan等);
4、熟练使用PyTorch等深度学习框架,精通Python编程;
5、在NeurIPS、ICML、ICLR、ACL、Interspeech、ICASSP等顶级会议发表过论文,或拥有相关计算机行业经验、ACM竞赛获奖经历者优先考虑。
1、参与语音生成方向大模型技术的开发工作,涵盖语音合成、端到端语音对话系统等相关领域;
2、推动先进技术在实际业务场景中的集成与应用,涉及语言、语音及音频的生成与理解等多个方面;
3、跟踪语音生成领域的最新算法进展,持续优化现有模型的推理性能与语音输出质量。
岗位要求:
1、掌握主流大模型语音合成技术(如VALL-E、cosyvoice、indextts等),具备模型训练、调优及实际落地经验;
2、熟悉主流端到端语音大模型方法(如glm-voice、moshi、llama-onmi等),有实际训练与优化实践;
3、了解传统TTS各模块核心技术并具备相关项目经验,包括语音前端处理(G2P、TN、多音字、韵律预测等)、声学模型(vits、fastspeech、glowtts等)以及声码器(hifigan、vocos、bigvgan等);
4、熟练使用PyTorch等深度学习框架,精通Python编程;
5、在NeurIPS、ICML、ICLR、ACL、Interspeech、ICASSP等顶级会议发表过论文,或拥有相关计算机行业经验、ACM竞赛获奖经历者优先考虑。
2026-05-12 13:44
IP属地:北京
职位福利
硕士经验不限

度小满科技(北京)有限公司
A轮 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >






