职位详情
职位描述:
1、推动语音识别技术在实际业务场景中的应用,解决技术落地过程中的关键技术难题,持续提升语音识别核心性能;
2、参与音频理解大模型的技术研发,构建完善的音频理解核心技术架构;
3、跟踪并研究音频理解领域的最新算法进展,持续改进语音理解大模型的算法表现;
职位要求:
1、掌握语音识别相关算法,具备语音识别系统实际部署及业务效果调优经验;
2、具备处理工业级大规模数据的能力,有利用海量数据优化业务模型的实际操作经验;
3、深入理解深度学习技术并拥有丰富的实战经历,熟练使用PyTorch,具备端到端语音识别框架(如Transformer、RNN-T、CTC等)的优化经验;
4、具备良好的编程能力,熟悉Linux开发环境,掌握Python语言;
5、具备独立开展工作的能力,同时能够与团队成员良好协作。
加分项:
1、具有客服场景下大规模语音识别系统落地与优化的实践经验;
2、具备前沿端到端语音识别系统的调优经验,了解RNN-T、Encoder-Decoder等端到端语音识别方法;
3、在相关国际会议或主流期刊发表过论文(如ICASSP、Interspeech、ASRU、IEEE/ACM Transactions等);
4、在语音相关竞赛或机器学习比赛中取得国际领先成绩;
5、参与过有影响力的开源项目。
1、推动语音识别技术在实际业务场景中的应用,解决技术落地过程中的关键技术难题,持续提升语音识别核心性能;
2、参与音频理解大模型的技术研发,构建完善的音频理解核心技术架构;
3、跟踪并研究音频理解领域的最新算法进展,持续改进语音理解大模型的算法表现;
职位要求:
1、掌握语音识别相关算法,具备语音识别系统实际部署及业务效果调优经验;
2、具备处理工业级大规模数据的能力,有利用海量数据优化业务模型的实际操作经验;
3、深入理解深度学习技术并拥有丰富的实战经历,熟练使用PyTorch,具备端到端语音识别框架(如Transformer、RNN-T、CTC等)的优化经验;
4、具备良好的编程能力,熟悉Linux开发环境,掌握Python语言;
5、具备独立开展工作的能力,同时能够与团队成员良好协作。
加分项:
1、具有客服场景下大规模语音识别系统落地与优化的实践经验;
2、具备前沿端到端语音识别系统的调优经验,了解RNN-T、Encoder-Decoder等端到端语音识别方法;
3、在相关国际会议或主流期刊发表过论文(如ICASSP、Interspeech、ASRU、IEEE/ACM Transactions等);
4、在语音相关竞赛或机器学习比赛中取得国际领先成绩;
5、参与过有影响力的开源项目。
2026-05-21 12:28
IP属地:北京
职位福利
硕士3-5年

度小满科技(北京)有限公司
A轮 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









