职位详情
岗位职责
1. 语音模型研发与优化
- 负责语音识别(ASR)、说话人识别、语种识别等模型的训练、调优与产品落地
- 探索语音大模型等前沿技术,验证业界最新技术的落地可行性
- 持续提升复杂场景下语音系统的鲁棒性
2. 语音系统本地化与部署
- 支持语音识别系统的本地化和设备端(边缘)落地
- 负责模型推理优化、轻量化(压缩/量化),优化延迟与资源消耗
- 协助部署语音识别服务到云端及边缘设备
3. 数据处理与特征工程
- 语音数据预处理、增强(降噪、去混响、VAD)
- 数据清洗与特征提取(MFCC、FBank、SpecAugment)
4. 技术跟踪与创新
- 跟踪语音领域最新算法,持续优化识别准确率和实时性
- 跟踪LLM前沿技术(Prompt工程、RAG、Agents、Memory等),探索与语音技术结合
5. 工程落地
- 与产品团队协作,分析语音识别结果在实际业务中的表现,持续迭代模型策略
- 推动AI技术的大规模工程落地
---
任职要求
【必须项】
- 计算机、电子、通信、声学等相关专业,硕士及以上学历(优秀本科生有项目/竞赛经验也可)
- 1年以上语音算法相关工作经验(含实习阶段)
- 熟练掌握Python,至少熟练使用一个深度学习框架(PyTorch优先)
- 具有语音项目背景,深度参与过以下至少一个方向:语音识别(ASR)、说话人识别
- 熟悉Transformer原理,有工业级语音数据处理经验
- 良好的工程实现能力、沟通能力与团队合作精神
【加分项】
- 熟悉端到端深度学习模型(CTC、RNN-T、Attention-based)
- 熟悉主流语音识别工具和框架(Kaldi、k2、ESPnet、WeNet、Whisper等)
- 有语音前端处理经验(VAD、降噪、特征提取)
- 有语音大模型或LLM相关经验,熟悉BERT/GPT等预训练模型
- 有模型部署优化经验(TensorRT、ONNX、量化压缩等)
- 有实时音频/视频流处理经验
- 有论文发表、竞赛获奖或开源项目贡献
- 学习能力强,对前沿技术保持敏感度和探索热情
1. 语音模型研发与优化
- 负责语音识别(ASR)、说话人识别、语种识别等模型的训练、调优与产品落地
- 探索语音大模型等前沿技术,验证业界最新技术的落地可行性
- 持续提升复杂场景下语音系统的鲁棒性
2. 语音系统本地化与部署
- 支持语音识别系统的本地化和设备端(边缘)落地
- 负责模型推理优化、轻量化(压缩/量化),优化延迟与资源消耗
- 协助部署语音识别服务到云端及边缘设备
3. 数据处理与特征工程
- 语音数据预处理、增强(降噪、去混响、VAD)
- 数据清洗与特征提取(MFCC、FBank、SpecAugment)
4. 技术跟踪与创新
- 跟踪语音领域最新算法,持续优化识别准确率和实时性
- 跟踪LLM前沿技术(Prompt工程、RAG、Agents、Memory等),探索与语音技术结合
5. 工程落地
- 与产品团队协作,分析语音识别结果在实际业务中的表现,持续迭代模型策略
- 推动AI技术的大规模工程落地
---
任职要求
【必须项】
- 计算机、电子、通信、声学等相关专业,硕士及以上学历(优秀本科生有项目/竞赛经验也可)
- 1年以上语音算法相关工作经验(含实习阶段)
- 熟练掌握Python,至少熟练使用一个深度学习框架(PyTorch优先)
- 具有语音项目背景,深度参与过以下至少一个方向:语音识别(ASR)、说话人识别
- 熟悉Transformer原理,有工业级语音数据处理经验
- 良好的工程实现能力、沟通能力与团队合作精神
【加分项】
- 熟悉端到端深度学习模型(CTC、RNN-T、Attention-based)
- 熟悉主流语音识别工具和框架(Kaldi、k2、ESPnet、WeNet、Whisper等)
- 有语音前端处理经验(VAD、降噪、特征提取)
- 有语音大模型或LLM相关经验,熟悉BERT/GPT等预训练模型
- 有模型部署优化经验(TensorRT、ONNX、量化压缩等)
- 有实时音频/视频流处理经验
- 有论文发表、竞赛获奖或开源项目贡献
- 学习能力强,对前沿技术保持敏感度和探索热情
2026-06-25 13:45
IP属地:广东深圳
职位福利
硕士1-3年

新译信息科技(深圳)有限公司
B轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










