语音算法工程师

1.5-3.5万元/月

深圳·南山区

梁先生

已实名

企业认证

新译信息科技（深圳）有限公司

职位详情

算法工程师

岗位职责

  1. 语音模型研发与优化
  - 负责语音识别（ASR）、说话人识别、语种识别等模型的训练、调优与产品落地
  - 探索语音大模型等前沿技术，验证业界最新技术的落地可行性
  - 持续提升复杂场景下语音系统的鲁棒性

  2. 语音系统本地化与部署
  - 支持语音识别系统的本地化和设备端（边缘）落地
  - 负责模型推理优化、轻量化（压缩/量化），优化延迟与资源消耗
  - 协助部署语音识别服务到云端及边缘设备

  3. 数据处理与特征工程
  - 语音数据预处理、增强（降噪、去混响、VAD）
  - 数据清洗与特征提取（MFCC、FBank、SpecAugment）

  4. 技术跟踪与创新
  - 跟踪语音领域最新算法，持续优化识别准确率和实时性
  - 跟踪LLM前沿技术（Prompt工程、RAG、Agents、Memory等），探索与语音技术结合
  5. 工程落地
  - 与产品团队协作，分析语音识别结果在实际业务中的表现，持续迭代模型策略
  - 推动AI技术的大规模工程落地

  ---
  任职要求

  【必须项】
  - 计算机、电子、通信、声学等相关专业，硕士及以上学历（优秀本科生有项目/竞赛经验也可）
  - 1年以上语音算法相关工作经验(含实习阶段)
  - 熟练掌握Python，至少熟练使用一个深度学习框架（PyTorch优先）
  - 具有语音项目背景，深度参与过以下至少一个方向：语音识别（ASR）、说话人识别
  - 熟悉Transformer原理，有工业级语音数据处理经验
  - 良好的工程实现能力、沟通能力与团队合作精神

  【加分项】
  - 熟悉端到端深度学习模型（CTC、RNN-T、Attention-based）
  - 熟悉主流语音识别工具和框架（Kaldi、k2、ESPnet、WeNet、Whisper等）
  - 有语音前端处理经验（VAD、降噪、特征提取）
  - 有语音大模型或LLM相关经验，熟悉BERT/GPT等预训练模型
  - 有模型部署优化经验（TensorRT、ONNX、量化压缩等）
  - 有实时音频/视频流处理经验
  - 有论文发表、竞赛获奖或开源项目贡献
  - 学习能力强，对前沿技术保持敏感度和探索热情

2026-06-25 13:45

IP属地：广东深圳

职位福利

硕士1-3年