算法工程师（多模态/语义）

2.7-4.5万元/月

西城区

邹先生

已实名

企业认证

北京筑英达信息技术有限公司

职位详情

算法工程师

多模态大模型方向
工作职责
1、开展多模态大模型（涵盖语音、图像等领域）的算法研发与实现，重点推进语音方向技术的创新与性能提升。
2、深入实现并优化语音识别（ASR）、语音合成（TTS）、语音情感分析、语音理解（SLU）等关键技术模块。
3、研究多模态融合方法，增强语音与文本、图像等其他模态之间的协同建模能力。
4、结合具体业务需求，持续优化模型表现，应对噪声干扰、方言差异、低资源语言等实际挑战。
5、关注学术界与工业界的技术动态，推动前沿成果在产品中的落地应用。
6、协同产品及工程团队，推进算法模型的集成与部署，保障技术方案的高效实施。

任职要求
教育：硕士及以上学历，计算机、电子信息工程、信号与信息处理等相关3T专业背景；
技能：
1、掌握深度学习理论基础，熟悉kaldi、tensorflow、cntk等主流语音深度学习框架；
2、熟练使用C/C++、java至少一种编程语言，具备shell、python等脚本语言的实际应用经验；
3、具有实际项目开发经历；了解语音信号处理基本原理，掌握语音识别（ASR）、语音合成（TTS）、语音增强、声学建模等相关技术；了解GPT、Whisper、CLIP等多模态大模型的核心机制与应用场景；熟悉LibriSpeech、Common Voice等常用语音数据集及WER、CER等评估标准。
经验：具备2年及以上相关领域工作经验。

语义大模型方向
工作职责
1、大模型研发与性能提升
1）主导开源大模型的微调与优化工作，改进现有算法，提升模型精度、运行效率和系统扩展性；
2）运用PyTorch等主流机器学习框架，完成大模型的训练与测试任务；
3）研究多轮对话机制、上下文建模、个性化交互等先进技术，提升对话系统的智能表现。
2、追踪技术前沿并推动创新
1）持续跟进人工智能领域最新发展趋势（如DeepSeek等新技术），并将先进方法融入实际解决方案；
2）参与深度学习、强化学习等方向的研究工作，促进科研成果向产品能力转化。
3、团队协作与知识传递
1）与业务、产品和工程团队密切配合，确保算法设计满足产品功能需求；
2）在团队内开展技术分享，定期组织技术交流与培训活动。

任职要求
1、学历与经验：
计算机科学、统计学、数学或相关专业硕士或博士学历；
具备3年以上相关工作经验，有完整的大模型项目落地经验；
2、专业技能：
精通TensorFlow、PyTorch等至少一种主流机器学习框架；
熟练掌握Python编程，具备扎实的算法与数据结构基础；
有基于GPU或TPU进行深度学习模型训练的实际操作经验；
3、分析与问题解决能力：
具备出色的数据分析能力，能从复杂数据中挖掘有效特征与规律；
具备独立分析和解决复杂技术问题的能力；
4、沟通与团队协作能力：
具备良好的沟通表达能力和团队合作意识，能够跨团队高效协作；
适应快节奏、敏捷化的工作环境，保持高效执行力；
5、语言能力：
具备良好的英语读写与口语能力，可熟练阅读和撰写专业技术文档。

2026-07-06 14:38

IP属地：北京

职位福利

硕士1-3年语音处理语音增强语音信号处理声学建模语音降噪波束形成ASR声纹识别TTS语音评测