职位详情
多模态大模型方向
工作职责
1、开展多模态大模型(涵盖语音、图像等领域)的算法研发与实现,重点推进语音方向技术的创新与性能提升。
2、深入实现并优化语音识别(ASR)、语音合成(TTS)、语音情感分析、语音理解(SLU)等关键技术模块。
3、研究多模态融合方法,增强语音与文本、图像等其他模态之间的协同建模能力。
4、结合具体业务需求,持续优化模型表现,应对噪声干扰、方言差异、低资源语言等实际挑战。
5、关注学术界与工业界的技术动态,推动前沿成果在产品中的落地应用。
6、协同产品及工程团队,推进算法模型的集成与部署,保障技术方案的高效实施。
任职要求
教育:硕士及以上学历,计算机、电子信息工程、信号与信息处理等相关3T专业背景;
技能:
1、掌握深度学习理论基础,熟悉kaldi、tensorflow、cntk等主流语音深度学习框架;
2、熟练使用C/C++、java至少一种编程语言,具备shell、python等脚本语言的实际应用经验;
3、具有实际项目开发经历;了解语音信号处理基本原理,掌握语音识别(ASR)、语音合成(TTS)、语音增强、声学建模等相关技术;了解GPT、Whisper、CLIP等多模态大模型的核心机制与应用场景;熟悉LibriSpeech、Common Voice等常用语音数据集及WER、CER等评估标准。
经验:具备2年及以上相关领域工作经验。
语义大模型方向
工作职责
1、大模型研发与性能提升
1)主导开源大模型的微调与优化工作,改进现有算法,提升模型精度、运行效率和系统扩展性;
2)运用PyTorch等主流机器学习框架,完成大模型的训练与测试任务;
3)研究多轮对话机制、上下文建模、个性化交互等先进技术,提升对话系统的智能表现。
2、追踪技术前沿并推动创新
1)持续跟进人工智能领域最新发展趋势(如DeepSeek等新技术),并将先进方法融入实际解决方案;
2)参与深度学习、强化学习等方向的研究工作,促进科研成果向产品能力转化。
3、团队协作与知识传递
1)与业务、产品和工程团队密切配合,确保算法设计满足产品功能需求;
2)在团队内开展技术分享,定期组织技术交流与培训活动。
任职要求
1、学历与经验:
计算机科学、统计学、数学或相关专业硕士或博士学历;
具备3年以上相关工作经验,有完整的大模型项目落地经验;
2、专业技能:
精通TensorFlow、PyTorch等至少一种主流机器学习框架;
熟练掌握Python编程,具备扎实的算法与数据结构基础;
有基于GPU或TPU进行深度学习模型训练的实际操作经验;
3、分析与问题解决能力:
具备出色的数据分析能力,能从复杂数据中挖掘有效特征与规律;
具备独立分析和解决复杂技术问题的能力;
4、沟通与团队协作能力:
具备良好的沟通表达能力和团队合作意识,能够跨团队高效协作;
适应快节奏、敏捷化的工作环境,保持高效执行力;
5、语言能力:
具备良好的英语读写与口语能力,可熟练阅读和撰写专业技术文档。
工作职责
1、开展多模态大模型(涵盖语音、图像等领域)的算法研发与实现,重点推进语音方向技术的创新与性能提升。
2、深入实现并优化语音识别(ASR)、语音合成(TTS)、语音情感分析、语音理解(SLU)等关键技术模块。
3、研究多模态融合方法,增强语音与文本、图像等其他模态之间的协同建模能力。
4、结合具体业务需求,持续优化模型表现,应对噪声干扰、方言差异、低资源语言等实际挑战。
5、关注学术界与工业界的技术动态,推动前沿成果在产品中的落地应用。
6、协同产品及工程团队,推进算法模型的集成与部署,保障技术方案的高效实施。
任职要求
教育:硕士及以上学历,计算机、电子信息工程、信号与信息处理等相关3T专业背景;
技能:
1、掌握深度学习理论基础,熟悉kaldi、tensorflow、cntk等主流语音深度学习框架;
2、熟练使用C/C++、java至少一种编程语言,具备shell、python等脚本语言的实际应用经验;
3、具有实际项目开发经历;了解语音信号处理基本原理,掌握语音识别(ASR)、语音合成(TTS)、语音增强、声学建模等相关技术;了解GPT、Whisper、CLIP等多模态大模型的核心机制与应用场景;熟悉LibriSpeech、Common Voice等常用语音数据集及WER、CER等评估标准。
经验:具备2年及以上相关领域工作经验。
语义大模型方向
工作职责
1、大模型研发与性能提升
1)主导开源大模型的微调与优化工作,改进现有算法,提升模型精度、运行效率和系统扩展性;
2)运用PyTorch等主流机器学习框架,完成大模型的训练与测试任务;
3)研究多轮对话机制、上下文建模、个性化交互等先进技术,提升对话系统的智能表现。
2、追踪技术前沿并推动创新
1)持续跟进人工智能领域最新发展趋势(如DeepSeek等新技术),并将先进方法融入实际解决方案;
2)参与深度学习、强化学习等方向的研究工作,促进科研成果向产品能力转化。
3、团队协作与知识传递
1)与业务、产品和工程团队密切配合,确保算法设计满足产品功能需求;
2)在团队内开展技术分享,定期组织技术交流与培训活动。
任职要求
1、学历与经验:
计算机科学、统计学、数学或相关专业硕士或博士学历;
具备3年以上相关工作经验,有完整的大模型项目落地经验;
2、专业技能:
精通TensorFlow、PyTorch等至少一种主流机器学习框架;
熟练掌握Python编程,具备扎实的算法与数据结构基础;
有基于GPU或TPU进行深度学习模型训练的实际操作经验;
3、分析与问题解决能力:
具备出色的数据分析能力,能从复杂数据中挖掘有效特征与规律;
具备独立分析和解决复杂技术问题的能力;
4、沟通与团队协作能力:
具备良好的沟通表达能力和团队合作意识,能够跨团队高效协作;
适应快节奏、敏捷化的工作环境,保持高效执行力;
5、语言能力:
具备良好的英语读写与口语能力,可熟练阅读和撰写专业技术文档。
2026-05-16 12:32
IP属地:北京
职位福利
硕士1-3年语音处理语音增强语音信号处理声学建模语音降噪波束形成ASR声纹识别TTS语音评测

北京筑英达信息技术有限公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI Agent智能体算法工程师
1.2-2万元/月
算法工程师经验不限学历不限大模型算法PyTorchTensorFlowPythonAI AGENT研发多智能体协作系统构建大语言模型落地
北京 西城区

王永青 · 阿提拉3日内活跃








