职位详情
招聘简章:多模态语音增强(AVSE)算法工程师职位类别:研发 / 人工智能 / 信号处理 目标人群:应届本科/硕士,或具有1-2年相关工作经验的初级研发人员 工作地点:[合肥]【岗位职责】1.算法研发与优化:研究并开发基于唇形识别的多模态语音增强(AVSE)及目标说话人提取算法,利用视觉线索(如唇部运动和面部表情)提升系统在“鸡尾酒会”环境下的鲁棒性。2.跨模态融合方案设计:设计高效的多模态特征融合架构,研究包括通道拼接、跨模态注意力机制及特征同步技术,以解决音视频流异步及信息冗余问题。3.实时性与因果性建模:针对嵌入式/移动端部署需求,进行因果建模,确保算法仅依赖当前及过去帧,满足超低延迟(目标延迟 < 40ms)的实时处理标准。4.模型轻量化与移植:应用权重剪枝、量化及知识蒸馏等技术优化模型复杂度,使其能够顺畅移植至 CPU 或嵌入式 DSP/加速单元。5.性能评估与验证:在 LRS2、LRS3、GRID 或 VoxCeleb2 等主流多模态数据集上进行验证,并使用 PESQ、STOI、SI-SDR 及词错误率(WER)等指标评估算法表现。【任职要求】1.教育背景:计算机、电子工程、通信、声学或数学相关专业硕士及以上学历。2.深度学习功底: o精通 PyTorch 开发,熟悉常见的神经网络架构,如 CNN、LSTM/GRU、Transformer 及 Conformer。o具备较强的算法实现能力,能复现前沿学术论文(如 RAVEN, AV-CrossNet 等)。3.语音与图像处理基础: o掌握短时傅里叶变换(STFT/iSTFT)、时频域掩码估计(Masking)或复数谱映射技术。o熟悉计算机视觉预处理流程,包括人脸检测、唇部感兴趣区域(ROI)提取及关键点对齐(如使用 OpenCV, MediaPipe 或 face-alignment)。4.工程意识:深刻理解实时系统对算法复杂度的限制,关注模型参数量(Params)与实时因子(RTF)。
【加分项】1.竞赛经验:在 AVSE Challenge、MISP Challenge 或 ICASSP DNSDNS Challenge 等多模态/语音竞赛中取得优异成绩者优先。
2.硬件落地经验:有算法成功部署至 嵌入式设备(如 ARM, DSP, Jetso
3.前沿探索:熟悉扩散模型(Diffusion Models)、生成对抗网络(GAN)或空间音频(Spatial Audio)处理技术者优先。
4.论文发表:在 ICASSP、Interspeech、CVPR 或 AAAI 等国际顶级会议发表过相关论文者。
简历可以投以下邮箱
【加分项】1.竞赛经验:在 AVSE Challenge、MISP Challenge 或 ICASSP DNSDNS Challenge 等多模态/语音竞赛中取得优异成绩者优先。
2.硬件落地经验:有算法成功部署至 嵌入式设备(如 ARM, DSP, Jetso
3.前沿探索:熟悉扩散模型(Diffusion Models)、生成对抗网络(GAN)或空间音频(Spatial Audio)处理技术者优先。
4.论文发表:在 ICASSP、Interspeech、CVPR 或 AAAI 等国际顶级会议发表过相关论文者。
简历可以投以下邮箱
2026-06-24 12:54
IP属地:江苏
职位福利
本科1-3年语音算法多模态算法Python发表算法相关优秀论文

深圳鱼亮科技有限公司
天使轮 · 0-20人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
无人机感知系统与算法开发工程师
1.5-2万元/月
算法工程师1-3年硕士深度学习多模态算法大模型算法GPTTransformerRCNNGNNPyTorchOpenCVC++Python激光雷达点云处理
合肥 蜀山区
算法实习生(低光照增强方向)
200-250元/天
算法工程师经验不限硕士发表算法相关优秀论文暗光增强图像算法深度学习图像增强参加算法相关竞赛/获奖Python视频增强
合肥 蜀山区
无人机导航算法工程师
1.4-2万元/月
算法工程师1-3年硕士C/C++Shell深度学习大模型算法多模态算法算法工程化经验强化学习融合感知算法SLAM算法MATLAB推荐算法模型加速/性能优化
合肥 蜀山区









