职位详情
工作描述
1. 端到端架构设计:主导音乐生成大模型的核心系统架构,探索歌词、旋律与伴奏一体化建模的技术路径。
2. 音频编解码:开发高效率音频 Tokenizer,实现音频到离散词元(Tokens)的精准转换,在保持高压缩率的同时充分还原人声细节与音乐表现力。
3. 多模态对齐与可控性:研究基于提示词(Prompt)的音乐控制机制,精确调控曲风、情绪、配器及 BPM,并解决歌词与旋律在时序上的同步对齐问题。
4. 前沿技术预研:持续跟进 YuE、Suno、Udio 等先进方案的演进动态,开展长文本建模、混合专家模型(MoE)等方向的技术创新与实验验证。
任职资格
学历背景:计算机、人工智能、电子工程或信号处理相关专业
技术能力:熟练掌握 PyTorch 框架,具备生成式模型的深入理解,拥有超大规模模型(10B+)训练实践经验,并在音频信号处理领域积累至少 1 年实际项目经验。
加分项:曾在 NeurIPS、ICASSP、ISMIR 等学术会议发表相关成果,或参与过音频 Tokenization 的开源项目;具备乐理知识(如和弦进行、节拍结构、调性分析),或拥有计算音乐学研究经历。
1. 端到端架构设计:主导音乐生成大模型的核心系统架构,探索歌词、旋律与伴奏一体化建模的技术路径。
2. 音频编解码:开发高效率音频 Tokenizer,实现音频到离散词元(Tokens)的精准转换,在保持高压缩率的同时充分还原人声细节与音乐表现力。
3. 多模态对齐与可控性:研究基于提示词(Prompt)的音乐控制机制,精确调控曲风、情绪、配器及 BPM,并解决歌词与旋律在时序上的同步对齐问题。
4. 前沿技术预研:持续跟进 YuE、Suno、Udio 等先进方案的演进动态,开展长文本建模、混合专家模型(MoE)等方向的技术创新与实验验证。
任职资格
学历背景:计算机、人工智能、电子工程或信号处理相关专业
技术能力:熟练掌握 PyTorch 框架,具备生成式模型的深入理解,拥有超大规模模型(10B+)训练实践经验,并在音频信号处理领域积累至少 1 年实际项目经验。
加分项:曾在 NeurIPS、ICASSP、ISMIR 等学术会议发表相关成果,或参与过音频 Tokenization 的开源项目;具备乐理知识(如和弦进行、节拍结构、调性分析),或拥有计算音乐学研究经历。
2026-06-17 12:42
IP属地:安徽合肥
职位福利
本科1-3年大模型算法多模态算法

合肥左琴右书网络科技有限公司
不需要融资 · 20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
算法实习生(目标识别与类别划分方向)
240-250元/天
算法工程师经验不限本科发表算法相关优秀论文机器学习图像算法检测深度学习算法工程化经验参加算法相关竞赛/获奖Python分类
合肥 蜀山区








