职位详情
职位描述
一、GUI Agent多模态大模型研发与优化
1. 研发并落地多模态大模型架构,攻克跨模态语义对齐、实时数据流处理等关键技术难点。
2. 提升模型生成性能,支撑高复杂度多模态交互场景,达成毫秒级响应目标。
3. 参与GUI Agent相关数据集的设计搭建及数据质量优化工作。
4. 参与用户意图识别、任务分解规划以及长周期任务端到端执行能力的建设与迭代。
二、多 Agent 系统算法设计
1. 搭建多 Agent 协同系统框架,制定动态任务调度与博弈机制,应对资源竞争、动态组队等复杂决策环境。
2. 融合多种强化学习方法,提升多智能体协作效率与鲁棒性。
3. 参与工业级 Agent 系统的实际部署,推进大模型与工具生态的深度融合。
三、行业场景落地与创新
1. 探索生成式 AI 与 RAG(检索增强生成)技术融合路径,增强垂直领域知识推理能力。
2. 研究行业Deep Research与强化学习联合应用,提升行业深度研究的技术竞争力。
3. 掌握AIGC中视频或图像生成技术,具备主流视频生成项目经验者优先,或拥有视频生成模型调优实践经验者优先。
4. 持续追踪前沿技术动态,推动新技术方案的探索与工程化落地。
一、GUI Agent多模态大模型研发与优化
1. 研发并落地多模态大模型架构,攻克跨模态语义对齐、实时数据流处理等关键技术难点。
2. 提升模型生成性能,支撑高复杂度多模态交互场景,达成毫秒级响应目标。
3. 参与GUI Agent相关数据集的设计搭建及数据质量优化工作。
4. 参与用户意图识别、任务分解规划以及长周期任务端到端执行能力的建设与迭代。
二、多 Agent 系统算法设计
1. 搭建多 Agent 协同系统框架,制定动态任务调度与博弈机制,应对资源竞争、动态组队等复杂决策环境。
2. 融合多种强化学习方法,提升多智能体协作效率与鲁棒性。
3. 参与工业级 Agent 系统的实际部署,推进大模型与工具生态的深度融合。
三、行业场景落地与创新
1. 探索生成式 AI 与 RAG(检索增强生成)技术融合路径,增强垂直领域知识推理能力。
2. 研究行业Deep Research与强化学习联合应用,提升行业深度研究的技术竞争力。
3. 掌握AIGC中视频或图像生成技术,具备主流视频生成项目经验者优先,或拥有视频生成模型调优实践经验者优先。
4. 持续追踪前沿技术动态,推动新技术方案的探索与工程化落地。
2026-05-17 14:17
IP属地:上海
职位福利
硕士5-10年

阿里云计算有限公司
不需要融资 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











