职位详情
一、岗位使命
聚焦下一代企业级多智能体(Multi-Agent)系统的核心架构与工程实现,贯通「平台-框架-模型-场景」全技术链路,构建具备可复用性、可编排性和可观测性的AI Agent底层设施,赋能业务团队高效落地智能办公、智能家居等半自动及全自动化智能体应用。
二、核心职责
架构设计
• 参考 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 等系统设计理念,构建“低代码+高扩展”的多智能体协同架构;
• 定义 Agent 间通信机制(消息总线、状态同步、生命周期管理)、任务调度方案(DAG/Graph/Chain)以及可观测性体系(Trace、Metrics、Logging)。
技术选型与实现
• 主导至少一种 AI 框架(TensorFlow / PyTorch / LangChain / LlamaIndex)的选型与封装,搭建标准化模型接入层;
• 推进 RAG(向量+关键词+图检索)、大模型记忆机制、多智能体有向图控制三大核心技术的工程落地。
多模态交互
• 基于 DeepSeek-VL、Qwen-VL、Mini-CPM-V 等视觉语言模型,支持图文问答、图表解析、OCR融合检索等场景;
• 利用机器人端摄像头、红外传感器、麦克风等多源感知设备,实现对机器人动作及移动APP界面的智能体控制;
• 构建统一模态路由层(文本 / 图像 / 音频 / 视频),确保端到端响应延迟控制在200ms以内。
平台化与工具链
• 将上述能力模块化为可插拔组件,集成至内部 Agent 组件市场;
• 开发一键式 CLI 与 GUI 工具(借鉴 Claude Desktop 插件模式),支持产品与运营人员零代码配置复杂 Agent 流程。
性能与治理
• 建立大模型推理性能基准与成本评估模型,推进量化压缩、投机解码、分布式推理等优化策略;
• 制定 AI 安全合规标准(PII 脱敏、敏感词过滤、对齐性评测)。
三、硬性要求
5 年以上后端或算法工程经验,其中至少 2 年专注于多智能体系统或大模型架构设计;
熟练掌握 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 中不少于 3 项,能清晰说明其数据流与插件机制;
精通 Python / TypeScript,具备 LangChain 或 LlamaIndex 源码级定制能力;
独立完成过基于 RAG 的知识库问答系统(支持百万级文档、达到千级 QPS),并可提供完整性能指标(********、Latency、Cost);
熟悉 DeepSeek、Qwen、Mini-CPM 的模型结构、量化方法及 API 特性,能根据业务需求进行合理选型。
四、加分项
• 在主流开源 Agent 框架提交 PR ≥ 3 次;
• 具备 MCP(Model Context Protocol)或 A2A(Agent2Agent)协议实际落地经验;
• 掌握云原生技术栈(K8s、Knative、Argo Workflows)及 GPU 推理调度方案(vLLM、TensorRT-LLM)。
聚焦下一代企业级多智能体(Multi-Agent)系统的核心架构与工程实现,贯通「平台-框架-模型-场景」全技术链路,构建具备可复用性、可编排性和可观测性的AI Agent底层设施,赋能业务团队高效落地智能办公、智能家居等半自动及全自动化智能体应用。
二、核心职责
架构设计
• 参考 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 等系统设计理念,构建“低代码+高扩展”的多智能体协同架构;
• 定义 Agent 间通信机制(消息总线、状态同步、生命周期管理)、任务调度方案(DAG/Graph/Chain)以及可观测性体系(Trace、Metrics、Logging)。
技术选型与实现
• 主导至少一种 AI 框架(TensorFlow / PyTorch / LangChain / LlamaIndex)的选型与封装,搭建标准化模型接入层;
• 推进 RAG(向量+关键词+图检索)、大模型记忆机制、多智能体有向图控制三大核心技术的工程落地。
多模态交互
• 基于 DeepSeek-VL、Qwen-VL、Mini-CPM-V 等视觉语言模型,支持图文问答、图表解析、OCR融合检索等场景;
• 利用机器人端摄像头、红外传感器、麦克风等多源感知设备,实现对机器人动作及移动APP界面的智能体控制;
• 构建统一模态路由层(文本 / 图像 / 音频 / 视频),确保端到端响应延迟控制在200ms以内。
平台化与工具链
• 将上述能力模块化为可插拔组件,集成至内部 Agent 组件市场;
• 开发一键式 CLI 与 GUI 工具(借鉴 Claude Desktop 插件模式),支持产品与运营人员零代码配置复杂 Agent 流程。
性能与治理
• 建立大模型推理性能基准与成本评估模型,推进量化压缩、投机解码、分布式推理等优化策略;
• 制定 AI 安全合规标准(PII 脱敏、敏感词过滤、对齐性评测)。
三、硬性要求
5 年以上后端或算法工程经验,其中至少 2 年专注于多智能体系统或大模型架构设计;
熟练掌握 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 中不少于 3 项,能清晰说明其数据流与插件机制;
精通 Python / TypeScript,具备 LangChain 或 LlamaIndex 源码级定制能力;
独立完成过基于 RAG 的知识库问答系统(支持百万级文档、达到千级 QPS),并可提供完整性能指标(********、Latency、Cost);
熟悉 DeepSeek、Qwen、Mini-CPM 的模型结构、量化方法及 API 特性,能根据业务需求进行合理选型。
四、加分项
• 在主流开源 Agent 框架提交 PR ≥ 3 次;
• 具备 MCP(Model Context Protocol)或 A2A(Agent2Agent)协议实际落地经验;
• 掌握云原生技术栈(K8s、Knative、Argo Workflows)及 GPU 推理调度方案(vLLM、TensorRT-LLM)。
2026-05-15 14:42
IP属地:浙江杭州
职位福利
本科5-10年平台架构

杭州超节点信息科技有限公司
A轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >












