职位详情
一、岗位使命
聚焦下一代企业级多智能体(Multi-Agent)系统的整体架构与工程实现,贯通「平台-框架-模型-场景」全链路能力,构建具备可复用性、可编排性和可观测性的AI Agent基础体系,支撑业务团队高效落地智能办公、智能家居等半自动或全自动化智能体应用。
二、核心职责
架构设计
• 参考 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 等系统逻辑,构建“低代码+高扩展”的多智能体协同框架;
• 定义 Agent 间通信机制(消息总线、状态同步、生命周期管理)、任务调度方案(DAG/Graph/Chain)及可观测架构(Trace、Metrics、Logging)。
技术选型与实现
• 主导至少一种 AI 框架(TensorFlow / PyTorch / LangChain / LlamaIndex)的选型与二次封装,搭建标准化模型接入层;
• 推进 RAG(向量+关键词+图检索)、大模型记忆机制、多智能体有向图控制三大核心技术的工程落地。
多模态交互
• 基于 DeepSeek-VL、Qwen-VL、Mini-CPM-V 等视觉语言模型,实现图文问答、图表解析、OCR 联合检索增强等能力;
• 利用机器人端摄像头、红外、传感器、麦克风等多源感知数据,实现对机器人动作及移动APP界面的智能体控制;
• 构建统一模态路由层(文本 / 图像 / 音频 / 视频),确保端到端响应延迟控制在200ms以内。
平台化与工具链
• 将核心能力封装为可插拔模块,集成至内部 Agent Marketplace;
• 开发一键式 CLI 与 GUI 工具(借鉴 Claude Desktop 插件模式),支持产品与运营人员零代码配置复杂 Agent 流程。
性能与治理
• 建立大模型推理性能基准与成本评估模型,推动量化压缩、投机解码、分布式推理等优化策略;
• 制定 AI 安全合规规范(PII 脱敏、敏感词过滤、对齐性评测)并落地执行。
三、硬性要求
5 年以上后端或算法工程经验,其中包含不少于 2 年多智能体 / LLM 系统架构实践经验;
熟练掌握 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 中至少 3 项,能清晰说明其核心数据流与插件机制;
精通 Python / TypeScript,具备 LangChain 或 LlamaIndex 源码级定制能力;
独立完成过基于 RAG 的知识库问答系统(支持百万级文档、千级 QPS),并可提供完整端到端指标(********、Latency、Cost);
熟悉 DeepSeek、Qwen、Mini-CPM 系列模型结构、量化方法及 API 差异,能根据业务需求完成模型选型。
四、加分项
• 向主流开源 Agent 框架提交 PR ≥ 3 次;
• 具备 MCP(Model Context Protocol)或 A2A(Agent2Agent)协议实际应用经验;
• 掌握云原生技术栈(K8s、Knative、Argo Workflows)及 GPU 推理调度方案(vLLM、TensorRT-LLM)。
聚焦下一代企业级多智能体(Multi-Agent)系统的整体架构与工程实现,贯通「平台-框架-模型-场景」全链路能力,构建具备可复用性、可编排性和可观测性的AI Agent基础体系,支撑业务团队高效落地智能办公、智能家居等半自动或全自动化智能体应用。
二、核心职责
架构设计
• 参考 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 等系统逻辑,构建“低代码+高扩展”的多智能体协同框架;
• 定义 Agent 间通信机制(消息总线、状态同步、生命周期管理)、任务调度方案(DAG/Graph/Chain)及可观测架构(Trace、Metrics、Logging)。
技术选型与实现
• 主导至少一种 AI 框架(TensorFlow / PyTorch / LangChain / LlamaIndex)的选型与二次封装,搭建标准化模型接入层;
• 推进 RAG(向量+关键词+图检索)、大模型记忆机制、多智能体有向图控制三大核心技术的工程落地。
多模态交互
• 基于 DeepSeek-VL、Qwen-VL、Mini-CPM-V 等视觉语言模型,实现图文问答、图表解析、OCR 联合检索增强等能力;
• 利用机器人端摄像头、红外、传感器、麦克风等多源感知数据,实现对机器人动作及移动APP界面的智能体控制;
• 构建统一模态路由层(文本 / 图像 / 音频 / 视频),确保端到端响应延迟控制在200ms以内。
平台化与工具链
• 将核心能力封装为可插拔模块,集成至内部 Agent Marketplace;
• 开发一键式 CLI 与 GUI 工具(借鉴 Claude Desktop 插件模式),支持产品与运营人员零代码配置复杂 Agent 流程。
性能与治理
• 建立大模型推理性能基准与成本评估模型,推动量化压缩、投机解码、分布式推理等优化策略;
• 制定 AI 安全合规规范(PII 脱敏、敏感词过滤、对齐性评测)并落地执行。
三、硬性要求
5 年以上后端或算法工程经验,其中包含不少于 2 年多智能体 / LLM 系统架构实践经验;
熟练掌握 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 中至少 3 项,能清晰说明其核心数据流与插件机制;
精通 Python / TypeScript,具备 LangChain 或 LlamaIndex 源码级定制能力;
独立完成过基于 RAG 的知识库问答系统(支持百万级文档、千级 QPS),并可提供完整端到端指标(********、Latency、Cost);
熟悉 DeepSeek、Qwen、Mini-CPM 系列模型结构、量化方法及 API 差异,能根据业务需求完成模型选型。
四、加分项
• 向主流开源 Agent 框架提交 PR ≥ 3 次;
• 具备 MCP(Model Context Protocol)或 A2A(Agent2Agent)协议实际应用经验;
• 掌握云原生技术栈(K8s、Knative、Argo Workflows)及 GPU 推理调度方案(vLLM、TensorRT-LLM)。
2026-05-15 12:16
IP属地:浙江杭州
职位福利
硕士5-10年

杭州超节点信息科技有限公司
A轮 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









