职位详情
1、架构设计
1 参考 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 等系统设计理念,构建“低代码+高扩展性”的多智能体协同架构;
2 制定 Agent 间通信规范(消息总线、状态同步、生命周期管理)、任务调度机制(支持 DAG/Graph/Chain 模式)以及可观测性体系(涵盖 Trace、Metrics、Logging)。
技术选型与实现
3 完成至少一种 AI 框架(TensorFlow / PyTorch / LangChain / LlamaIndex)的技术评估与二次封装,搭建统一的模型接入层;
4 推进 RAG 技术体系落地(融合向量、关键词与图检索)、大模型记忆机制建设,以及多智能体有向图控制逻辑的工程实现。
2、多模态交互
1 基于 DeepSeek-VL、Qwen-VL、Mini-CPM-V 等视觉语言模型,实现图文问答、图表解析、OCR 结合检索增强等应用;
2 利用机器人端摄像头、红外传感器、麦克风等多源感知设备,实现智能体对机器人动作的精准控制,及对移动 APP UI 的自动化操作。
3 构建统一的模态路由层(支持文本 / 图像 / 音频 / 视频),确保端到端响应延迟控制在 200ms 以内。
3、平台化与工具链
1 将上述能力模块化,沉淀为可插拔组件,并发布至内部 Agent Marketplace;
2 搭建一键式 CLI 与 GUI 工具(借鉴 Claude Desktop 插件机制),支持产品与运营人员零代码配置复杂 Agent 流程。
4、性能与治理
1 建立大模型推理性能基准与成本核算模型,推动量化压缩、投机解码、分布式推理等优化方案;
2 制定 AI 安全合规标准(包括 PII 脱敏、敏感词过滤、对齐性评估)。
硬性要求
5 年以上后端或算法工程背景,其中具备 2 年以上多智能体系统或大模型架构实践经验;
熟练掌握 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 中至少 3 项,能清晰说明其核心数据流与插件机制;
精通 Python / TypeScript,具备 LangChain 或 LlamaIndex 源码级定制能力;
独立主导过基于 RAG 的知识库问答系统落地(支撑百万级文档、千级 QPS),并可提供完整的端到端性能指标(********、Latency、Cost);
熟悉 DeepSeek、Qwen、Mini-CPM 系列模型的结构特点、量化策略及 API 差异,能根据业务需求完成合理选型。
加分项
1 在主流开源 Agent 框架中提交并合并 PR ≥ 3 次;
2 具备 MCP(Model Context Protocol)或 A2A(Agent2Agent)协议实际落地经验;
3 掌握云原生技术栈(K8s、Knative、Argo Workflows)及 GPU 推理调度框架(vLLM、TensorRT-LLM)。
1 参考 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 等系统设计理念,构建“低代码+高扩展性”的多智能体协同架构;
2 制定 Agent 间通信规范(消息总线、状态同步、生命周期管理)、任务调度机制(支持 DAG/Graph/Chain 模式)以及可观测性体系(涵盖 Trace、Metrics、Logging)。
技术选型与实现
3 完成至少一种 AI 框架(TensorFlow / PyTorch / LangChain / LlamaIndex)的技术评估与二次封装,搭建统一的模型接入层;
4 推进 RAG 技术体系落地(融合向量、关键词与图检索)、大模型记忆机制建设,以及多智能体有向图控制逻辑的工程实现。
2、多模态交互
1 基于 DeepSeek-VL、Qwen-VL、Mini-CPM-V 等视觉语言模型,实现图文问答、图表解析、OCR 结合检索增强等应用;
2 利用机器人端摄像头、红外传感器、麦克风等多源感知设备,实现智能体对机器人动作的精准控制,及对移动 APP UI 的自动化操作。
3 构建统一的模态路由层(支持文本 / 图像 / 音频 / 视频),确保端到端响应延迟控制在 200ms 以内。
3、平台化与工具链
1 将上述能力模块化,沉淀为可插拔组件,并发布至内部 Agent Marketplace;
2 搭建一键式 CLI 与 GUI 工具(借鉴 Claude Desktop 插件机制),支持产品与运营人员零代码配置复杂 Agent 流程。
4、性能与治理
1 建立大模型推理性能基准与成本核算模型,推动量化压缩、投机解码、分布式推理等优化方案;
2 制定 AI 安全合规标准(包括 PII 脱敏、敏感词过滤、对齐性评估)。
硬性要求
5 年以上后端或算法工程背景,其中具备 2 年以上多智能体系统或大模型架构实践经验;
熟练掌握 AutoGen-GraphFlow、Magentic-UI、Dify、N8N、Claude Desktop 中至少 3 项,能清晰说明其核心数据流与插件机制;
精通 Python / TypeScript,具备 LangChain 或 LlamaIndex 源码级定制能力;
独立主导过基于 RAG 的知识库问答系统落地(支撑百万级文档、千级 QPS),并可提供完整的端到端性能指标(********、Latency、Cost);
熟悉 DeepSeek、Qwen、Mini-CPM 系列模型的结构特点、量化策略及 API 差异,能根据业务需求完成合理选型。
加分项
1 在主流开源 Agent 框架中提交并合并 PR ≥ 3 次;
2 具备 MCP(Model Context Protocol)或 A2A(Agent2Agent)协议实际落地经验;
3 掌握云原生技术栈(K8s、Knative、Argo Workflows)及 GPU 推理调度框架(vLLM、TensorRT-LLM)。
2026-05-20 15:10
IP属地:浙江杭州
职位福利
硕士5-10年TypeScript分布式技术Python

杭州超节点信息科技有限公司
A轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








