职位详情
岗位职责
1. AI基座架构:规划AI基座整体技术架构,涵盖知识库、智能体平台、大模型训练与推理平台、模型服务系统及算力调度体系,保障各组件高效联动与协同运作。
2. 数据架构设计:主导AI相关平台的数据架构建设,包括时序数据库、向量数据库与数据湖的技术选型、部署规划与使用策略制定。
3. 核心技术模块架构:
- 知识库架构:构建知识库存储与检索机制,支持实时知识注入与上下文增强能力。
- 智能体平台架构:搭建多智能体协作框架,实现工作流编排、自主决策逻辑与跨平台通信支持。
- 训推平台架构:设计混合并行训练方案(数据/流水线/模型并行),提升分布式训练效率,支撑千亿参数级别模型的微调任务。
- 算力调度架构:研发GPU资源池化算法与异构算力调度机制,提升底层资源利用效率。
4. 工程化与性能优化:建立AI工程化规范,覆盖模型版本控制、运行监控、A/B测试等环节,打造从数据标注到模型推理的完整MLOps流程体系。主导模型服务架构设计,集成TorchServe/vLLM等工具,支持模型动态加载、弹性伸缩与灰度上线,确保服务稳定性。
5. 跨团队技术协同:为算法、工程与产品团队提供架构指导,攻克分布式训练容错、模型量化适配等关键技术瓶颈。推动AI底座与行业应用深度融合,输出技术方案文档与招投标所需技术材料。
6. 关注人工智能领域前沿进展,制定平台长期技术发展路径。
任职要求
1. 专业背景:计算机科学、人工智能、高性能计算等相关方向硕士及以上学位,具备5年以上工作经验,分布式系统或并行计算方向表现突出者优先。
2. 技术能力:熟练掌握PyTorch/TensorFlow的分布式训练机制,精通DeepSpeed等加速框架,了解混合并行训练与模型压缩方法(如量化、蒸馏)。
3. 云原生与算力管理:深入理解Kubernetes容器编排原理与资源调度策略,具有实际集群运维与优化经验。
4. 熟悉主流智能体开发平台如Dify、RAGFlow、LlamaIndex,掌握RAG技术体系与Agent间通信协议。
5. 具备系统级架构设计能力,拥有中大型AI平台架构落地实践经验。
1. AI基座架构:规划AI基座整体技术架构,涵盖知识库、智能体平台、大模型训练与推理平台、模型服务系统及算力调度体系,保障各组件高效联动与协同运作。
2. 数据架构设计:主导AI相关平台的数据架构建设,包括时序数据库、向量数据库与数据湖的技术选型、部署规划与使用策略制定。
3. 核心技术模块架构:
- 知识库架构:构建知识库存储与检索机制,支持实时知识注入与上下文增强能力。
- 智能体平台架构:搭建多智能体协作框架,实现工作流编排、自主决策逻辑与跨平台通信支持。
- 训推平台架构:设计混合并行训练方案(数据/流水线/模型并行),提升分布式训练效率,支撑千亿参数级别模型的微调任务。
- 算力调度架构:研发GPU资源池化算法与异构算力调度机制,提升底层资源利用效率。
4. 工程化与性能优化:建立AI工程化规范,覆盖模型版本控制、运行监控、A/B测试等环节,打造从数据标注到模型推理的完整MLOps流程体系。主导模型服务架构设计,集成TorchServe/vLLM等工具,支持模型动态加载、弹性伸缩与灰度上线,确保服务稳定性。
5. 跨团队技术协同:为算法、工程与产品团队提供架构指导,攻克分布式训练容错、模型量化适配等关键技术瓶颈。推动AI底座与行业应用深度融合,输出技术方案文档与招投标所需技术材料。
6. 关注人工智能领域前沿进展,制定平台长期技术发展路径。
任职要求
1. 专业背景:计算机科学、人工智能、高性能计算等相关方向硕士及以上学位,具备5年以上工作经验,分布式系统或并行计算方向表现突出者优先。
2. 技术能力:熟练掌握PyTorch/TensorFlow的分布式训练机制,精通DeepSpeed等加速框架,了解混合并行训练与模型压缩方法(如量化、蒸馏)。
3. 云原生与算力管理:深入理解Kubernetes容器编排原理与资源调度策略,具有实际集群运维与优化经验。
4. 熟悉主流智能体开发平台如Dify、RAGFlow、LlamaIndex,掌握RAG技术体系与Agent间通信协议。
5. 具备系统级架构设计能力,拥有中大型AI平台架构落地实践经验。
2026-02-25 08:11
IP属地:广东深圳
职位福利
本科5-10年

深圳邦芒人力资源有限公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI架构师(工作地大连)
2.9-3.5万元/月
架构师3-5年本科机器学习深度学习大模型算法TransformerDNNRCNN自然语言处理搜索/推荐算法PyTorch
深圳 龙岗区









