职位详情
ai独角兽-首席架构师 - AI 行业应用-上海/北京:
岗位职责
1. 主导大模型推理服务(LLM/多模态/视觉)的统一架构设计,覆盖云端高并发、边缘低延迟、端侧轻量化三种部署形态,持续提升吞吐量与性价比
2. 构建面向多行业场景的公共工程平台(模型编排、Prompt/RAG/Agent 框架、多模态 Pipeline、数据飞轮),将 Demo→生产周期压缩到天级
3. 建立推理加速(vLLM/TensorRT-LLM/自研 kernel)、显存优化(长上下文/MoE 调度)、NVIDIA GPU 与国产 AI 芯片异构适配的工程体系
4. 制定跨业务的架构规范、API 标准、SLA 体系和技术评审机制
5. 跟踪 Agent、端侧推理等前沿方向,主导技术预研,输出技术路线规划与行业洞察报告
6. 代表公司在行业峰会、技术社区输出架构实践,建立团队在 AI Infra 领域的技术影响力
任职要求
- 10 年以上大规模系统架构经验,其中 3 年以上 AI/ML 系统工程化经验
- 主导过亿级用户或千级 QPS 的 AI 推理/服务系统的架构设计与落地
- 精通大模型推理链路(模型加载、KV Cache、批处理调度、流式输出),有性能调优实战经验
- 深度理解分布式系统(微服务、K8s、服务网格)和高可用架构设计
- 了解异构算力环境(NVIDIA GPU + 国产 AI 芯片)下的推理部署差异,有混合算力调度经验
- 多领域 AI 工程落地经验——至少覆盖以下 3 个方向:智能影像/视觉感知、自然语言/对话系统、多模态交互、语音系统、智能决策(金融风控等)、车载/嵌入式 AI
- 出色的跨团队技术影响力——能推动多个并行团队采纳统一技术方案
- 计算机/软件工程/电子信息相关专业硕士及以上
优先条件
- 多产品线平台型架构治理经验(横向架构师/技术委员会角色)
- B 端行业交付 + C 端产品运营双线架构经验
- 参与过开源推理框架或 AI 基础设施项目的核心开发
- 在 AI Infra 领域有行业影响力(会议演讲、开源贡献、技术
岗位职责
1. 主导大模型推理服务(LLM/多模态/视觉)的统一架构设计,覆盖云端高并发、边缘低延迟、端侧轻量化三种部署形态,持续提升吞吐量与性价比
2. 构建面向多行业场景的公共工程平台(模型编排、Prompt/RAG/Agent 框架、多模态 Pipeline、数据飞轮),将 Demo→生产周期压缩到天级
3. 建立推理加速(vLLM/TensorRT-LLM/自研 kernel)、显存优化(长上下文/MoE 调度)、NVIDIA GPU 与国产 AI 芯片异构适配的工程体系
4. 制定跨业务的架构规范、API 标准、SLA 体系和技术评审机制
5. 跟踪 Agent、端侧推理等前沿方向,主导技术预研,输出技术路线规划与行业洞察报告
6. 代表公司在行业峰会、技术社区输出架构实践,建立团队在 AI Infra 领域的技术影响力
任职要求
- 10 年以上大规模系统架构经验,其中 3 年以上 AI/ML 系统工程化经验
- 主导过亿级用户或千级 QPS 的 AI 推理/服务系统的架构设计与落地
- 精通大模型推理链路(模型加载、KV Cache、批处理调度、流式输出),有性能调优实战经验
- 深度理解分布式系统(微服务、K8s、服务网格)和高可用架构设计
- 了解异构算力环境(NVIDIA GPU + 国产 AI 芯片)下的推理部署差异,有混合算力调度经验
- 多领域 AI 工程落地经验——至少覆盖以下 3 个方向:智能影像/视觉感知、自然语言/对话系统、多模态交互、语音系统、智能决策(金融风控等)、车载/嵌入式 AI
- 出色的跨团队技术影响力——能推动多个并行团队采纳统一技术方案
- 计算机/软件工程/电子信息相关专业硕士及以上
优先条件
- 多产品线平台型架构治理经验(横向架构师/技术委员会角色)
- B 端行业交付 + C 端产品运营双线架构经验
- 参与过开源推理框架或 AI 基础设施项目的核心开发
- 在 AI Infra 领域有行业影响力(会议演讲、开源贡献、技术
2026-04-01 14:37
IP属地:河南
职位福利
硕士经验不限分布式技术平台架构云计算架构ai中台中间件大模型平台架构生成式ai

郑州睿资达人力资源管理服务有限公司


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
智能体平台研发负责人 / 技术专家
2.8-4万元/月
架构师5-10年本科JavaPythonJavaScript微服务架构SpringBoot大数据架构云计算架构平台架构前端架构
北京 海淀区
Windows系统架构设计师
2.5-5万元/月
架构师C/C++3-5年本科VC++/C++WINDOWS内核开发MINIFILTER、NDIS等Qt主机安全产品开发QT开发WINDOWS开发C语言
北京 海淀区
Java技术经理(餐补+双休)
2.2-2.5万元/月
架构师5-10年本科算法基础信创实施SpringCloud微服务架构Objective-CSpringBoot容器技术数据结构
北京 海淀区









