搜索
登录注册

职位详情

ai独角兽-首席架构师 - AI 行业应用-上海/北京:
岗位职责
1. 主导大模型推理服务(LLM/多模态/视觉)的统一架构设计,覆盖云端高并发、边缘低延迟、端侧轻量化三种部署形态,持续提升吞吐量与性价比
2. 构建面向多行业场景的公共工程平台(模型编排、Prompt/RAG/Agent 框架、多模态 Pipeline、数据飞轮),将 Demo→生产周期压缩到天级
3. 建立推理加速(vLLM/TensorRT-LLM/自研 kernel)、显存优化(长上下文/MoE 调度)、NVIDIA GPU 与国产 AI 芯片异构适配的工程体系
4. 制定跨业务的架构规范、API 标准、SLA 体系和技术评审机制
5. 跟踪 Agent、端侧推理等前沿方向,主导技术预研,输出技术路线规划与行业洞察报告
6. 代表公司在行业峰会、技术社区输出架构实践,建立团队在 AI Infra 领域的技术影响力

任职要求

- 10 年以上大规模系统架构经验,其中 3 年以上 AI/ML 系统工程化经验
- 主导过亿级用户或千级 QPS 的 AI 推理/服务系统的架构设计与落地
- 精通大模型推理链路(模型加载、KV Cache、批处理调度、流式输出),有性能调优实战经验
- 深度理解分布式系统(微服务、K8s、服务网格)和高可用架构设计
- 了解异构算力环境(NVIDIA GPU + 国产 AI 芯片)下的推理部署差异,有混合算力调度经验
- 多领域 AI 工程落地经验——至少覆盖以下 3 个方向:智能影像/视觉感知、自然语言/对话系统、多模态交互、语音系统、智能决策(金融风控等)、车载/嵌入式 AI
- 出色的跨团队技术影响力——能推动多个并行团队采纳统一技术方案
- 计算机/软件工程/电子信息相关专业硕士及以上

优先条件
- 多产品线平台型架构治理经验(横向架构师/技术委员会角色)
- B 端行业交付 + C 端产品运营双线架构经验
- 参与过开源推理框架或 AI 基础设施项目的核心开发
- 在 AI Infra 领域有行业影响力(会议演讲、开源贡献、技术
2026-04-01 14:37
IP属地:河南

职位福利

硕士经验不限分布式技术平台架构云计算架构ai中台中间件大模型平台架构生成式ai
企业发布信息图
郑州睿资达人力资源管理服务有限公司
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

解决方案网络架构师
2-4万元/月
架构师3-5年本科
北京 海淀区
智能体平台研发负责人 / 技术专家
2.8-4万元/月
架构师5-10年本科JavaPythonJavaScript微服务架构SpringBoot大数据架构云计算架构平台架构前端架构
北京 海淀区
资深网络技术专家
6-9万元/月
架构师1-3年硕士
北京 海淀区
首席全栈架构师
1.5-2.5万元/月
架构师5-10年本科JavaPythonPHP平台架构前端架构大数据架构
北京 海淀区
Windows系统架构设计师
2.5-5万元/月
架构师C/C++3-5年本科VC++/C++WINDOWS内核开发MINIFILTER、NDIS等Qt主机安全产品开发QT开发WINDOWS开发C语言
北京 海淀区
可观测产品售前架构师(北京)
4-5万元/月
架构师5-10年本科
北京 海淀区 西北旺
可观测产品架构师(北京)
4-5万元/月
架构师5-10年本科
北京 海淀区
先生 · 腾讯5日内活跃
产学研架构师
2.5-5万元/月
架构师3-5年博士安全新场景技术网络安全业务安全固定14薪+奖金大平台福利全
北京 海淀区
(线上兼职)云计算领域指导师
100-450元/时
架构师5-10年本科Java运维负载均衡技术云环境部署微服务架构云计算研发云架构设计云计算架构
北京 海淀区
Java技术经理(餐补+双休)
2.2-2.5万元/月
架构师5-10年本科算法基础信创实施SpringCloud微服务架构Objective-CSpringBoot容器技术数据结构
北京 海淀区