职位详情
岗位职责
1. 负责大模型训练与推理平台的架构设计与核心功能迭代,涵盖分布式训练框架、混合精度优化、断点恢复训练等模块,结合企业级实际需求,输出定制化产品方案,如垂直领域模型微调、专属知识库推理支持等;
2. 主导模型服务平台的全链路流程设计,包括模型训练管理、推理服务弹性伸缩等关键能力,保障平台具备多模态模型接入能力和复杂任务调度能力;
3. 推进训练推理平台与底层算力调度系统的工程整合,设计高效的资源调度策略,提升整体资源使用效率;
4. 撰写技术导向的产品需求文档,明确训练吞吐、推理延迟等核心性能指标及验收标准,确保研发团队准确理解实现细节;
5. 基于客户调研挖掘行业共性问题,提炼可复用的解决方案,形成技术白皮书与竞品对比分析报告;
6. 规划产品商业化模式,支持按Token计费、私有化部署等场景,协助完成客户提案及招投标技术支撑;
7. 跟踪产品关键数据指标,如训练任务完成率、推理服务SLA达标情况,通过测试反馈优化交互体验,持续增强产品竞争力。
任职要求
1. 专业背景:计算机、人工智能、高性能计算等相关专业本科及以上学历,具备5年以上工作经验,其中3年以上聚焦AI平台建设;
2. 技术能力:深入掌握大模型训练与推理技术体系,熟悉PyTorch/TensorFlow的分布式训练机制,熟练运用DeepSpeed等加速框架,可独立设计混合并行训练方案;具备vLLM类服务框架落地经验,了解API网关架构,掌握模型量化(FP16/INT8)及性能调优方法;
3. 具备3至5年大模型产品实践经验,主导过至少1个企业级AI平台项目,需提供完整项目材料,包含PRD文档、技术设计方案及性能评估报告;
4. 熟悉政务云、工业物联网等典型场景下的AI算力应用需求,能够精准识别客户需求并匹配可行的技术路径。
其他要求
1. 具备出色的逻辑思维与结构化表达能力,能以技术语言高效协同研发团队,同时用业务语言清晰传递产品价值;
2. 自驱性强,适应高强度迭代节奏,对AI前沿方向(如Agent技术演进)保持高度敏感。
工作年限
薪资待遇:18k-20k(综合面试评定)
1. 负责大模型训练与推理平台的架构设计与核心功能迭代,涵盖分布式训练框架、混合精度优化、断点恢复训练等模块,结合企业级实际需求,输出定制化产品方案,如垂直领域模型微调、专属知识库推理支持等;
2. 主导模型服务平台的全链路流程设计,包括模型训练管理、推理服务弹性伸缩等关键能力,保障平台具备多模态模型接入能力和复杂任务调度能力;
3. 推进训练推理平台与底层算力调度系统的工程整合,设计高效的资源调度策略,提升整体资源使用效率;
4. 撰写技术导向的产品需求文档,明确训练吞吐、推理延迟等核心性能指标及验收标准,确保研发团队准确理解实现细节;
5. 基于客户调研挖掘行业共性问题,提炼可复用的解决方案,形成技术白皮书与竞品对比分析报告;
6. 规划产品商业化模式,支持按Token计费、私有化部署等场景,协助完成客户提案及招投标技术支撑;
7. 跟踪产品关键数据指标,如训练任务完成率、推理服务SLA达标情况,通过测试反馈优化交互体验,持续增强产品竞争力。
任职要求
1. 专业背景:计算机、人工智能、高性能计算等相关专业本科及以上学历,具备5年以上工作经验,其中3年以上聚焦AI平台建设;
2. 技术能力:深入掌握大模型训练与推理技术体系,熟悉PyTorch/TensorFlow的分布式训练机制,熟练运用DeepSpeed等加速框架,可独立设计混合并行训练方案;具备vLLM类服务框架落地经验,了解API网关架构,掌握模型量化(FP16/INT8)及性能调优方法;
3. 具备3至5年大模型产品实践经验,主导过至少1个企业级AI平台项目,需提供完整项目材料,包含PRD文档、技术设计方案及性能评估报告;
4. 熟悉政务云、工业物联网等典型场景下的AI算力应用需求,能够精准识别客户需求并匹配可行的技术路径。
其他要求
1. 具备出色的逻辑思维与结构化表达能力,能以技术语言高效协同研发团队,同时用业务语言清晰传递产品价值;
2. 自驱性强,适应高强度迭代节奏,对AI前沿方向(如Agent技术演进)保持高度敏感。
工作年限
薪资待遇:18k-20k(综合面试评定)
2026-02-25 08:11
IP属地:广东深圳
职位福利
本科3-5年3年以上AI平台经验熟悉PYTORCH

深圳邦芒人力资源有限公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >












