职位详情
岗位职责:
负责大模型/多模态/AIGC等算法在推理加速卡(GPU/NPU等)上的移植、适配、开发与性能调优工作
执行模型功能与性能测试,评估精度、吞吐量与延迟等核心指标,撰写测试报告及技术文档
基于TensorRT-LLM、vLLM、LMDeploy等推理框架开展模型部署与推理加速,优化端到端推理链路
对算法框架和推理引擎进行性能提升,涵盖算子融合、内核调优、内存管理及计算图编译等工作
持续编写、维护用户手册、性能分析报告及模型优化技术白皮书
岗位要求:
计算机、人工智能、电子信息等相关专业本科及以上学历,具备AI算法开发或模型性能优化经验
精通Python、PyTorch,具有扎实的深度学习模型开发与调试能力
掌握Transformer架构及主流大模型(LLM、多模态、AIGC等)的推理流程与性能关键点
拥有Linux平台开发经验,熟练使用Shell、VSCode等开发与调试工具
具备良好的沟通协作能力与自我驱动力,能够适应一定强度的工作节奏
代码风格规范,熟悉软件工程流程,具备严谨细致的工作作风和较强的责任意识
优先考虑:
有TensorRT-LLM、vLLM、LMDeploy、SGLang等推理引擎的实际开发或调优经历,具备推理系统优化能力
了解模型量化、剪枝、编译优化(如TensorRT、ONNXRuntime)等相关技术
熟悉AIGC领域技术应用(如文生图、图生图、文生文等)
熟练使用Markdown/RST/LaTeX等文档编写工具,具备优秀的技术文档输出能力
具备英文技术文献阅读与资料理解能力
负责大模型/多模态/AIGC等算法在推理加速卡(GPU/NPU等)上的移植、适配、开发与性能调优工作
执行模型功能与性能测试,评估精度、吞吐量与延迟等核心指标,撰写测试报告及技术文档
基于TensorRT-LLM、vLLM、LMDeploy等推理框架开展模型部署与推理加速,优化端到端推理链路
对算法框架和推理引擎进行性能提升,涵盖算子融合、内核调优、内存管理及计算图编译等工作
持续编写、维护用户手册、性能分析报告及模型优化技术白皮书
岗位要求:
计算机、人工智能、电子信息等相关专业本科及以上学历,具备AI算法开发或模型性能优化经验
精通Python、PyTorch,具有扎实的深度学习模型开发与调试能力
掌握Transformer架构及主流大模型(LLM、多模态、AIGC等)的推理流程与性能关键点
拥有Linux平台开发经验,熟练使用Shell、VSCode等开发与调试工具
具备良好的沟通协作能力与自我驱动力,能够适应一定强度的工作节奏
代码风格规范,熟悉软件工程流程,具备严谨细致的工作作风和较强的责任意识
优先考虑:
有TensorRT-LLM、vLLM、LMDeploy、SGLang等推理引擎的实际开发或调优经历,具备推理系统优化能力
了解模型量化、剪枝、编译优化(如TensorRT、ONNXRuntime)等相关技术
熟悉AIGC领域技术应用(如文生图、图生图、文生文等)
熟练使用Markdown/RST/LaTeX等文档编写工具,具备优秀的技术文档输出能力
具备英文技术文献阅读与资料理解能力
2026-05-02 13:27
IP属地:北京
职位福利
本科3-5年vllm图像算法运筹优化算法分布式训练深度学习大模型算法多模态算法算法工程化经验大模型推理优秀开源项目经历推荐算法发表算法相关优秀论文C/C++机器学习人工智能模型优化

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
初级AIGC算法工程师
8000-12000元/月
算法工程师经验不限本科深度学习机器学习多模态算法自然语言处理机器视觉PyTorchTensorFlowPythonAIGC算法研发扩散模型落地前沿技术调研
北京 海淀区

朱女士 · 北京欣欣科技有限公司昨日活跃
初级感知算法开发工程师
8000-12000元/月
算法工程师经验不限本科深度学习机器视觉TensorFlowPyTorchPythonC++激光雷达感知端侧模型部署多模态数据融合
北京 海淀区

朱女士 · 北京欣欣科技有限公司昨日活跃
智能体应用开发工程师(大模型/Prompt)
1.2-1.6万元/月
算法工程师经验不限硕士JavaPrompt Engineering大模型算法Dify大模型参加算法相关竞赛/获奖PythonAI Agent
北京 海淀区

王女士 · 数起科技5日内活跃








