搜索
登录注册

职位详情

岗位职责
1、配合模型应用和模型训练同事,上线大模型推理服务,推动大模型相关算法的落地;
2、持续跟进前沿技术,优化大模型推理性能,提升线上模型服务吞吐量,降低模型推理延迟,控制推理机器成本;
3、开发和优化大模型推理系统,提升模型推理系统的性能,稳定性,可观测性,易用性等;
4、使用GPU编程和系统优化手段实现高性能的推理优化算法,并将其落地于大模型推理系统中。

岗位要求
1、计算机科学、人工智能等相关教育背景,本科以上学历;
2、熟悉Python,掌握常见的LLM推理加速框架,如vllm/onnx/TensorRT/TensorRT-LLM/sglang等,能够根据业务需求优化;
3、熟悉CPU/GPU下性能优化基本原理和方式方法,有服务端GPU程序加速经验;
4、熟悉分布式推理常用加速方法,有分布式系统开发经验或大模型分布式部署经验者优先;
5、有国产芯片适配经验优先;
6、具备严谨细致的工作态度,较强的团队协作能力。
2026-06-13 14:24
IP属地:北京

职位福利

本科经验不限
企业发布信息图
百融云创科技股份有限公司
已上市 · 500-999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

大模型算法工程师
250-400元/天
大模型算法经验不限硕士
北京 朝阳区
计算机相关专业实习生
100-200元/天
大模型算法经验不限硕士区块链人工智能前沿研究
北京 朝阳区
大模型研发工程师
1.5-2.5万元/月
大模型算法3-5年本科
北京 朝阳区
AI与大模型/智能体研发实习生
150-250元/天
大模型算法经验不限本科
北京 朝阳区
AI业务开发工程师
2-4万元/月
大模型算法3-5年本科
北京 朝阳区
AI应用开发(外包职位)
1.5-2.2万元/月
大模型算法3-5年大专
北京 朝阳区
通义实验室-多模态生成算法-通义万相
4-7万元/月
大模型算法3-5年硕士
北京 朝阳区
多模态大模型算法-北京上海杭州
3.5-6.5万元/月
大模型算法3-5年硕士多模态多模态预训练多模态大模型cvNLP模型训练
北京 朝阳区
AI与大模型/智能体研发实习生
150-200元/天
大模型算法经验不限本科
北京 朝阳区
大模型训练算法专家(编程方向)-北京/杭
5-8万元/月
大模型算法5-10年硕士code llmcode代码大模型Code Agent代码生成代码解析
北京 朝阳区