搜索
登录注册

职位详情

岗位职责
1、配合模型应用和模型训练同事,上线大模型推理服务,推动大模型相关算法的落地;
2、持续跟进前沿技术,优化大模型推理性能,提升线上模型服务吞吐量,降低模型推理延迟,控制推理机器成本;
3、开发和优化大模型推理系统,提升模型推理系统的性能,稳定性,可观测性,易用性等;
4、使用GPU编程和系统优化手段实现高性能的推理优化算法,并将其落地于大模型推理系统中。

岗位要求
1、计算机科学、人工智能等相关教育背景,本科以上学历;
2、熟悉Python,掌握常见的LLM推理加速框架,如vllm/onnx/TensorRT/TensorRT-LLM/sglang等,能够根据业务需求优化;
3、熟悉CPU/GPU下性能优化基本原理和方式方法,有服务端GPU程序加速经验;
4、熟悉分布式推理常用加速方法,有分布式系统开发经验或大模型分布式部署经验者优先;
5、有国产芯片适配经验优先;
6、具备严谨细致的工作态度,较强的团队协作能力。
2026-04-24 12:22
IP属地:北京

职位福利

本科经验不限
企业发布信息图
百融云创科技股份有限公司
已上市 · 500-999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

AI与大模型/智能体研发实习生
150-250元/天
大模型算法经验不限本科
北京 朝阳区
阿里云-大模型预训练算法专家-杭州/北京
2.6-5万元/月
大模型算法3-5年硕士预训练
北京 朝阳区
大模型算法工程师(高级/资深)
3.5-5万元/月
大模型算法算法工程师5-10年本科go语言
北京 朝阳区
大模型算法工程师
250-400元/天
大模型算法经验不限硕士
北京 朝阳区
AI算法工程师 (MJ000630)
2.5-5万元/月
大模型算法3-5年本科
北京 朝阳区
风控算法工程师1 (MJ000596)
2.5-5万元/月
大模型算法3-5年本科
北京 朝阳区
AI业务开发工程师
2-4万元/月
大模型算法3-5年本科
北京 朝阳区
大模型算法专家
5-6.5万元/月
大模型算法5-10年硕士
北京 朝阳区 望京
大模型算法研发工程师
2.5-4万元/月
大模型算法算法工程师1-3年硕士大模型
北京 朝阳区
大模型算法工程师(高级/资深)
3.5-5万元/月
大模型算法5-10年本科go语言
北京 朝阳区