职位详情
岗位职责
1、配合模型应用和模型训练同事,上线大模型推理服务,推动大模型相关算法的落地;
2、持续跟进前沿技术,优化大模型推理性能,提升线上模型服务吞吐量,降低模型推理延迟,控制推理机器成本;
3、开发和优化大模型推理系统,提升模型推理系统的性能,稳定性,可观测性,易用性等;
4、使用GPU编程和系统优化手段实现高性能的推理优化算法,并将其落地于大模型推理系统中。
岗位要求
1、计算机科学、人工智能等相关教育背景,本科以上学历;
2、熟悉Python,掌握常见的LLM推理加速框架,如vllm/onnx/TensorRT/TensorRT-LLM/sglang等,能够根据业务需求优化;
3、熟悉CPU/GPU下性能优化基本原理和方式方法,有服务端GPU程序加速经验;
4、熟悉分布式推理常用加速方法,有分布式系统开发经验或大模型分布式部署经验者优先;
5、有国产芯片适配经验优先;
6、具备严谨细致的工作态度,较强的团队协作能力。
1、配合模型应用和模型训练同事,上线大模型推理服务,推动大模型相关算法的落地;
2、持续跟进前沿技术,优化大模型推理性能,提升线上模型服务吞吐量,降低模型推理延迟,控制推理机器成本;
3、开发和优化大模型推理系统,提升模型推理系统的性能,稳定性,可观测性,易用性等;
4、使用GPU编程和系统优化手段实现高性能的推理优化算法,并将其落地于大模型推理系统中。
岗位要求
1、计算机科学、人工智能等相关教育背景,本科以上学历;
2、熟悉Python,掌握常见的LLM推理加速框架,如vllm/onnx/TensorRT/TensorRT-LLM/sglang等,能够根据业务需求优化;
3、熟悉CPU/GPU下性能优化基本原理和方式方法,有服务端GPU程序加速经验;
4、熟悉分布式推理常用加速方法,有分布式系统开发经验或大模型分布式部署经验者优先;
5、有国产芯片适配经验优先;
6、具备严谨细致的工作态度,较强的团队协作能力。
2026-03-23 17:40
IP属地:湖北
职位福利
硕士3-5年模型加速/性能优化C/C++Python机器学习高性能推理优化

武汉杞梓企业管理咨询有限公司
A轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
广告算法工程师
3-3.5万元/月
算法工程师经验不限硕士发表算法相关优秀论文C/C++Java搜索算法深度学习算法工程化经验自然语言处理算法广告算法参加算法相关竞赛/获奖PythonSQL
北京 朝阳区

朱先生 · 深圳市来赞达软件科技5日内活跃
算法专家-开放平台-OpenAPI领域-
3-6万元/月
算法工程师3-5年硕士C/C++Java机器学习深度学习大模型算法自然语言处理算法RAGLLMAIopsPython
北京 朝阳区

张先生 · 阿里云5日内活跃
广告算法专家
4.5-7万元/月
算法工程师经验不限本科Java图像算法分布式训练深度学习大模型算法自然语言处理算法多模态算法大数据处理框架(Spark/Hadoop/Hive)算法工程化经验广告算法推荐算法发表算法相关优秀论文C/
北京 朝阳区

朱先生 · 深圳市来赞达软件科技5日内活跃
运筹优化算法工程师
2-4万元/月
算法工程师1-3年硕士C/C++Java机器学习运筹优化算法深度学习电力市场电力调度大模型算法负荷预测强化学习智能决策算法Python
北京 朝阳区

果女士 · 北京清大科越股份...5日内活跃
算法开发工程师
1.8-3万元/月
算法工程师经验不限硕士C/C++Java团队管理经验大模型算法算法工程化经验参加算法相关竞赛/获奖MATLAB优秀开源项目经历PythonSQL
北京 朝阳区

刘女士 · 经纬恒润5日内活跃
实习生-基于AI的数据链路根因分析
150-200元/天
算法工程师经验不限硕士Java大模型算法大数据处理框架(Spark/Hadoop/Hive)融合感知算法Python
北京 朝阳区

方先生 · 阿里云5日内活跃
广告算法开发工程师
3-5万元/月
算法工程师1-3年硕士搜索算法深度学习算法工程化经验大模型算法广告算法计算机相关专业推荐算法发表算法相关优秀论文C/C++机器学习搜索/推荐机器学习算法/工程化经验参加算法相关竞赛/获奖业务导向
北京 朝阳区

朱先生 · 深圳市来赞达软件科技5日内活跃





