搜索
登录注册

职位详情

岗位职责
1、搭建AI运维平台核心架构,支持大模型训练与推理任务的资源调度及性能监控能力
2、基于Genkit框架开发AI工作流引擎,融合RAG增强技术与多模态数据处理功能
3、设计可观测性数据采集方案,集成OpenTelemetry实现对LLM推理过程的多维度指标追踪
4、优化分布式任务间通信机制,保障千卡规模集群的加速比不低于90%
5、开发智能故障预测组件,利用时序数据分析实现硬件异常的提前预警
6、构建高效对接矢量数据库(如Pinecone)的交互层,满足知识库实时检索需求

岗位要求
1、具备3年以上Go/Python开发经验,掌握Beego/Gin等框架的源码级定制与扩展
2、精通微服务治理机制,拥有生产环境中Kubernetes集群的实际运维经验
3、熟悉Genkit/Firebase等AI框架的集成开发,了解Dotprompt模板设计标准
4、有AI系统可观测性平台建设经验,熟练使用Prometheus与AlertManager构建监控告警体系
5、掌握大模型训练相关技术栈(如PyTorch分布式训练),具备通信效率优化能力
6、理解向量数据库工作原理,具备RAG场景下的工程落地实践经验

优先条件
1、参与过LLM训练集群运维系统的开发工作(如资源弹性调度、故障自愈等功能)
2、熟悉GPU监控关键指标(如显存占用率、SM利用率等)
3、有AI工作流可视化编排工具的实际开发经历
4、了解LangChain等大模型应用框架的监控集成方式
2026-06-29 14:03
IP属地:湖北武汉

职位福利

本科3-5年GolangJavaPython
企业发布信息图
浩鲸云计算科技股份有限公司
未融资 · 10000人以上
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

自动化软件开发工程师(Python)
1-1.4万元/月
Python1-3年大专DjangoFlaskSQLMODELFASTAP前后端开发资料开发
武汉 江夏区
python后端开发工程师
9000-12000元/月
Python1-3年本科FlaskMySQL
武汉 江汉区
python实习岗位
120-170元/天
Python经验不限本科DockerMySQLLinux开发/部署经验
武汉 洪山区
python
1-1.5万元/月
Python3-5年本科爬虫经验PyTorchPandasNumpy
武汉 洪山区
python开发工程师
120-150元/天
Python经验不限本科Java爬虫经验PandasMySQLOracleNumpy
武汉
Python开发工程师
9000-14000元/月
Python3-5年大专
武汉 洪山区
python
5000-10000元/月
Python经验不限本科PyTorchPandasMySQL机器学习经验Numpy
武汉 洪山区
量化策略分析师
1.5-3万元/月
Python1-3年本科编程经验
武汉 洪山区
Python开发工程师(J10456)
1.5-2万元/月
Python3-5年本科RedisMySQLlinuxKVMDjangoTornado
武汉 江夏区
高级机器学习算法工程师
1.5-2.5万元/月
Python3-5年大专PyTorchPandasNumpy
武汉 洪山区