职位详情
1. 设计并实现高可用、高并发的分布式系统;搭建微服务架构(如Spring Cloud/Dubbo),提升API的性能与稳定性;主导数据库(MySQL/PostgreSQL)、缓存(Redis)、消息中间件(Kafka/RabbitMQ)的技术选型及性能优化工作。
2. 将大模型部署至生产环境,设计实时与离线推理服务架构(如模型压缩加速、集成分布式训练框架);监控模型在线指标(如准确率、响应延迟、吞吐量);推动模型持续迭代优化(参数调整、后训练、效果评估);跟踪模型表现,识别预测偏差、数据漂移等异常问题。
3. 深入理解大模型技术原理并制定工程落地策略,协同产品、UI/UX、测试与运维团队高效配合,保障项目高质量交付。
职位要求
1. 本科及以上学历,计算机、数学、统计等相关专业,具备3年以上服务端开发经验,有大模型实际落地与调优经历者优先。
2. 精通 Java/C++/Python 中至少一门语言,熟悉主流框架(Spring Boot/Gin/Django);熟练进行 MySQL/PostgreSQL 数据库设计与调优,掌握 Redis 缓存机制;具备高并发系统开发背景,了解分布式事务、限流熔断、负载均衡等核心机制。
3. 熟悉AI工程化流程,具有 Prompt 工程、RAG 应用或大模型微调实践经验,具备良好的 Python 数据处理能力;掌握模型部署与监控工具链,例如 Prometheus+Grafana/Evidently。
4. 熟悉容器化与云原生技术,掌握CI/CD流程及自动化测试框架的应用。
5. 具备出色的问题分析与解决能力,擅长对复杂工程问题进行抽象建模,热衷于攻克技术难题,能将业务需求转化为可行的技术方案。
6. 具备良好的沟通协作意识,持续学习能力强,主动追踪前沿技术进展并实现自我更新,积极推动团队技术进步。
7. 加分项:了解模型压缩方法(Quantization/Pruning)或推理加速框架(TensorRT/OpenVINO)、掌握大数据处理平台(Spark/Flink)、了解强化学习(RL)或多目标优化模型、具备完整参与大模型从开发到上线全流程项目经验者优先。
2. 将大模型部署至生产环境,设计实时与离线推理服务架构(如模型压缩加速、集成分布式训练框架);监控模型在线指标(如准确率、响应延迟、吞吐量);推动模型持续迭代优化(参数调整、后训练、效果评估);跟踪模型表现,识别预测偏差、数据漂移等异常问题。
3. 深入理解大模型技术原理并制定工程落地策略,协同产品、UI/UX、测试与运维团队高效配合,保障项目高质量交付。
职位要求
1. 本科及以上学历,计算机、数学、统计等相关专业,具备3年以上服务端开发经验,有大模型实际落地与调优经历者优先。
2. 精通 Java/C++/Python 中至少一门语言,熟悉主流框架(Spring Boot/Gin/Django);熟练进行 MySQL/PostgreSQL 数据库设计与调优,掌握 Redis 缓存机制;具备高并发系统开发背景,了解分布式事务、限流熔断、负载均衡等核心机制。
3. 熟悉AI工程化流程,具有 Prompt 工程、RAG 应用或大模型微调实践经验,具备良好的 Python 数据处理能力;掌握模型部署与监控工具链,例如 Prometheus+Grafana/Evidently。
4. 熟悉容器化与云原生技术,掌握CI/CD流程及自动化测试框架的应用。
5. 具备出色的问题分析与解决能力,擅长对复杂工程问题进行抽象建模,热衷于攻克技术难题,能将业务需求转化为可行的技术方案。
6. 具备良好的沟通协作意识,持续学习能力强,主动追踪前沿技术进展并实现自我更新,积极推动团队技术进步。
7. 加分项:了解模型压缩方法(Quantization/Pruning)或推理加速框架(TensorRT/OpenVINO)、掌握大数据处理平台(Spark/Flink)、了解强化学习(RL)或多目标优化模型、具备完整参与大模型从开发到上线全流程项目经验者优先。
2026-06-29 13:55
IP属地:上海
职位福利
本科3-5年AIpromptRAG大模型

阿里巴巴(中国)网络技术有限公司
已上市 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









