职位详情
通义实验室工程团队专注于构建面向公众与企业的大规模、高性能在线 AI 服务平台,全面支持通义千问、通义万相及多种开源先进模型的线上服务运行,积极推进 AI Agents、多模态应用、MCP 等前沿技术的产业化落地。
团队长期致力于突破异构 GPU 资源调度、多模型跨地域部署、多模态任务统一推理、多样化服务等级保障(SLO)以及模型推理全链路工程化等核心技术难题,持续提升系统性能、稳定性与资源利用效率。
1、基于LLM技术,设计并优化RAG全流程基础架构,增强系统的吞吐量与响应效率;
2、打造高吞吐、可拓展的分布式文档处理与索引构建体系,满足海量文档知识库下的检索与索引需求;
3、统筹检索集群规划与调优,通过科学分片与资源分配策略降低响应延迟、提升处理吞吐,并结合具体业务场景实施针对性优化;
4、搭建完整的系统监控体系,集成日志分析与链路追踪平台,实现问题的快速定位与高效处置。
职位描述
1、计算机或人工智能相关专业硕士及以上学历,具备5年以上工作经验,熟练掌握C++/Java/Go其中一门编程语言,有大型分布式系统开发背景者优先;
2、了解信息检索基本理论,具备高并发在线服务系统开发经验者更佳;
3、熟悉Linux操作系统脚本,能熟练运用Unix shell scripting、Perl或Python等脚本工具;
4、深刻理解数据结构与算法设计,具备出色的逻辑思维与问题拆解能力,热衷于攻克复杂技术挑战;
5、精通搜索推荐引擎的在线与离线系统架构,掌握索引机制、缓存策略、负载均衡及分布式系统核心原理;
6、具有检索系统开发经验者优先,包括关键词检索与向量检索方向。
团队长期致力于突破异构 GPU 资源调度、多模型跨地域部署、多模态任务统一推理、多样化服务等级保障(SLO)以及模型推理全链路工程化等核心技术难题,持续提升系统性能、稳定性与资源利用效率。
1、基于LLM技术,设计并优化RAG全流程基础架构,增强系统的吞吐量与响应效率;
2、打造高吞吐、可拓展的分布式文档处理与索引构建体系,满足海量文档知识库下的检索与索引需求;
3、统筹检索集群规划与调优,通过科学分片与资源分配策略降低响应延迟、提升处理吞吐,并结合具体业务场景实施针对性优化;
4、搭建完整的系统监控体系,集成日志分析与链路追踪平台,实现问题的快速定位与高效处置。
职位描述
1、计算机或人工智能相关专业硕士及以上学历,具备5年以上工作经验,熟练掌握C++/Java/Go其中一门编程语言,有大型分布式系统开发背景者优先;
2、了解信息检索基本理论,具备高并发在线服务系统开发经验者更佳;
3、熟悉Linux操作系统脚本,能熟练运用Unix shell scripting、Perl或Python等脚本工具;
4、深刻理解数据结构与算法设计,具备出色的逻辑思维与问题拆解能力,热衷于攻克复杂技术挑战;
5、精通搜索推荐引擎的在线与离线系统架构,掌握索引机制、缓存策略、负载均衡及分布式系统核心原理;
6、具有检索系统开发经验者优先,包括关键词检索与向量检索方向。
2026-05-28 14:41
IP属地:浙江杭州
职位福利
硕士5-10年JavaC++AIRAG

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









