职位详情
职位概述
我们正在招聘一名经验丰富的AI智能体工程师,负责设计、开发与优化支撑公司金融科技产品的智能体系统。您将参与多智能体协同架构、大语言模型集成及系统性能调优,助力实现高效的实时金融AI解决方案。
更多信息请访问公司官网:https://metaprise.ai
岗位职责
1、AI智能体开发:
- 面向金融业务场景设计并实现多智能体协同系统
- 构建智能体调度框架与通信机制
- 开发应用于风险评估、交易分析和客户服务的自主决策智能体
- 实现智能体的记忆存储与知识管理体系
2、大语言模型集成与优化:
- 针对金融领域任务进行大模型微调与部署
- 采用FP16量化提升推理效率
- 优化模型服务的延迟与吞吐能力,满足实时性需求
- 设计提示工程方案并构建RAG检索增强生成系统
3、性能工程:
- 应用模型压缩与量化方法降低计算开销
- 优化GPU资源使用率与显存管理策略
- 搭建高效能推理流水线
- 持续监控并改进智能体响应速度(目标<200ms)
4、系统架构:
- 设计支持高扩展性的智能体部署架构
- 实现多并发请求下的负载均衡机制
- 建立智能体运行状态的监控与可观测体系
- 保障系统的稳定性与容错处理能力
任职要求
1、技术专长:
- 具备1年以上大语言模型集成与性能优化实践经验
- 精通FP16/混合精度训练与推理流程
- 有在生产环境中使用PyTorch、TensorFlow或JAX的实际项目经历
- 深入理解Transformer结构与注意力机制原理
- 熟悉CUDA编程及GPU性能调优技术
2、AI智能体经验:
- 掌握主流智能体框架(如LangChain、AutoGPT、CrewAI)
- 具备多智能体系统的设计与编排能力
- 了解基于强化学习的智能体训练方法
- 熟悉向量数据库与信息检索系统应用
3、基础设施技能:
- 熟练使用Kubernetes与Docker进行模型部署
- 具备MLOps流程建设与模型版本管理经验
- 了解分布式计算架构与模型并行技术
- 熟悉云平台(AWS/GCP/Azure)上的机器学习服务
4、编程能力:
- 精通Python语言,熟练运用各类ML/AI工具库
- 具备扎实的软件工程基础
- 熟悉API接口设计与微服务架构模式
- 能够开展性能剖析与系统级优化
优先条件
1、计算机科学、机器学习或人工智能相关专业本科及以上学历,或具备同等实战经验
2、了解金融业务知识(包括交易、风控、合规等领域)
3、在AI/ML国际会议发表过研究成果
4、有主流机器学习框架的开源社区贡献记录
5、具备边缘端模型部署与轻量化优化经验
6、熟悉金融行业监管政策与合规要求
技术栈
1、框架: PyTorch、Transformers、LangChain、ONNX
2、基础设施: Kubernetes、Docker、NVIDIA Triton
3、数据库: 向量数据库(Pinecone、Weaviate)、PostgreSQL
4、云平台: AWS SageMaker、GCP Vertex AI、Azure ML
5、监控: MLflow、Weights & Biases、Prometheus
我们正在招聘一名经验丰富的AI智能体工程师,负责设计、开发与优化支撑公司金融科技产品的智能体系统。您将参与多智能体协同架构、大语言模型集成及系统性能调优,助力实现高效的实时金融AI解决方案。
更多信息请访问公司官网:https://metaprise.ai
岗位职责
1、AI智能体开发:
- 面向金融业务场景设计并实现多智能体协同系统
- 构建智能体调度框架与通信机制
- 开发应用于风险评估、交易分析和客户服务的自主决策智能体
- 实现智能体的记忆存储与知识管理体系
2、大语言模型集成与优化:
- 针对金融领域任务进行大模型微调与部署
- 采用FP16量化提升推理效率
- 优化模型服务的延迟与吞吐能力,满足实时性需求
- 设计提示工程方案并构建RAG检索增强生成系统
3、性能工程:
- 应用模型压缩与量化方法降低计算开销
- 优化GPU资源使用率与显存管理策略
- 搭建高效能推理流水线
- 持续监控并改进智能体响应速度(目标<200ms)
4、系统架构:
- 设计支持高扩展性的智能体部署架构
- 实现多并发请求下的负载均衡机制
- 建立智能体运行状态的监控与可观测体系
- 保障系统的稳定性与容错处理能力
任职要求
1、技术专长:
- 具备1年以上大语言模型集成与性能优化实践经验
- 精通FP16/混合精度训练与推理流程
- 有在生产环境中使用PyTorch、TensorFlow或JAX的实际项目经历
- 深入理解Transformer结构与注意力机制原理
- 熟悉CUDA编程及GPU性能调优技术
2、AI智能体经验:
- 掌握主流智能体框架(如LangChain、AutoGPT、CrewAI)
- 具备多智能体系统的设计与编排能力
- 了解基于强化学习的智能体训练方法
- 熟悉向量数据库与信息检索系统应用
3、基础设施技能:
- 熟练使用Kubernetes与Docker进行模型部署
- 具备MLOps流程建设与模型版本管理经验
- 了解分布式计算架构与模型并行技术
- 熟悉云平台(AWS/GCP/Azure)上的机器学习服务
4、编程能力:
- 精通Python语言,熟练运用各类ML/AI工具库
- 具备扎实的软件工程基础
- 熟悉API接口设计与微服务架构模式
- 能够开展性能剖析与系统级优化
优先条件
1、计算机科学、机器学习或人工智能相关专业本科及以上学历,或具备同等实战经验
2、了解金融业务知识(包括交易、风控、合规等领域)
3、在AI/ML国际会议发表过研究成果
4、有主流机器学习框架的开源社区贡献记录
5、具备边缘端模型部署与轻量化优化经验
6、熟悉金融行业监管政策与合规要求
技术栈
1、框架: PyTorch、Transformers、LangChain、ONNX
2、基础设施: Kubernetes、Docker、NVIDIA Triton
3、数据库: 向量数据库(Pinecone、Weaviate)、PostgreSQL
4、云平台: AWS SageMaker、GCP Vertex AI、Azure ML
5、监控: MLflow、Weights & Biases、Prometheus
2026-06-26 12:33
IP属地:广东深圳
职位福利
本科1-3年PyTorch大模型算法自然语言处理算法RAGHugging FacePineconellmPython

深圳市光速动力网络有限公司
不需要融资 · 20-99人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
高级深度学习算法研发工程师
3-6万元/月
深度学习经验不限硕士Golang团队管理经验大模型算法自然语言处理算法算法工程化经验AIC/C++机器学习强化学习数据挖掘大数据处理工具(Spark/Hadoop/Hive)Python
深圳 南山区
AI应用工程师AIEngineer
1.2-2.4万元/月
深度学习1-3年本科PyTorch大模型算法自然语言处理算法RAGHugging FacePineconePythonTensorFlow
深圳 南山区










