职位详情
岗位职责:
1. 负责大模型私有化部署实施工作,涵盖环境搭建(如基于KVM的虚拟化集群、裸金属服务器配置)、模型文件管理(集成Hugging Face / ModelScope模型库)、推理服务构建(使用TensorFlow Serving、PyTorch TorchServe等工具);
2. 根据实际业务场景完成定制化部署任务(支持多模型版本并行运行、对接API网关、实现访问权限管控),确保系统运行稳定且符合安全规范;
3. 应用强化学习技术(如PPO、DQN)、迁移学习方法及LoRA微调策略优化模型表现,针对特定领域(如医疗、金融)进行适配调整(例如注入行业知识提升效果);
4. 持续监控模型服务状态(关注推理延迟、准确率波动等情况),收集训练数据与运行日志(包括TensorBoard日志分析),提出有效改进措施(如调整网络结构、实施数据增强);
5. 研究前沿训练架构与优化手段(如采用Deepspeed实现混合精度训练、利用Megatron-LM开展分布式训练),提高大规模模型训练效率(目标为训练周期缩短30%以上)。
任职要求:
1. 具备本科及以上学历,专业方向为人工智能、计算机科学等相关领域;
2. 拥有5年以上大模型部署与训练调优实践经验,熟悉GPT、LLaMA、BERT等主流模型架构;
3. 掌握强化学习理论与应用(熟悉OpenAI Gym环境、Ray RLlib框架),有使用RLHF(基于人类反馈的强化学习)优化模型的实际经验;
4. 熟悉私有化部署相关技术,了解容器化方案(Docker/K8s)及云原生部署流程(如通过Helm Charts发布模型服务);
5. 具备扎实的Python编程能力,熟练运用PyTorch/TensorFlow等深度学习框架,了解CUDA编程(如编写自定义op以优化推理性能);
6. 具备较强的独立问题解决能力,能够主导完成从模型获取到上线服务的全流程部署与调优工作。
1. 负责大模型私有化部署实施工作,涵盖环境搭建(如基于KVM的虚拟化集群、裸金属服务器配置)、模型文件管理(集成Hugging Face / ModelScope模型库)、推理服务构建(使用TensorFlow Serving、PyTorch TorchServe等工具);
2. 根据实际业务场景完成定制化部署任务(支持多模型版本并行运行、对接API网关、实现访问权限管控),确保系统运行稳定且符合安全规范;
3. 应用强化学习技术(如PPO、DQN)、迁移学习方法及LoRA微调策略优化模型表现,针对特定领域(如医疗、金融)进行适配调整(例如注入行业知识提升效果);
4. 持续监控模型服务状态(关注推理延迟、准确率波动等情况),收集训练数据与运行日志(包括TensorBoard日志分析),提出有效改进措施(如调整网络结构、实施数据增强);
5. 研究前沿训练架构与优化手段(如采用Deepspeed实现混合精度训练、利用Megatron-LM开展分布式训练),提高大规模模型训练效率(目标为训练周期缩短30%以上)。
任职要求:
1. 具备本科及以上学历,专业方向为人工智能、计算机科学等相关领域;
2. 拥有5年以上大模型部署与训练调优实践经验,熟悉GPT、LLaMA、BERT等主流模型架构;
3. 掌握强化学习理论与应用(熟悉OpenAI Gym环境、Ray RLlib框架),有使用RLHF(基于人类反馈的强化学习)优化模型的实际经验;
4. 熟悉私有化部署相关技术,了解容器化方案(Docker/K8s)及云原生部署流程(如通过Helm Charts发布模型服务);
5. 具备扎实的Python编程能力,熟练运用PyTorch/TensorFlow等深度学习框架,了解CUDA编程(如编写自定义op以优化推理性能);
6. 具备较强的独立问题解决能力,能够主导完成从模型获取到上线服务的全流程部署与调优工作。
2026-05-15 12:35
IP属地:山东济南
职位福利
本科5-10年自然语言处理PythonPyTorchTensorFlow

齐鲁制药有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











