职位详情
岗位职责:
1. 负责AI大模型架构的设计与构建,包括Transformer或新型神经网络结构的探索,针对特定应用场景优化和改进现有模型。
2. 组织大规模训练数据的采集与整理,完成数据清洗、标注及标准化等预处理任务,建立高效稳定的大模型数据处理流程。
3. 借助高性能计算资源开展模型训练,实时监控训练状态,调整超参数以提升模型表现,实施分布式训练方案。
4. 采用通用或定制化评估方法测试模型在各类任务中的效果,深入分析输出结果,识别问题并实施精准优化。
5. 探索前沿算法与技术手段,如模型压缩、量化与知识蒸馏,降低模型资源占用,推动新技术的落地应用。
6. 将训练完成的大模型嵌入实际产品或服务中,解决部署过程中的各类工程技术难题。
7. 与产品经理、数据科学家、软件开发人员协同配合,理解业务目标并将模型有效应用于具体场景,参与项目整体规划与进度管理。
任职资格:
1. 计算机科学、人工智能或相关专业硕士及以上学历,博士优先考虑。
2. 掌握自然语言处理、机器学习、深度学习等领域的核心理论与算法,熟练使用Python、Java等编程语言,具备扎实的数据结构与算法基础。
3. 熟悉至少一种主流深度学习框架(如TensorFlow、PyTorch),具有实际项目经历,具备AI多模态大模型研发经验者优先。
4. 具备医疗外科手术领域相关背景,拥有良好的团队协作意识和沟通能力。
5. 对人工智能技术保持高度热情与好奇心,能持续跟踪并快速掌握最新的AI研究进展。
1. 负责AI大模型架构的设计与构建,包括Transformer或新型神经网络结构的探索,针对特定应用场景优化和改进现有模型。
2. 组织大规模训练数据的采集与整理,完成数据清洗、标注及标准化等预处理任务,建立高效稳定的大模型数据处理流程。
3. 借助高性能计算资源开展模型训练,实时监控训练状态,调整超参数以提升模型表现,实施分布式训练方案。
4. 采用通用或定制化评估方法测试模型在各类任务中的效果,深入分析输出结果,识别问题并实施精准优化。
5. 探索前沿算法与技术手段,如模型压缩、量化与知识蒸馏,降低模型资源占用,推动新技术的落地应用。
6. 将训练完成的大模型嵌入实际产品或服务中,解决部署过程中的各类工程技术难题。
7. 与产品经理、数据科学家、软件开发人员协同配合,理解业务目标并将模型有效应用于具体场景,参与项目整体规划与进度管理。
任职资格:
1. 计算机科学、人工智能或相关专业硕士及以上学历,博士优先考虑。
2. 掌握自然语言处理、机器学习、深度学习等领域的核心理论与算法,熟练使用Python、Java等编程语言,具备扎实的数据结构与算法基础。
3. 熟悉至少一种主流深度学习框架(如TensorFlow、PyTorch),具有实际项目经历,具备AI多模态大模型研发经验者优先。
4. 具备医疗外科手术领域相关背景,拥有良好的团队协作意识和沟通能力。
5. 对人工智能技术保持高度热情与好奇心,能持续跟踪并快速掌握最新的AI研究进展。
2026-06-29 13:15
IP属地:上海
职位福利
硕士经验不限Java大模型算法模型加速/性能优化Python

蓝帆外科器械有限公司
不需要融资 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











