职位详情
岗位职责:
(一)构建AI4S领域多模态评测体系
1. 面向AI for Science实际应用场景,设计并搭建覆盖科学文本、图谱、图像、序列等多类型数据的高质量评测数据集及基准测试平台,支撑如蛋白质结构预测、材料显微图像识别、科研文献图表解析等典型任务;
2. 建立涵盖性能指标、结果准确性、跨模态对齐能力与科学逻辑合理性的多维度评估规范。
(二)专业技术评估与方法研究
1. 对现有开源单模态与多模态模型及其评测工具开展系统性技术分析,形成适用于AI4S领域的权威评测结论与技术文档;
2. 持续追踪学术界与产业界前沿动态,研究新型多模态评估机制(如跨模态一致性校验)并参与相关算法研发。
(三)自动化评测平台开发
负责大模型(含多模态架构)评测流程的自动化工具链建设与维护,搭建CI/CD持续集成环境,提升评测执行效率与实验可复现性。
任职要求:
(一)基本要求
1. 计算机、人工智能或自然科学类专业(物理、化学、生物、材料等)硕士及以上学位;
2. 具备2年以上软件开发、测试工程、DevOps实践或模型部署相关工作经验。
(二)核心能力要求:
1. 专业能力:
(1)具备良好的英文科技文献阅读与理解能力;
(2)掌握自然科学某一方向的专业知识(如生物信息学、计算化学、天体物理、材料模拟等);
(3)能将科学研究问题转化为可量化的AI评测任务,有构建科学用途数据集或评测集的实际经历;
(4)具有处理多模态科学数据的经验(如图像与文本、图谱与序列的联合处理)。
2. 技术能力:
(1)熟练掌握Python/Rust/C++中至少一门编程语言,具备扎实的编码与脚本开发能力;
(2)深入理解主流大语言模型及多模态模型的技术架构,有模型评测或实际应用经验者优先。
3. 符合以下条件者优先考虑:
(1)熟悉pytest、RobotFramework、Junit等自动化测试框架;
(2)具备Jenkins、GitLab CI/CD等持续集成工具的实际配置与运维经验;
(3)了解Kubernetes、ArgoCD等云原生技术栈的使用场景与操作方式。
(一)构建AI4S领域多模态评测体系
1. 面向AI for Science实际应用场景,设计并搭建覆盖科学文本、图谱、图像、序列等多类型数据的高质量评测数据集及基准测试平台,支撑如蛋白质结构预测、材料显微图像识别、科研文献图表解析等典型任务;
2. 建立涵盖性能指标、结果准确性、跨模态对齐能力与科学逻辑合理性的多维度评估规范。
(二)专业技术评估与方法研究
1. 对现有开源单模态与多模态模型及其评测工具开展系统性技术分析,形成适用于AI4S领域的权威评测结论与技术文档;
2. 持续追踪学术界与产业界前沿动态,研究新型多模态评估机制(如跨模态一致性校验)并参与相关算法研发。
(三)自动化评测平台开发
负责大模型(含多模态架构)评测流程的自动化工具链建设与维护,搭建CI/CD持续集成环境,提升评测执行效率与实验可复现性。
任职要求:
(一)基本要求
1. 计算机、人工智能或自然科学类专业(物理、化学、生物、材料等)硕士及以上学位;
2. 具备2年以上软件开发、测试工程、DevOps实践或模型部署相关工作经验。
(二)核心能力要求:
1. 专业能力:
(1)具备良好的英文科技文献阅读与理解能力;
(2)掌握自然科学某一方向的专业知识(如生物信息学、计算化学、天体物理、材料模拟等);
(3)能将科学研究问题转化为可量化的AI评测任务,有构建科学用途数据集或评测集的实际经历;
(4)具有处理多模态科学数据的经验(如图像与文本、图谱与序列的联合处理)。
2. 技术能力:
(1)熟练掌握Python/Rust/C++中至少一门编程语言,具备扎实的编码与脚本开发能力;
(2)深入理解主流大语言模型及多模态模型的技术架构,有模型评测或实际应用经验者优先。
3. 符合以下条件者优先考虑:
(1)熟悉pytest、RobotFramework、Junit等自动化测试框架;
(2)具备Jenkins、GitLab CI/CD等持续集成工具的实际配置与运维经验;
(3)了解Kubernetes、ArgoCD等云原生技术栈的使用场景与操作方式。
2026-05-20 14:35
IP属地:浙江杭州
职位福利
硕士1-3年

之江实验室
不需要融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
初级测试(远程面试)9K内
8000-9000元/月
测试工程师1-3年大专自动化测试经验Java测试工作经验自动化测试性能测试MySQL功能测试AI游戏掌握软件测试理论和流程Python
杭州 余杭区

罗先生 · 深圳中迈5日内活跃
测试工程师
1.2-1.5万元/月
测试工程师3-5年本科测试工作经验C/S嵌入式软件B/S架构平台性能测试MySQL手机APP软件功能测试掌握软件测试理论和流程计算机相关专业
杭州 余杭区

张女士 · 浙江合恒5日内活跃
测试工程师-杭州
1-1.5万元/月
测试工程师3-5年本科sdk技术支持JavaRTC 音视频通信自动化测试国标通信方面的经验自动化框架Android/Server端测试Python
杭州 余杭区

魏先生 · 上海礼聪5日内活跃
测试工程师
1-1.3万元/月
测试工程师3-5年本科自动化测试经验JavaC++测试工作经验iOS/Android测试经验自动化测试通信相关专业性能测试功能测试AI计算机相关专业Python
杭州 余杭区

朱女士 · 清瑶智能科技5日内活跃





