职位详情
岗位要求:
1、大模型深度使用者:了解主流大模型的特点与区别,具备扎实的 Prompt Engineering 能力,熟练掌握 CoT、ReAct 等提示工程技术。
2、具备 AI Agent 认知能力:深入理解 AI Agent 的架构设计,掌握 Tool Use、Memory、Planning 等核心机制,有 LangChain、AutoGen 或同类框架使用经验者优先考虑。
3、构建大模型评测基准:搭建覆盖音频、视频、图像、文本等多模态的评估体系,设计科学合理的评测指标,并实现评测工具链的自动化。
4、评测数据自动化生成与分析:搭建评测数据集的生产流程,支撑模型评测与结果分析工作;
5、优先条件:计算机、人工智能、语言学等相关专业方向。在 GitHub、HuggingFace 上有开源项目贡献,或运营技术博客者优先。熟悉 Python,可编写基础脚本用于数据处理或评测自动化。
岗位职责:
1、数据构建
(1)参与大模型训练所需高质量指令数据的撰写工作。
(2)设计复杂场景下的数据样本,涵盖音视图文多模态内容,包括多轮对话、工具调用、代码执行、任务规划等多种任务类型的数据。
2、模型评估
(1)参与制定评估标准,对大模型输出结果进行多维度评分。
(2)构造“对抗性”测试数据,探索模型在边界情况下的行为表现。
(3)系统性地评估各类模型,输出详尽的 Badcase 分析报告,为算法优化提供切实可行的改进建议。
1、大模型深度使用者:了解主流大模型的特点与区别,具备扎实的 Prompt Engineering 能力,熟练掌握 CoT、ReAct 等提示工程技术。
2、具备 AI Agent 认知能力:深入理解 AI Agent 的架构设计,掌握 Tool Use、Memory、Planning 等核心机制,有 LangChain、AutoGen 或同类框架使用经验者优先考虑。
3、构建大模型评测基准:搭建覆盖音频、视频、图像、文本等多模态的评估体系,设计科学合理的评测指标,并实现评测工具链的自动化。
4、评测数据自动化生成与分析:搭建评测数据集的生产流程,支撑模型评测与结果分析工作;
5、优先条件:计算机、人工智能、语言学等相关专业方向。在 GitHub、HuggingFace 上有开源项目贡献,或运营技术博客者优先。熟悉 Python,可编写基础脚本用于数据处理或评测自动化。
岗位职责:
1、数据构建
(1)参与大模型训练所需高质量指令数据的撰写工作。
(2)设计复杂场景下的数据样本,涵盖音视图文多模态内容,包括多轮对话、工具调用、代码执行、任务规划等多种任务类型的数据。
2、模型评估
(1)参与制定评估标准,对大模型输出结果进行多维度评分。
(2)构造“对抗性”测试数据,探索模型在边界情况下的行为表现。
(3)系统性地评估各类模型,输出详尽的 Badcase 分析报告,为算法优化提供切实可行的改进建议。
2026-05-20 14:42
IP属地:广东深圳
职位福利
本科3-5年文本分类

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AIGC内容生产线经理
8000-12000元/月
数据标注/AI训练师3-5年本科不接受居家办公语音标注标注结果整理视频标注数字内容数据分析能力强动漫区域标注图片标注文本标注游戏CG短剧标注数据分析标注方法优化MCN分类标注
深圳 南山区

王女士 · 火星语盟今日活跃








