职位详情
工作内容
1.参与大模型预训练与微调:协助开展大规模语言模型的训练与微调任务,掌握训练流程、数据构建方法及损失函数设计等关键环节。
2.模型优化与实验推进:参与模型结构探索、训练策略改进与超参数调整等实验工作,通过结果分析持续提升模型在效果、效率与稳定性方面的表现。
3.数据处理与数据集建设:参与大模型所需高质量数据集的清洗、整理与构建,保障训练与评估数据的准确性与有效性。
4.模型能力评估与深度分析:基于标准或自定义评测集,对大模型的语言理解、文本生成、逻辑推理、代码生成、多模态认知等能力进行系统性评估,并输出分析结论。
5.前沿算法研究与落地实践:学习并尝试复现大模型领域的最新研究成果(如高效训练、模型压缩、推理加速、新型架构、对齐技术等),推动创新技术在实际项目中的应用。
6.工具链与平台协作:熟悉并参与内部训练框架、评测系统、数据处理流水线的使用与性能优化,提升研发效率。
职位要求:
1.计算机科学、人工智能、数学等相关专业,本科及以上学历。
2.对自然语言处理、大模型或深度学习有强烈兴趣,并具备一定的科研积累。
3.掌握深度学习基本理论,具备扎实的工程实现能力与良好的编程规范,至少精通Python/C++/Java/Go中的一种编程语言。
4.有AIGC及大模型相关经验(如RAG、Agent、多模态技术)者优先考虑。
1.参与大模型预训练与微调:协助开展大规模语言模型的训练与微调任务,掌握训练流程、数据构建方法及损失函数设计等关键环节。
2.模型优化与实验推进:参与模型结构探索、训练策略改进与超参数调整等实验工作,通过结果分析持续提升模型在效果、效率与稳定性方面的表现。
3.数据处理与数据集建设:参与大模型所需高质量数据集的清洗、整理与构建,保障训练与评估数据的准确性与有效性。
4.模型能力评估与深度分析:基于标准或自定义评测集,对大模型的语言理解、文本生成、逻辑推理、代码生成、多模态认知等能力进行系统性评估,并输出分析结论。
5.前沿算法研究与落地实践:学习并尝试复现大模型领域的最新研究成果(如高效训练、模型压缩、推理加速、新型架构、对齐技术等),推动创新技术在实际项目中的应用。
6.工具链与平台协作:熟悉并参与内部训练框架、评测系统、数据处理流水线的使用与性能优化,提升研发效率。
职位要求:
1.计算机科学、人工智能、数学等相关专业,本科及以上学历。
2.对自然语言处理、大模型或深度学习有强烈兴趣,并具备一定的科研积累。
3.掌握深度学习基本理论,具备扎实的工程实现能力与良好的编程规范,至少精通Python/C++/Java/Go中的一种编程语言。
4.有AIGC及大模型相关经验(如RAG、Agent、多模态技术)者优先考虑。
2026-06-13 14:02
IP属地:广东深圳
职位福利
本科3-5年搜索算法图像算法分布式训练深度学习大模型算法自然语言处理算法多模态算法大数据处理框架(Spark/Hadoop/Hive)算法工程化经验优秀开源项目经历推荐算法SQL发表算法相

企知道科技有限公司
未融资 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











