搜索
登录注册

职位详情

【工作职责】
1. 大模型技术研究与开发
- 深入掌握Transformer、Attention、MoE、RLHF等核心技术原理,持续跟进最新学术进展并实现关键算法复现。
- 熟悉大模型完整训练流程及性能调优,涵盖数据预处理与增强、预训练、有监督微调(SFT)、RLHF,以及LoRA/QLoRA/P-Tuning等高效适配方法。

2. 数据处理与质量保障
- 构建面向大规模非结构化数据(如PDF、扫描文件、Office文档)的自动化解析、清洗、去重和标注系统。
- 设计合理的文本分块策略、元信息提取规则与数据质量评估机制,保障训练语料的丰富性、准确性与高信噪比。

3. 推理性能优化与工程落地
- 运用vLLM、TensorRT-LLM、DeepSpeed等工具进行推理加速,提升生成速度、降低首字延迟并增强并发处理能力。
- 基于LangChain、LlamaIndex等框架搭建RAG、智能Agent类应用,持续改进检索与生成模块的协同表现。

4. 团队管理及对外解决方案输出
- 统筹算法团队运作,建立开发规范、制定技术攻关路线并推动内部知识沉淀,确保项目交付的质量与时效。
- 参与客户交流与售前支持,精准把握业务需求,提供定制化技术方案并完成POC验证演示。

5. 前沿技术追踪与创新

【任职要求】
必要项
1. 教育背景:计算机、人工智能、数学等相关专业硕士或以上学位。
2. 技术原理:精通大语言模型核心架构(如Transformer、Attention、LayerNorm、Positional Encoding),能从理论与实践角度分析模型特性与瓶颈。
3. 主流模型:熟练掌握至少两类主流大模型(如LLaMA 2/3、Qwen、Baichuan、ChatGLM、GPT-4)的结构差异与应用场景,具备实际的预训练、SFT、RLHF或LoRA/QLoRA微调经验;熟悉至少一种分布式训练框架(如DeepSpeed/Megatron-LM)和一种推理加速工具(如vLLM/TensorRT-LLM)。
5. 数据处理能力:具备处理海量非结构化文档(PDF、PPT、扫描件等)的实际经验,可独立完成数据清洗、质量评估与增强流程的设计与实施。
6. 小模型技术:了解BERT系列模型的调优与应用(如Embedding抽取、Cross-Encoder重排序),并能结合大模型构建混合式系统。
8. 团队领导力:有带领算法小组(不少于2人)的实战经历,具备任务分解、技术指导与成果验收能力;能够撰写面向客户或业务方的技术解决方案,将复杂技术逻辑转化为可执行的商业落地路径。

加分项
- 具备海外学习或工作背景(优先考虑英语国家/地区),在权威期刊发表过大模型或相关领域研究成果。
2026-06-27 15:08
IP属地:浙江杭州

职位福利

硕士3-5年大模型算法自然语言处理
企业发布信息图
中控技术股份有限公司
已上市 · 1000-9999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

大模型算法专家(A28747)
3-6万元/月
大模型算法经验不限硕士多模态强化学习大模型电商
杭州 滨江区
大模型算法专家
3-5万元/月
大模型算法3-5年硕士
杭州 滨江区
大模型应用开发工程师
1.8-3万元/月
大模型算法3-5年硕士LSTMGPT智能体
杭州 滨江区
大模型研发
2-3万元/月
大模型算法硕士
杭州 滨江区
大模型技术专家
2-4万元/月
大模型算法5-10年本科大模型推理
杭州 滨江区
大模型应用开发
1.6-2万元/月
大模型算法5-10年本科LLMRAGFastGPT
杭州 滨江区
大模型算法
1.4-3万元/月
大模型算法经验不限本科
杭州 滨江区
AI相关平台软件和算法开发
大模型算法
杭州 滨江区
AI大模型智能体开发工程师
2.5-3.5万元/月
大模型算法5-10年硕士
杭州 滨江区