大语言模型算法研发工程师

2-3万元/月

长宁区

张女士

已实名

企业认证

凯捷咨询(中国)有限公司

职位详情

大模型算法

注意：此岗位Base天津，每周可居家办公2天，另外三天在天津办公室现场。需要英文口语流利，全英面试

作为人工智能应用工程师，您将负责把大型语言模型及其他AI模块进行集成、微调，并推动其在生产级软件系统中的落地运行。

该职位聚焦于模型训练完成后的工程化流程，涵盖微调策略、提示工程、检索增强生成（RAG）、向量数据库整合以及模型上线部署等环节，不涉及底层基础模型的架构开发。

您将与后端开发团队、产品部门及数据团队协同合作，打造高效、精准、稳定且具备量产能力的智能应用系统。

将大语言模型（LLM）及相关AI能力嵌入Web端与服务端应用中。
采用LoRA、QLoRA或监督式微调方式对开源模型实施定制化优化。
基于向量数据库搭建RAG检索流程。
针对不同应用场景设计并持续迭代提示词方案（包括提示链、模板设计、少样本配置）。
完成模型封装并部署至推理环境。
评估并持续追踪AI模型在真实业务场景下的表现指标。
保障AI系统在生产环境中的可扩展性、安全合规性与稳定性。
持续关注主流大模型工具生态的发展动态（如LangChain、LlamaIndex、OpenAI API、Hugging Face、Spring AI等）

必备资格
计算机科学、软件工程或相关专业本科及以上学历。
具备2年以上开发AI赋能型应用或服务的实际经验。
熟练掌握Python编程，熟悉LangChain、Transformers或Hugging Face数据集等技术栈。
理解向量嵌入原理，并有使用向量搜索工具的实践经验。
熟悉模型部署标准流程（如Docker容器化、REST接口开发、AWS/Microsoft Azure等云平台）。
掌握提示工程方法论及大模型行为调优技巧。
具有对接OpenAI、Anthropic或开源模型（如Mistral、LLaMA系列）API的项目经历。
实践过PEFT技术（如LoRA/QLoRA）进行轻量化微调。
了解LLMOps体系，具备模型可观测性与性能评估意识。
接触过AI系统中的安全、隐私保护与伦理合规实践。
有开发聊天机器人、AI助手、文档解析工具或其他智能应用的实际案例。
参与过开源AI项目或GenAI工作流相关贡献者优先。

2026-07-11 14:20

IP属地：上海

职位福利

本科5-10年自然语言处理PyTorchTensorFlow