职位详情
注意:此岗位Base天津,每周可居家办公2天,另外三天在天津办公室现场。需要英文口语流利,全英面试
作为人工智能应用工程师,您将负责把大型语言模型及其他AI模块进行集成、微调,并推动其在生产级软件系统中的落地运行。
该职位聚焦于模型训练完成后的工程化流程,涵盖微调策略、提示工程、检索增强生成(RAG)、向量数据库整合以及模型上线部署等环节,不涉及底层基础模型的架构开发。
您将与后端开发团队、产品部门及数据团队协同合作,打造高效、精准、稳定且具备量产能力的智能应用系统。
将大语言模型(LLM)及相关AI能力嵌入Web端与服务端应用中。
采用LoRA、QLoRA或监督式微调方式对开源模型实施定制化优化。
基于向量数据库搭建RAG检索流程。
针对不同应用场景设计并持续迭代提示词方案(包括提示链、模板设计、少样本配置)。
完成模型封装并部署至推理环境。
评估并持续追踪AI模型在真实业务场景下的表现指标。
保障AI系统在生产环境中的可扩展性、安全合规性与稳定性。
持续关注主流大模型工具生态的发展动态(如LangChain、LlamaIndex、OpenAI API、Hugging Face、Spring AI等)
必备资格
计算机科学、软件工程或相关专业本科及以上学历。
具备2年以上开发AI赋能型应用或服务的实际经验。
熟练掌握Python编程,熟悉LangChain、Transformers或Hugging Face数据集等技术栈。
理解向量嵌入原理,并有使用向量搜索工具的实践经验。
熟悉模型部署标准流程(如Docker容器化、REST接口开发、AWS/Microsoft Azure等云平台)。
掌握提示工程方法论及大模型行为调优技巧。
具有对接OpenAI、Anthropic或开源模型(如Mistral、LLaMA系列)API的项目经历。
实践过PEFT技术(如LoRA/QLoRA)进行轻量化微调。
了解LLMOps体系,具备模型可观测性与性能评估意识。
接触过AI系统中的安全、隐私保护与伦理合规实践。
有开发聊天机器人、AI助手、文档解析工具或其他智能应用的实际案例。
参与过开源AI项目或GenAI工作流相关贡献者优先。
作为人工智能应用工程师,您将负责把大型语言模型及其他AI模块进行集成、微调,并推动其在生产级软件系统中的落地运行。
该职位聚焦于模型训练完成后的工程化流程,涵盖微调策略、提示工程、检索增强生成(RAG)、向量数据库整合以及模型上线部署等环节,不涉及底层基础模型的架构开发。
您将与后端开发团队、产品部门及数据团队协同合作,打造高效、精准、稳定且具备量产能力的智能应用系统。
将大语言模型(LLM)及相关AI能力嵌入Web端与服务端应用中。
采用LoRA、QLoRA或监督式微调方式对开源模型实施定制化优化。
基于向量数据库搭建RAG检索流程。
针对不同应用场景设计并持续迭代提示词方案(包括提示链、模板设计、少样本配置)。
完成模型封装并部署至推理环境。
评估并持续追踪AI模型在真实业务场景下的表现指标。
保障AI系统在生产环境中的可扩展性、安全合规性与稳定性。
持续关注主流大模型工具生态的发展动态(如LangChain、LlamaIndex、OpenAI API、Hugging Face、Spring AI等)
必备资格
计算机科学、软件工程或相关专业本科及以上学历。
具备2年以上开发AI赋能型应用或服务的实际经验。
熟练掌握Python编程,熟悉LangChain、Transformers或Hugging Face数据集等技术栈。
理解向量嵌入原理,并有使用向量搜索工具的实践经验。
熟悉模型部署标准流程(如Docker容器化、REST接口开发、AWS/Microsoft Azure等云平台)。
掌握提示工程方法论及大模型行为调优技巧。
具有对接OpenAI、Anthropic或开源模型(如Mistral、LLaMA系列)API的项目经历。
实践过PEFT技术(如LoRA/QLoRA)进行轻量化微调。
了解LLMOps体系,具备模型可观测性与性能评估意识。
接触过AI系统中的安全、隐私保护与伦理合规实践。
有开发聊天机器人、AI助手、文档解析工具或其他智能应用的实际案例。
参与过开源AI项目或GenAI工作流相关贡献者优先。
2026-05-27 14:36
IP属地:上海
职位福利
本科5-10年自然语言处理PyTorchTensorFlow

凯捷咨询(中国)有限公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










