职位详情
岗位职责:
大模型应用开发:基于开源或商用大语言模型(LLM),设计并实现面向垂直场景的AI应用(如智能客服、知识问答、报告生成、代码辅助、多模态交互等)。
Prompt工程与优化:设计高效、鲁棒的提示词(Prompt)策略,结合上下文管理、思维链(CoT)、角色扮演等技术提升模型输出质量。
RAG系统构建:搭建基于检索增强生成(Retrieval-AugmentedGeneration,RAG)的系统,集成向量数据库(如Milvus、FAISS、Pinecone)与企业私有知识库。
Agent开发:实现具备工具调用(FunctionCalling)、记忆机制和自主决策能力的AIAgent,支持复杂任务拆解与执行。
模型微调与适配:在必要时对开源大模型进行LoRA、QLoRA或全参数微调,适配特定领域语料或业务逻辑。
性能与成本优化:优化推理延迟、Token使用效率及部署成本,探索模型蒸馏、量化、缓存策略等工程方案。
与产品/业务团队协作:理解业务需求,将AI能力转化为可落地的产品功能,并持续通过A/B测试、用户反馈迭代优化效果。
关注前沿技术:跟踪大模型领域最新进展(如MoE架构、多模态、Agent框架等),评估其在业务中的应用潜力。
任职要求:
必备条件:
计算机、人工智能、软件工程或相关专业本科及以上学历;
熟练掌握Python,具备扎实的软件工程能力和良好的代码规范;
熟悉主流大模型(如Qwen、Llama、ChatGLM、Baichuan、GPT等)的基本原理与使用方式;
有实际的大模型应用开发经验,至少主导或参与过1个LLM应用项目(如智能对话、文档生成、知识库问答等);
熟悉LangChain、LlamaIndex、Transformers、vLLM、Ollama等常用开发框架或推理引擎;
了解向量数据库(如Milvus、Chroma、Weaviate)和Embedding模型(如BGE、text-embedding-ada-002);
具备基本的Linux、Docker、API设计(REST/gRPC)和云服务(如阿里云、AWS、Azure)使用经验。
加分项:
有RAG、Agent、FunctionCalling、多轮对话状态管理等复杂系统实战经验;
熟悉大模型微调流程(SFT、RLHF)及工具链(如HuggingFace、DeepSpeed、Axolotl);
了解模型部署与推理优化技术(如TensorRT-LLM、GGUF量化、vLLM推理加速);
有金融、医疗、法律、教育等垂直领域知识或项目背景。
大模型应用开发:基于开源或商用大语言模型(LLM),设计并实现面向垂直场景的AI应用(如智能客服、知识问答、报告生成、代码辅助、多模态交互等)。
Prompt工程与优化:设计高效、鲁棒的提示词(Prompt)策略,结合上下文管理、思维链(CoT)、角色扮演等技术提升模型输出质量。
RAG系统构建:搭建基于检索增强生成(Retrieval-AugmentedGeneration,RAG)的系统,集成向量数据库(如Milvus、FAISS、Pinecone)与企业私有知识库。
Agent开发:实现具备工具调用(FunctionCalling)、记忆机制和自主决策能力的AIAgent,支持复杂任务拆解与执行。
模型微调与适配:在必要时对开源大模型进行LoRA、QLoRA或全参数微调,适配特定领域语料或业务逻辑。
性能与成本优化:优化推理延迟、Token使用效率及部署成本,探索模型蒸馏、量化、缓存策略等工程方案。
与产品/业务团队协作:理解业务需求,将AI能力转化为可落地的产品功能,并持续通过A/B测试、用户反馈迭代优化效果。
关注前沿技术:跟踪大模型领域最新进展(如MoE架构、多模态、Agent框架等),评估其在业务中的应用潜力。
任职要求:
必备条件:
计算机、人工智能、软件工程或相关专业本科及以上学历;
熟练掌握Python,具备扎实的软件工程能力和良好的代码规范;
熟悉主流大模型(如Qwen、Llama、ChatGLM、Baichuan、GPT等)的基本原理与使用方式;
有实际的大模型应用开发经验,至少主导或参与过1个LLM应用项目(如智能对话、文档生成、知识库问答等);
熟悉LangChain、LlamaIndex、Transformers、vLLM、Ollama等常用开发框架或推理引擎;
了解向量数据库(如Milvus、Chroma、Weaviate)和Embedding模型(如BGE、text-embedding-ada-002);
具备基本的Linux、Docker、API设计(REST/gRPC)和云服务(如阿里云、AWS、Azure)使用经验。
加分项:
有RAG、Agent、FunctionCalling、多轮对话状态管理等复杂系统实战经验;
熟悉大模型微调流程(SFT、RLHF)及工具链(如HuggingFace、DeepSpeed、Axolotl);
了解模型部署与推理优化技术(如TensorRT-LLM、GGUF量化、vLLM推理加速);
有金融、医疗、法律、教育等垂直领域知识或项目背景。
2026-05-31 12:23
IP属地:四川
职位福利
本科1-3年

成都玟励科技有限公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >













