职位详情
岗位职责:
1. 运用大语言模型结合自然语言处理技术,实现智能文本解析与结构化转换,构建高效的文本预处理流程,完成数据清洗、分词处理、重复内容剔除、隐私信息脱敏及Token使用优化等工作;
2. 基于主流AI应用开发框架(如LangChain/AutoGen等)开展智能体开发与任务流程编排,支持复杂文本处理任务的自动分解与执行;
3. 深入优化提示工程,采用思维链(CoT)等策略提升语义理解能力,同时构建轻量级检索增强生成(RAG)机制,缓解长文本处理中的上下文限制和生成幻觉问题;
4. 针对高等教育领域相关数据,实施小规模模型微调(SFT+LoRA),以增强模型在特定业务场景下的表现力;
5. 综合运用机器学习、深度学习与大模型技术,对大规模用户行为数据进行深度分析,建立动态精准的用户画像与标签系统,从非结构化数据中挖掘潜在价值并推动技术落地;
6. 承担模型训练、知识蒸馏、剪枝压缩与参数调优等任务,探索大模型在垂直领域的适用性与技术路径;
7. 实现模型服务的API封装与部署(Docker/FastAPI),确保接口响应高效且具备高可用性。
任职资格:
1. 本科及以上学历,熟练掌握Python语言,具备3年以上深度学习项目实践经验,计算机科学、人工智能、机器学习、统计学、应用数学等相关专业背景优先;
2. 熟悉Pytorch或Tensorflow框架,具备扎实的编程能力,了解LangChain、LlamaIndex等AI开发工具及RAG相关技术;
3. 掌握Transformer、BERT、GPT等大模型的核心原理与架构设计,熟悉主流大模型API的功能特性(如上下文长度、函数调用等),了解提示词工程与向量数据库(Milvus/ChromaDB等),能通过Prompt设计与工程方法解决典型错误案例;
4. 能熟练使用Pandas/Numpy进行数据操作,了解列存格式与数据分片机制,掌握OLAP基本原理;具备OCR技术经验(PDF/表格/图像内容提取)或Data Agent开发经历者更佳,有爬虫开发或大规模数据清洗实战经验;
5. 至少精通一种Web后端框架(FastAPI/Django),熟悉中间件配置、认证授权机制、限流策略以及安全防护措施(如CSRF防御、SQL注入防范、敏感信息加密等);
6. 具备NLP方向的实际项目经历,熟悉大模型典型应用场景(如知识问答、文本理解、文档解析、实体识别、智能调度、AIGC交互对话产品开发等);
7. 具备良好的逻辑思维能力,善于沟通协作,责任心强,具备团队合作意识。
加分项:
1. 有行业级智能AI助手类项目实践经验者优先,熟悉情感识别、语音合成(TTS)、语音识别(ASR)等技术者更佳;
2. 具备大型企业级平台系统开发经验者优先;
3. 有高校数据整合、数据建模及相关大模型落地应用经验者优先。
1. 运用大语言模型结合自然语言处理技术,实现智能文本解析与结构化转换,构建高效的文本预处理流程,完成数据清洗、分词处理、重复内容剔除、隐私信息脱敏及Token使用优化等工作;
2. 基于主流AI应用开发框架(如LangChain/AutoGen等)开展智能体开发与任务流程编排,支持复杂文本处理任务的自动分解与执行;
3. 深入优化提示工程,采用思维链(CoT)等策略提升语义理解能力,同时构建轻量级检索增强生成(RAG)机制,缓解长文本处理中的上下文限制和生成幻觉问题;
4. 针对高等教育领域相关数据,实施小规模模型微调(SFT+LoRA),以增强模型在特定业务场景下的表现力;
5. 综合运用机器学习、深度学习与大模型技术,对大规模用户行为数据进行深度分析,建立动态精准的用户画像与标签系统,从非结构化数据中挖掘潜在价值并推动技术落地;
6. 承担模型训练、知识蒸馏、剪枝压缩与参数调优等任务,探索大模型在垂直领域的适用性与技术路径;
7. 实现模型服务的API封装与部署(Docker/FastAPI),确保接口响应高效且具备高可用性。
任职资格:
1. 本科及以上学历,熟练掌握Python语言,具备3年以上深度学习项目实践经验,计算机科学、人工智能、机器学习、统计学、应用数学等相关专业背景优先;
2. 熟悉Pytorch或Tensorflow框架,具备扎实的编程能力,了解LangChain、LlamaIndex等AI开发工具及RAG相关技术;
3. 掌握Transformer、BERT、GPT等大模型的核心原理与架构设计,熟悉主流大模型API的功能特性(如上下文长度、函数调用等),了解提示词工程与向量数据库(Milvus/ChromaDB等),能通过Prompt设计与工程方法解决典型错误案例;
4. 能熟练使用Pandas/Numpy进行数据操作,了解列存格式与数据分片机制,掌握OLAP基本原理;具备OCR技术经验(PDF/表格/图像内容提取)或Data Agent开发经历者更佳,有爬虫开发或大规模数据清洗实战经验;
5. 至少精通一种Web后端框架(FastAPI/Django),熟悉中间件配置、认证授权机制、限流策略以及安全防护措施(如CSRF防御、SQL注入防范、敏感信息加密等);
6. 具备NLP方向的实际项目经历,熟悉大模型典型应用场景(如知识问答、文本理解、文档解析、实体识别、智能调度、AIGC交互对话产品开发等);
7. 具备良好的逻辑思维能力,善于沟通协作,责任心强,具备团队合作意识。
加分项:
1. 有行业级智能AI助手类项目实践经验者优先,熟悉情感识别、语音合成(TTS)、语音识别(ASR)等技术者更佳;
2. 具备大型企业级平台系统开发经验者优先;
3. 有高校数据整合、数据建模及相关大模型落地应用经验者优先。
2026-06-19 13:55
IP属地:陕西西安
职位福利
本科3-5年深度学习机器学习多模态算法

西安斯奈特信息科技有限公司
未融资 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
Ai开发工程师
1-2万元/月
算法工程师3-5年本科PythonJava嵌入式开发大数据处理框架(Spark/Hadoop/Hive)分布式训练深度学习机器学习大模型算法算法工程化经验发表算法相关优秀论文参加算法相关竞赛/获奖
西安 雁塔区







