
厦门湖里区招防火门安装,5个双开门,2个单开,包装锁,毕门气,包罐浆7个门
防火门门窗安装对开门装锁
厦门市湖里区招防火门安装,5个双开门,2个单开,包装锁,毕门气,包罐浆7个门
厦门海沧区新安村要换两个防火门锁芯,大概本周五,锁芯我提供,工钱100元,可以先加微信
100-110元/趟
装锁日结兼职
海沧新安村要换两个防火门锁芯,大概本周五,锁芯我提供,工钱100元,可以先加微信
临时工
专业团队落地赋能淘京拼社群团购爆客系统独家渗透技术加入盛兔帮助你快速积累个人财富还在为快递无法送货上门而烦恼的小伙伴,快来试试盛兔帮服务,它家跟多个电商平台合作,可以把快递从驿站取出来送到您家里,还有代寄快递,代购商品等多种各类的生活琐事。现在盛兔帮招募社区管家,时间自由,就近工作,有合作意向,欢迎了解哦。想咨询的请联系:
数据标注大专及以上
岗位职责
1、负责后台数据录入、格式校验及整理,确保信息准确规范;
2、协助完成数据清洗归档,参与基础报表的生成与更新;
3、配合部门需求提取数据,提供查询与基础分析支持;
4、协助梳理后台系统流程,提出效率提升建议(公司提供全流程培训)
岗位要求
1、大专以上学历,无相关工作经验要求。
2、熟练掌握电脑基本操作及Word、Excel等办公软件,对数据敏感,具备快速学习标注工具和规则的能力。
3、工作认真负责,耐心细致,能专注重复性标注工作;
具备良好的团队协作与沟通能力,可及时反馈工作问题。
搬运工包吃
花店兼职
要求:吃苦耐劳,有责任心,服从安排,手脚灵活。
工作内容:打刺等,客服,修花,整货,搬货等,无需经验
工作时间:9到9点,一天
薪资福利:180一天,(包两餐工作餐)
工作地址:厦门市思明区文屏山庄85-5
联系方式:
开荒保洁1-4天
明天上午单,4小时200元
1、杏林中航城C区
2、集美公园城
3、集美棕榈城
4、集美古龙明珠
5、杏林海韵华庭
7, 集美水晶湖郡
8,集美泉水湾。
大语言模型算法后训练工程师(双休)
4-6万元/月
算法工程师3-5年硕士及以上发表算法相关优秀论文团队管理经验大模型算法多模态算法算法工程化经验强化学习参加算法相关竞赛/获奖优秀开源项目经历Python
核心职责
1. 模型后训练与多轮交互对齐(绝对核心)
主导多轮交互强化学习(Multi-turn RLHF)体系搭建:负责从SFT到DPO/RLHF的完整算法链路研发,重点攻克Agent在长周期对话中出现的“目标遗忘”、“逻辑偏移”及“被用户引导偏离主线”的挑战。
深入迭代Iterative DPO流程优化:突破静态数据依赖,构建Self-Play(自我博弈)机制,利用模型与模拟环境交互产生的对话轨迹(Trajectories)持续进行迭代式DPO训练,推动策略动态演进。
开发高拟真用户模拟器(User Simulator):设计并训练具备多样化性格特征(如挑剔、迟疑、情绪化)的“客户代理”,通过对抗性训练(Adversarial Training)增强Agent在复杂对话场景下的应变能力与节奏掌控力。
长周期奖励建模(Long-term Reward Modeling):针对销售类任务设计并调优复合型奖励函数,解决稀疏反馈难题,合理权衡“单轮回复质量”与“最终转化效果(留电/到院)”之间的优先级关系。
2. 数据战略与工程(基石)
垂直领域数据闭环构建:主导从原始销售对话数据到高质量SFT/DPO训练数据的全链路清洗与加工,关键解决“去模板化表达”与“精准指令遵循”之间的协同问题。
高质量合成数据生产:借助GPT-5/Claude-4等强基座模型搭建自动化数据生成管线,规模化产出涵盖Corner Case(边缘场景)的多轮偏好数据(Preference Data),支撑拒绝采样(Rejection Sampling)训练需求。
3. 推理部署与性能优化
承担微调模型的推理加速工作,熟练运用vLLM / SGLang等高性能推理框架,优化KV Cache调度策略,保障多轮会话在显存受限设备(如A800)上的高并发服务能力。
建立自动化评测基准(Benchmark),重点实现对多轮对话连贯性、留联达成率及合规要求的量化评估能力。
必备要求(硬性门槛)
经验背景:
硕士及以上学历,具备3年以上NLP或大模型实际项目经验。
必须拥有“多轮对话Agent”或“任务导向型对话系统”的落地实践经验:亲自处理过多轮交互过程中的一致性维护、幻觉抑制与目标追踪问题。
有头部大模型企业(MiniMax, Moonshot, Zhipu等)Post-training团队核心岗位经历者优先考虑。
核心技术栈(必须全部满足):
精通强化学习与模型对齐技术:深入掌握DPO(Direct Preference Optimization)及其变体(如IPO, KTO),具备Online DPO、Iterative DPO或多轮交互强化学习的实际操作经验,能清晰阐述如何应对数据噪声及防范Reward Hacking现象。
模拟器建设与数据构造能力:具备User Simulator开发经验,熟悉通过Self-Play机制提升模型能力上限的方法论。
工程落地实力:熟练使用PyTorch、DeepSpeed、Megatron-LM等主流框架,具有大规模指令微调(SFT)和强化学习训练中的显存优化经验(支持Tensor Parallelism/ZeRO等技术)。
优先考虑(加分项)
实际参与过“销售/谈判/客服”类强目标驱动场景的对话系统建设,非纯闲聊型(Chitchat)模型经验。
在开源社区有实质贡献:曾为TRL、LLaMA-Factory、vLLM、verl等相关项目提交代码或维护文档。
学术成果积累:在ACL、NeurIPS、ICLR等顶级会议发表过关于RLHF、对话系统、模型对齐方向的研究论文。
福建厦门同安区职位描述工作内容:1、管道清淤疏通及修复,2、编写施工日志,上报施工进度,质量,处理现
6000-12000元/月
管道疏通
职位描述
工作内容:1、管道清淤疏通及修复,
2、编写施工日志,上报施工进度,质量,处理现场问题.
3、协助内页做好工程的资料收集;
职位要求:
1、年龄23-45周岁,高中以上学历,有C1驾驶证;
2、能吃苦耐劳,为人踏实、老实忠厚,保密意识强、责任心强,能适应加班。
工作时间:月休四天
能够接受福建省内出差
职位福利:医社保、员工宿舍,有食堂。
栏目概述
鱼泡直聘为工人提供厦门修锁人才招聘网在线招聘信息,主要招聘厦门修锁/开锁/换锁相关人才。作为修锁/开锁/换锁工人,如果您具备一定的工作经验,并且能够熟练掌握相关的岗位技能和了解修锁/开锁/换锁的工作职责。那么您将是我们需要的人才,平台上有更多的工作机会适合您。