职位详情
岗位职责:
1.跟踪Sora、DiT等先进视频生成技术发展,建立模型评估标准,主导开源与闭源模型的测试选型及业务场景适配
2.搭建视频生成技术中台,完成文本转视频、图像转视频、视频风格迁移、视频插帧等功能的模块化整合与API服务输出
3.针对商业短视频应用场景研发定制化生成模型,围绕意图还原精度、平台流行内容匹配、时序连贯性与画面一致性等需求优化模型性能
4.构建多模态Prompt工程框架,提升文本-图像-视频之间的语义一致性,增强生成内容与商业目标的契合度
任职要求:
1.熟练掌握PyTorch/TensorFlow框架,具备混合精度训练、分布式训练等工程实践能力
2.深入理解Diffusion模型、Transformer、DiT等生成式架构原理,能够根据需求调整模型结构
3.掌握PromptEngineering、LoRA微调等大模型适配方法,具有ControlNet类控制模块开发经验
4.具备处理多模态数据的能力,熟悉CLIP、BLIP等跨模态对齐模型的实际应用
5.了解视频编解码技术(H.264/HEVC),熟练使用FFmpeg/OpenCV等工具链进行视频处理
6.熟悉商业视频制作流程,具备镜头语言、转场特效等影视制作规范认知者优先
负责:
1.跟进外部优质视频生成模型与算法进展,结合需求将其集成至kuaizi产品体系
2.自主研发kuaizi视频生成模型
1.跟踪Sora、DiT等先进视频生成技术发展,建立模型评估标准,主导开源与闭源模型的测试选型及业务场景适配
2.搭建视频生成技术中台,完成文本转视频、图像转视频、视频风格迁移、视频插帧等功能的模块化整合与API服务输出
3.针对商业短视频应用场景研发定制化生成模型,围绕意图还原精度、平台流行内容匹配、时序连贯性与画面一致性等需求优化模型性能
4.构建多模态Prompt工程框架,提升文本-图像-视频之间的语义一致性,增强生成内容与商业目标的契合度
任职要求:
1.熟练掌握PyTorch/TensorFlow框架,具备混合精度训练、分布式训练等工程实践能力
2.深入理解Diffusion模型、Transformer、DiT等生成式架构原理,能够根据需求调整模型结构
3.掌握PromptEngineering、LoRA微调等大模型适配方法,具有ControlNet类控制模块开发经验
4.具备处理多模态数据的能力,熟悉CLIP、BLIP等跨模态对齐模型的实际应用
5.了解视频编解码技术(H.264/HEVC),熟练使用FFmpeg/OpenCV等工具链进行视频处理
6.熟悉商业视频制作流程,具备镜头语言、转场特效等影视制作规范认知者优先
负责:
1.跟进外部优质视频生成模型与算法进展,结合需求将其集成至kuaizi产品体系
2.自主研发kuaizi视频生成模型
2026-05-20 14:48
IP属地:广东广州
职位福利
硕士3-5年语音算法图像算法分布式训练大模型算法多模态算法大数据处理框架(Spark/Hadoop/Hive)算法工程化经验Python

广州筷子信息科技有限公司
B轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI开发工程师(自动化开发)
8000-12000元/月
算法工程师1-3年本科推荐算法Python大数据处理框架(Spark/Hadoop/Hive)大模型算法强化学习优秀开源项目经历
广州 海珠区
音视频指纹算法专家(AI侵权检测方向)
2-4万元/月
算法工程师5-10年本科Java语音算法团队管理经验搜索算法深度学习算法工程化经验大数据处理框架(Spark/Hadoop/Hive)多模态算法自然语言处理算法大模型算法优秀开源项目经历嵌入式开发推荐
广州 海珠区

邱女士 · 泓鉴科技5日内活跃
算法工程师|AI模型部署与调优训练
2-4万元/月
算法工程师3-5年本科团队管理经验AI服饰生成 / 数字分身试穿图像算法运筹优化算法分布式训练深度学习大模型算法自然语言处理算法多模态算法算法工程化经验MATLAB优秀开源项目经历发表算法相关优秀论
广州 海珠区

梁先生 · 广州欲比天高科技5日内活跃
音视频特征识别算法专家(AI版权保护方向)
2-4万元/月
算法工程师5-10年本科Java语音算法团队管理经验搜索算法深度学习算法工程化经验大数据处理框架(Spark/Hadoop/Hive)多模态算法自然语言处理算法大模型算法优秀开源项目经历嵌入式开发推荐
广州 海珠区

邱女士 · 泓鉴科技5日内活跃







