搜索
登录注册

职位详情

1. 资深后端架构师 (AI Gateway / 计费引擎方向) 岗位职责: · 从 0 到 1 设计并研发全球化 AI API 路由网关,实现类似 OpenRouter 的高并发、低延迟模型调用。 · 研发支持海量长连接(SSE/WebSocket)的流式转发系统,保障大规模并发下的稳定性。 · 构建精确到 Token 级别的计费引擎、多租户权限控制系统和智能负载均衡策略。 任职要求: · 5 年以上后端研发经验,精通 Go 或 Rust 或 全栈。 · 深刻理解高并发架构,熟练掌握 Redis、Kafka、PostgreSQL 等基础组件。 · 熟悉各大模型厂商的 API 规范,对大模型的流式输出、并发控制有实战经验。 2. 高级网络与协议专家 (跨境链路与安全攻防方向) 岗位职责: · 设计并维护全球多节点(中美欧等地)的网络专线传输架构,突破各类复杂网络环境限制,确保 API 调用的极低延迟与高可用。 · 深入研究并应对各类复杂的网络协议、反爬策略、TLS 指纹风控,构建防封锁的高匿海外代理池与路由网络。 · 保护平台网关免受恶意刷量、CC 攻击及 Token 盗刷。 任职要求: · 精通底层网络协议(TCP/IP, BGP, HTTP/2 & 3, QUIC),熟悉 Linux 内核网络栈。 · 具备极强的网络抓包分析与协议还原能力,熟悉主流的反混淆、反指纹及流量清洗技术。 · 有过出海业务高可用网络建设、跨境专线优化或深度的网络攻防实战经验。 3. 首席 AI Infra 工程师 (算力压榨与推理加速) 岗位职责: · 负责万亿/千亿参数大模型在自建或企业私有 GPU 集群上的极致推理优化。 · 深度改造主流推理引擎(如 vLLM, TensorRT-LLM),重写底层算子以解决特定长文本(Long Context)推理的显存墙问题。 · 探索并落地极致的模型量化(FP8, AWQ 等)与 KV Cache 优化技术,将硬件推理成本压缩到极致。 任职要求: · 精通 C++ / CUDA,具备扎实的 GPU 硬件架构知识。 · 对大模型底层运行机制和 Attention 机制有源码级别的理解。 · 在底层开源社区(如 vLLM, DeepSpeed)有核心代码贡献者优先。 4. 大语言模型 (LLM) 算法专家 (自训练与模型重构) 岗位职责: · 基于开源基座(如 Qwen, Llama 3)进行企业级私有化模型的预训练(Continual Pre-training)、SFT 和 DPO 对齐训练。 · 负责跨模态模型的融合,以及解决垂直领域应用中的模型“幻觉”问题。 · 运用知识蒸馏(Knowledge Distillation)技术,将顶级大模型能力迁移至低成本的小参数模型。 任职要求: · 极强的前沿 Paper 阅读与复现能力,精通 PyTorch 及主流训练框架(Megatron-LM, DeepSpeed)。 · 具备高质量数据集构建与清洗(Data Engineering)的极强实操经验。 有过从零搭建 MoE 架构或参与过百亿参数以上模型训练经验。 5. 资深 AI 应用工程师 (Agent / 工作流开发) 岗位职责: · 深入理解企业客户的业务痛点,利用 LLM 和外部工具链开发多智能体(Multi-Agent)协作系统。 · 搭建千万级文档级别的高性能 RAG(检索增强生成)系统,优化向量检索的召回率与准确度。 · 编写极度复杂的系统级 Prompt,封装各类模型能力供前后端调用。 任职要求: · 精通 Python,熟练掌握 LangChain, LlamaIndex 等框架及底层原理。 · 熟练使用向量数据库(Milvus, Qdrant 等)及图数据库,对 Embedding 算法有深入理解。 · 有实际落地过复杂企业级工作流自动化或高级 Agent 系统的经验。 6. AI 产品总监 / 资深产品经理 (ToB/平台方向) 岗位职责: · 负责 AI Gateway 开发者控制台及企业级管理后台的产品规划与设计。 · 深入企业一线,调研各行业(如出海游戏、跨境电商、金融等)的大模型需求,输出标准化的 SaaS 解决方案与私有化部署方案。 · 监控国内外模型生态动态,制定平台的模型接入策略和计费定价模型。 任职要求: · 极其敏锐的 AI 商业嗅觉,重度参与过大模型相关的产品设计。 · 懂技术,能与 Infra 工程师和算法科学家无障碍沟通,理解 Token、并发、量化、微调等技术概念背后的商业逻辑。 · 极强的 B 端复杂系统抽象能力和业务梳理能力。 7. 全球化 MLOps / SRE 工程师 岗位职责: · 统筹管理国内外云厂商及 IDC 机房的 GPU 裸金属服务器,构建全球化算力池。 · 设计基于 Kubernetes 的大规模 AI 集群调度方案,实现模型服务的弹性扩缩容。 · 建立 7x24 小时极高敏感度的监控预警体系。 任职要求: · 精通 K8s 容器编排架构及云原生生态。 · 熟练掌握自动化运维工具,拥有大规模异构(GPU/CPU)集群的运维管理经验。
2026-01-28 19:01
IP属地:浙江杭州

职位福利

本科5-10年网关
企业发布信息图
北京谷英技术咨询服务有限公司
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

系统架构专家
5-6万元/月
架构师5-10年本科
杭州 余杭区
Java架构师
2-2.5万元/月
架构师Java5-10年大专分布式技术
杭州 余杭区
智能计算高级研究专家
6-8万元/月
架构师5-10年硕士分布式技术云计算架构
杭州 余杭区
AI架构专家
7-9万元/月
架构师5-10年本科PythonGoJava
杭州 余杭区
业务架构师
3-6万元/月
架构师5-10年本科业务架构大数据架构
杭州 余杭区
研发技术主管(电商领域)
2.5-4万元/月
架构师5-10年本科
杭州 余杭区
业务架构师(初级至中级)
2-2.5万元/月
架构师3-5年本科业务架构师
杭州 余杭区
【高阶岗位】智算软件栈高级研发专家
4-6万元/月
架构师10年以上硕士数据结构服务器配置平台架构网络协议
杭州 余杭区
资深电商业务架构师(AI领域)
4-6万元/月
架构师5-10年本科网站架构云计算架构平台架构
杭州 余杭区
智能体系统架构师
3-4.5万元/月
架构师5-10年硕士TypeScript分布式技术Python
杭州 余杭区