背景:
随着高阶自动驾驶(L3/L4)与智能座舱的深度融合,车端感知结合云端大语言/多模态模型(LLM/VLM)的端云协同架构成为突破场景上限的核心趋势。为实现复杂场景的长尾理解以及基于多源输入(如行车环境、DMS疲劳监测)的深度闭环服务,一套灵活、高可用的云端大模型与 Agent 调度底座在当前敏捷开发与前沿Demo验证中显得尤为重要。
核心内容:
1. 云基座独立部署: 独立负责云端大模型运行环境的搭建、配置与日常维护(熟悉 AWS 等主流云平台的基础设施配置,熟练使用 Docker 等容器化部署技术)。
2. 大语言/多模态模型部署与优化: 负责前沿开源大模型(如
Qwen, DeepSeek, Llama 等系列 LLM 及 VLM)在云服务上的私有化部署、API封装与推理加速优化(了解 vLLM、KV Cache 管理及量化技术)
3. Agent 框架搭建与集成: 协助搭建并维护基于云端的 Agent 架构(如 OpenClaw 框架),实现任务逻辑拆解、多 Agent 协同(如行车、疲劳、调度 Agent)以及 RAG 长短记忆库的接入。
4. 车云链路与生态联调: 开发云端与车端的交互接口,打通车云双向通信链路;实现云端 Agent 对外部生态服务(如外卖预订、地图API)的 Function Calling 接口对接,支撑 L3 级实车/台架端到端 Demo 的全链路跑通。