【业务方向】
我们在做一种全新的视频形态:
不是从零生成视频,而是在真实视频之上,叠加一层 AI 原生的语义理解与视觉表达层,
让视频具备 结构、重点、可解释性和可编辑性。
这不是特效或剪辑自动化,
而是一套 Semantic → Visual 的 Agent 系统,目标是成为视频领域的
“AI 解释层 / 表达层基础设施”。
【岗位职责】
- 设计多模态 Agent 的 理解–规划–执行链路;
- 将口播内容拆解为 数据 / 观点 / 步骤 / 因果 / 结论 等信息类型;
- 规划这些信息如何转化为可控、可编辑的视觉表达计划;
- 构建中间表示层(VisualPlan / DataBlock),解决幻觉、可审计与人工确认边界;
- 定义 Agent 输出质量标准,并用真实反馈持续迭代。
【任职要求】
必须项
- 真正理解 LLM Agent(懂系统、边界和失败模式),有Agent调优经验与兴趣;
- 有强系统感,能把模糊问题结构化;
- 对 可编辑 AI / 人机协作系统有长期兴趣;
- 扎实的 Python 能力
- 本科及以上毕业生
加分项
- 复杂 Agent / 多模态经验;
- 熟悉视频、知识、教育、财经等高信息密度场景;
- 有把事情做成“基础设施”的长期动机。
【我们能提供】
- 真正的核心问题,而非边角优化;
- 高度技术自主权,参与定义架构;
- 清晰的长期方向;
- 股权 / 长期激励可谈。