【关于这个岗位】
Cookiy AI 基于真实人类数据训练 AI 系统,用以模拟个体行为、建模人群,并预测人们如何思考、决策与反应(方向对标 AARU、Simile、Listen Labs、Kaishi)。这是一个偏研究的岗位,位于大语言模型、计算社会科学与概率建模的交叉点。需要说明:我们做的是预测模型(predictive model),而不是 world model。
【岗位职责】
1. 基于真实人类访谈/问卷数据,构建并评估“虚拟人/合成受访者”模型,使其在群体层面复刻真实人类的态度与选择分布;
2. 研发面向态度、决策与人群结果的预测模型,并对预测进行不确定性量化与校准;
3. 设计严谨的验证与 benchmark,判断模型在何处可靠、何处失效及其原因;
4. 跟踪并复现前沿论文(见下),把先进方法迁移进我们的数据与场景;
5. 参与大规模访谈/问卷的设计,持续扩充我们独有的真实人类数据资产。
【任职要求】
1. 在读博士优先,硕士亦可;计算机/机器学习/NLP、计算社会科学、统计/计量经济、定量心理/认知科学等理工与量化方向;
2. 扎实的 Python 工程能力(PyTorch/numpy/pandas)与概率统计基础(贝叶斯/因果推断加分);
3. 能独立读懂并复现前沿 ML 与计算社会科学论文;本身研究方向与下列论文相关者优先;
4. 加分:LLM、agent-based modeling、调查/实验方法、预测/forecasting 经验;有一作论文、preprint 或公开项目。
【我们的独特优势】
已积累大量真实人类访谈数据,并可进一步开展大规模访谈与问卷,形成独有(exclusive)的数据资产。期待候选人能把其他论文中的先进实践带进来,或本身就在研究这个方向。
【相关论文 / 研究边界】
虚拟人与虚拟社会:
· Park et al. 2023, Generative Agents: Interactive Simulacra of Human Behavior
· Park et al. 2024, Generative Agent Simulations of 1,000 People(基于 2 小时深度访谈复刻真实个体,对应 Simile 路线)
· Argyle et al. 2023, Out of One, Many: Using Language Models to Simulate Human Samples
· Horton 2023, Large Language Models as Simulated Economic Agents
预测(对标 Polymarket / Kalshi 等预测市场关注点,仍为预测模型而非 world model):
· Halawi et al. 2024, Approaching Human-Level Forecasting with Language Models
· Schoenegger et al. 2024, Wisdom of the Silicon Crowd: LLM Ensemble Prediction Rivals Human Crowd Accuracy
【待遇】博士 800 元/天,硕士 600 元/天, 特别匹配的可面议;
【转正】如果表现突出,则3个月后可以直接转正。