蔡天池.

创始人与 CEO。曾于蚂蚁集团带领强化学习与 RAG 团队,并于 Minimax 负责聊天模型对齐。在大模型训练、RLHF、检索增强以及大规模优化等领域拥有丰富的实战经验,发表十余篇同行评审论文,曾获最佳论文亚军。

当前

2025 – 至今

创始人 & CEO

Saddlepoint AI
  • Saddlepoint 曲意在一个方向走到 max 时,寻找新的 min 维度。不断寻找新的维度是创新和反内卷的核心方式。
  • 打造了智能体工作流产品 nodie.ai,以及小龙虾产品 nodie claw。

工作经历

2024 – 2025

聊天模型对齐 — 星野 & Talkie

Minimax
  • 负责星野和 Talkie 聊天模型。
  • 将模型与人类偏好及产品需求进行对齐。
2018 – 2024

强化学习与 RAG 团队负责人

蚂蚁集团
  • 主导强化学习、RLHF、RAG 及大规模排序/决策系统的工作。
  • 发表 10+ 篇顶会论文,在 RL、RLHF 和 RAG 领域多次取得 SOTA 结果。
  • 打造了首个用于营销预算分配的大规模 RL 系统。获 WSDM 2023 最佳论文亚军。
  • 每年为公司节省数十亿人民币的营销预算。
2017

软件工程实习生, Ads

Google
  • Ads 团队全栈软件工程实习。

教育背景

2013 – 2018

香港大学

文学士 (哲学) 转 数学与计算机科学方向
  • ACM-ICPC 亚洲区金牌得主。
  • 四年全额奖学金获得者。
  • 伦敦政经学院 (LSE) 微观经济学暑期学校。