蔡天池.
创始人与 CEO。曾于蚂蚁集团带领强化学习与 RAG 团队,并于 Minimax 负责聊天模型对齐。在大模型训练、RLHF、检索增强以及大规模优化等领域拥有丰富的实战经验,发表十余篇同行评审论文,曾获最佳论文亚军。
当前
2025 – 至今
创始人 & CEO
Saddlepoint AI
- Saddlepoint 曲意在一个方向走到 max 时,寻找新的 min 维度。不断寻找新的维度是创新和反内卷的核心方式。
- 打造了智能体工作流产品 nodie.ai,以及小龙虾产品 nodie claw。
工作经历
2024 – 2025
聊天模型对齐 — 星野 & Talkie
Minimax
- 负责星野和 Talkie 聊天模型。
- 将模型与人类偏好及产品需求进行对齐。
2018 – 2024
强化学习与 RAG 团队负责人
蚂蚁集团
- 主导强化学习、RLHF、RAG 及大规模排序/决策系统的工作。
- 发表 10+ 篇顶会论文,在 RL、RLHF 和 RAG 领域多次取得 SOTA 结果。
- 打造了首个用于营销预算分配的大规模 RL 系统。获 WSDM 2023 最佳论文亚军。
- 每年为公司节省数十亿人民币的营销预算。
教育背景
2013 – 2018
香港大学
文学士 (哲学) 转 数学与计算机科学方向
- ACM-ICPC 亚洲区金牌得主。
- 四年全额奖学金获得者。
- 伦敦政经学院 (LSE) 微观经济学暑期学校。