TTT‑DiscoverTTT‑Discover 是一种测试时训练(Test‑Time Training)框架,应用在线强化学习于大语言模型在推理阶段持续训练以发现高奖励解决方案。该方法在数学优化、GPU 内核设计、算法竞赛与生物数据分析等多领域刷新最优成果,并且可复现运行于开源模型与工具链。070教育与学习最近收录AI# 在线强化学习# 测试时训练# 科学发现AI