CL-benchCL-bench 是由腾讯混元团队与复旦大学联合发布的上下文学习能力评估基准,旨在测量大语言模型从提供的上下文中实时学习并正确应用新知识的能力。CL-bench 包含数百个复杂场景与数千项任务,并通过严格的验证标准衡量模型的 Context 实时学习水平,是目前检测模型是否具备 Context 学习能力的重要评估工具。060最近收录AI# CL-bench# Context 学习# 动态上下文理解