ucla - 搜索 News

3 天

全球首次！2B复现DeepSeek-R1「啊哈时刻」，UCLA等用纯RL实现多模态推理

最初，研究者观察到了回答长度下降，因为基础模型倾向于生成HTML代码。通过强化学习，这种行为很快被抑制，随后回答长度开始规律地增加。之后，多模态的「啊哈时刻」出现了。随后，回答长度和基准准确率之间展现出一致的正相关关系。

3 天

在人工智能领域，最近发生了一项震撼性的技术突破，加州大学洛杉矶分校（UCLA）的一支研究团队成功地在未经监督的2B参数模型上实现了多模态推理的「啊哈时刻」。这一成果不仅展示了强化学习（RL）在推理能力提升方面的潜力，也为未来的多模态AI研究提供了新的方向。在当前AI快速发展的环境中，这无疑是一个值得关注的里程碑。

5 天

Adobe 联合高校推出 METAL 框架：多智能体协作生成精准图表

METAL 的模块化设计是其一大亮点。它通过将视觉解读和代码生成的任务分配给不同的代理，使每个代理可以专注于其特定功能。这种方法确保了图表的视觉和技术元素都得到充分考虑和调整，从而提高了生成图表的准确性和一致性。

虎扑社区 on MSN6 天

球迷晒雷迪克观看女篮比赛视频，配文称他似乎还在观看录像

虎扑03月02日讯今日，湖人主帅JJ-雷迪克到场观战UCLA对阵USC的大学女篮比赛。比赛期间，有球迷拍到雷迪克疑似在座位上观看比赛的录像回放。本赛季至今，湖人的战绩为37胜21负，高居西部第三。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果