备案控制台

游客j262cdzidm7ry_个人页

游客j262cdzidm7ry

文章

1

问答

0

视频

0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

文章
问答
视频

发表了文章 2024-09-20

在 o1 发布后，回顾当年 Jim Fan 对 Q*的预测，他对了吗？

Jim Fan 对 Q* 的预测如今被最新发布的 o1 验证。他将 Q* 与 AlphaGo 类比，认为其通过自我对弈不断进步。AlphaGo 的架构包括策略神经网络、价值神经网络、蒙特卡洛树搜索及输赢判定。Jim 提出大语言模型 Q* 的四个组件：策略神经网络生成思维过程，价值神经网络评估每步正确性，搜索则通过思维链找到最优解，输赢判定基于数学问题答案。这一设计使模型能自我训练提升。o1 在数学和编程领域的出色表现验证了这一方法，但其能力是否能泛化至其他领域仍是通往 AGI 的关键。

暂无更多信息

发表了文章 2024-09-20

在 o1 发布后，回顾当年 Jim Fan 对 Q*的预测，他对了吗？

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息