一行行优美的latex排版公式如瀑布般在屏幕上倾泻而下。辅助线的构造、代数变形的技巧、数论同余的巧妙放缩……模型不仅给出了答案,而且步骤详尽、逻辑严丝合缝,甚至在某些题目的解法上,比官方给出的標准答案还要简洁漂亮。
“有意思,再来!”
徐辰眼睛一亮,立刻將剩下的9道imo压轴题,一道接一道地餵了进去。
无一例外,每一道题都在数分钟內被完美拆解。
“10道题全对,平均每道题用时基本不超过十五分钟。”徐辰对照了一遍答案,眼底满是惊嘆。
或许外行会觉得解一道题花十几分钟有点慢,但在2027年的ai agent时代,並不追求秒出结果,而是通过反覆拆解、推演、排雷来確保绝对正確率的运行模式,才是攻克严肃科学难题的真正利器。
只用了7天时间的训练,极小的参数量,却直接把上一代ai架构按在地上无情摩擦!
但这在计算机科学领域,其实再正常不过。这就如同当年横空出世的transformer架构,仅仅用上一代rnn几分之一的参数量和极短的训练时间,就直接打爆了所有的自然语言测试榜单,开启了大模型时代。底层核心架构的代际碾压,就是这么不讲道理!
……
但这还不够。imo的常规题,虽然需要极高的智商,但依然在高中生知识范畴內,徐辰决定稍微再超纲一些,测试一下这个模型面对“超纲”和“灵感”时的极限。
最合適的题目,其实就是徐辰当年参加数学imo时的魔鬼第六题,那个题目略微超纲,而且需要很强的数学直觉。
按下回车。
这一次,屏幕上的光標停住了。
一分钟过去了,没有输出。
十分钟过去了,依然没有输出。
终端后台的资源监控器上显示,lpu集群的占用率已经飆升到了100%,风扇的嘶吼声仿佛在诉穿著这台机器正在经歷怎样的脑力风暴。
徐辰没有急著去打断它,他知道,对於slrm主导的逻辑引擎来说,没有输出,就意味著它正在庞大的逻辑树中进行疯狂的深度搜索和自我验证。
这一等,就是整整一天一夜。
直到第二天的傍晚,徐辰靠在椅子上快要睡著的时候,音箱里突然传来了“叮”的一声清脆提示音。
徐辰猛地睁开眼,看向屏幕。
洋洋洒洒將近二十页的推导过程,赫然呈现在屏幕上!在最后一行,那个熟悉而绝对正確的结论,安静地躺在那里。
“臥槽……真做出来了?”
徐辰倒吸了一口凉气,立刻精神抖擞地开始逐行审查这二十页的推导过程。
……
十几分钟后,徐辰看完了整个证明,脸上的表情变得极其精彩,那是一种既惊嘆又无语的复杂神情。