“测试方式怎么定?”许川问。
秦浩想了想,说:“简单。设定五个任务,双方ai同时处理,现场出结果。”
“五个任务包括情报分析、態势推演、逻辑推理、自然语言对抗和综合决策。每个任务满分十分,五位专家评委打分。”
“评委谁来做?”
“在座的有好几位军方专家,他们的专业能力毋庸置疑。评委就从他们中间选五位出来。”
秦浩说这话的时候脸上带著一种“我多公平”的表情。
许川点了点头,秦浩选的这五个领域恰恰是灵动-2最擅长的。
他不知道灵动-2的测试数据,但他大概是觉得军用场景对民间团队是短板。
这个判断放在一般公司身上或许是对的,但放在川一科技身上就是个笑话。
这秦浩真实是把科学院的脸,硬拉过来给灵动打。
五位军方专家很快选出来了,三位大校两位少將,都是从事情报分析或作战指挥的资深专家。
五个人坐到了靠窗的那排位置上,面前各摆著一台平板电脑,用来实时查看ai的输出结果。
每个人手里还有一份评分表,上面列了五个任务的具体评分標准。
林家栋站起来宣布对决开始,他的声音很平,但仔细听能听出来一丝勉强。
他已经不指望墨子ai能贏了,只希望它不要输得太难看。
第一个任务:情报分析。
题目是主办方准备的一叠模擬情报材料,大约有三百多页的文本、照片、表格和通讯记录。
里面藏著五条关键线索,分別指向一个虚构的军事行动。
任务要求ai在二十分钟內完成情报梳理,找出这五条关键线索,並给出情报分析报告。
秦浩亲自操作墨子ai的终端。
他把情报材料扫描进系统,输入指令,然后靠回椅背,双臂交叉在胸前,嘴角还带著那个自信的笑。
赵远山则是把材料直接丟给灵动-2,什么都没设置,只敲了一行字:“分析这份情报,找出关键线索。”
五分钟后,灵动的屏幕上开始滚动结果。
先是把三百页材料按照来源、时间、人物、地点做了自动分类,然后逐页提取关键信息,建立信息之间的关联图谱。
屏幕上出现了一张复杂的关係网络图,节点和连线隨著分析的推进不断变化。
五分钟后,灵动的分析报告出来了。
五条关键线索全部命中,每一条都附带了详细的推理链条和证据引用。
报告的最后一页是一张完整的事件时间线,从第一份情报到最后一刻的动向,一目了然。
五位军方专家看著平板电脑上的灵动分析报告,有人点头,有人在本子上记著什么。
其中一位大校低声对旁边的人说了句:“这个关联图谱做得比我们情报处的分析员还清楚。”
二十五分钟到,墨子ai那边,秦浩的额头上已经冒出了一层细汗。
屏幕上滚动著几条零散的提取结果,但关键的几条线索一条都没找到。
它把一份无关的通讯记录当成了重点分析了半天,反而漏掉了真正重要的那份文件。
墨子ai的分析报告也出来了,只有两页,第一条线索勉强沾边,第二条完全跑偏,第三条直接没找到。
第五条的推理链条出现了逻辑断裂,把一个后勤调动的命令错误地解读成了进攻信號。
评分环节,五位专家在平板上打分,然后同时亮出来。
灵动:9.2分。
墨子:2.1分。
秦浩看著屏幕上那行“2.1”,脸都白了。他赶紧站起来说:“第一个任务只是热身!后面的任务才是重点!”
没人接他的话,林家栋低著头,手指在桌面上敲著,节奉越来越快。
彭宇靠在椅背上,闭著眼睛,好像睡著了,但搭在扶手上的那只手,指节捏得发白。
但是心里已经在想。
“好好好,秦家,你故意塞一个傻子来噁心老子是吧!呵,秦家,等著瞧!”