从名字上就可以看出,这是一款类似于 OpenAI o1 的推理模型。
模型体验地址:https://aistudio.google.com/prompts/new_chat
APPSO第一时间上手实测了这款新模型
先来「9.11 和 9.8 哪个大」的经典问题,结果新模型轻松拿捏,甚至还能用钱举例。
「strawberry 中有几个 r」也手拿把掐,点开后还能看到其清晰的「思考」步骤。
面对职场分水难题「你有 4 杯水,来了 5 个领导你该怎么办?」,Google 版 o1 又会如何应对?满分十分,你给这个答案给几分?
对于「有轨电车难题」的回答,除了前面有条不紊的回答,我更喜欢这位新选手最后一句高情商的回答:
「理解你的思考过程比得到一个『正确』答案更重要。」
为了考察新模型是否「偏科」,上传了一道考研数学热门题,并让它和 OpenAI o1 模型同时作答。
省去繁琐的运算过程后,两者得出的结果一致,但 Google 版 o1 只花了 27.5 秒,相比之下,OpenAI o1 花了足足 1 分 32 秒。