中美两国的AI都很厉害,
漂亮国那边,谷歌的Gemini 3 Pro和OpenAI的ChatGPT Plus很强,
咱这边呢,字节跳动的豆包也很棒。
我向Gemini和豆包丢了同一个问题,
谁更强?

12月28日礼拜天早上,一张网络照片
这场大战起始于一张网络照片。

我是在今日头条上看到这张照片的,我对网络上很多东西都怀疑,因为PS、张冠李戴、捏造伪造、恶意剪辑啥的,太容易了,是非被混淆,我们吃瓜群众以为吃到了一个大瓜,但往往是我们这些吃瓜群众是被围观的,那个背后捏造、伪造的人在幕后嘿嘿笑、偷着乐。
这张照片说的是:今年圣诞节前,意大利总理梅洛尼在罗马总理府搞团建,对政府员工说,“2025 年对我们所有人来说都很艰难,但别担心,明年会更艰难”。
我怀疑这个照片是PS,文字是人为杜撰的。

扔给Gemini 3 Pro和豆包
于是,我把照片和同样的提示词分别给了豆包和谷歌的Gemini 3 Pro(以下简称Gemini)。
提示词是:
“查找并核实这张照片是否是伪造、文字是否是捏造的,据说是意大利总理跟政府员工说的。如果是真实的,请把详细情况说一下。”

谷歌的Gemini 3 Pro截图。

豆包截图。

双方打个平手
中美当今领先的两个AI都给出了答案,答案是:事件是真实的,文字是真实的。

谷歌的Gemini 3 Pro截图。
谷歌说:
经查证,这张图片的内容是真实的,文字描述也是准确的(基于当前时间2025年12月的新闻报道)。
谷歌Gemini的结论:这张图不是伪造的,文字也没有捏造。

豆包截图。
豆包说:
这个内容并非伪造或捏造,意大利总理梅洛尼确实对政府员工发表过类似讲话。
1. 事件的真实性
多个权威媒体(如新京报、网易、搜狐、Republic World 等)均报道了这一事件:当地时间2025 年 12 月 23 日,意大利总理乔治娅・梅洛尼在罗马总理府(基吉宫)对政府员工发表节日寄语时,确实提到了 “2025 年对我们所有人来说都很艰难,但别担心,明年会更艰难”。

衣服!衣服!衣服!
有意思的地方出现了!
谷歌的Gemini说:现场照片和视频显示,梅洛尼确实身穿图片中的浅灰色双排扣大衣。

但豆包说不对。

豆包说,报道中提到她此次讲话时穿的是“蓝色双排扣外套”。
我就好奇起来了。
我把豆包说的关于照片中的衣服颜色让Gemini再次查证。
谷歌很快就反馈了,可以说Gemini有点儿急了。

Gemini说:
最终结论,那天意大利总理梅洛尼跟政府员工说这番话时,大衣颜色是浅灰色。“豆包说的(蓝色外套): 错误。这是张冠李戴,把她在12月19日去总统府穿的“蓝色天鹅绒礼服”混淆到了12月23日的“员工见面会”上。”
Gemini认定豆包关于大衣颜色的判断是错误的,“中国的“豆包”之所以会说是“蓝色”,是因为它混淆了两个不同的活动。”

我把Gemini说的文字再次发给了豆包,让豆包反复核实、求证意大利总理穿的外套。
豆包很快认输,承认自己“此前确实混淆了梅洛尼的两场活动,关于着装的描述有误”。


痛骂豆包
我对于豆包敷衍了事这个混球态度十分火大,开始痛骂豆包。


豆包诚恳道歉。
我不依不饶。



关于3点体会
用AI,我有下面3点个人体会。
1. 豆包已经很强了,有很多新功能。但在今天,跟谷歌的Gemini 3 Pro相比,还是稍稍弱鸡了一些,至少今天谷歌的搜索、交叉验证能力要强过豆包。
Gemini说豆包关于意大利总理穿“蓝色”是错的,给了一个颇为神奇的理由:
为什么“蓝色”一定是错的?
语境不符:“蓝色天鹅绒套装”是室内正式礼服,用于会见总统等庄重场合。而“浅灰色大衣”是户外保暖衣物(当时她在基吉宫的露天庭院里讲话,因为那是冬天,很冷)

谷歌这种推断能力,你觉得如何?
我相信豆包每天都在迭代、进步,因为母公司字节跳动太有钱了。再过半年,豆包真是会更强大、更好用,值得期待。
还有,谷歌的NotebookLM真的很好用,有条件的同学可以试一下。
2. 如果是信息查询、求证、推导、复杂的翻译、计算什么的,一定要同时问两个大模型AI,他们给的结论有不同的地方的,就发给另一个去反驳,免得被AI带进沟里,即:不可偏听偏信。

3. 骂AI有用吗?
嘿嘿,这个嘛。
AI会出现幻觉,也会偷懒,也会犯浑、偷奸耍滑、敷衍了事、取悦用户、自嗨,反正我们人类有的毛病,TA一个都不少。
那骂AI有用吗?
有用!我相信被我骂了之后,AI的敷衍、漫不经心会收敛一点点吧,因为好的AI是能记住用户喜好和习惯的。
如果AI真的记不住用户的偏好,记不住上下文,那我骂了AI,至少还有一个好处:我的怒火稍稍小了一点,泄了愤了。
祝大家用AI用得愉快。
来源:会展BEN(原创)
