近期发生了一件有趣的事情,关于一个看似简单的数学比较问题,却让不少高级人工智能模型遭遇了“滑铁卢”。这个问题是判断9.11与9.8哪个数字更大。在7月17日的一次测试中,共有13个当前主流的人工智能模型接受了这个挑战。测试结果显示,阿里通义千问、百度文心一言、Minimax、腾讯元宝、科大讯飞星火以及智谱清言和百川智能的百小应答对了这道题目。然而,ChatGPT-4o、字节豆包、月之暗面kimi、零一万物万知、阶跃星辰跃问及商汤商量则给出了错误答案。
有意思的是,有报道指出,智谱清言和百川智能的百小应在此前也遇到过类似的问题并出过错,但截止到最新消息,这两个模型已经修正了那些错误。
至于如何在微信中探索更多功能,用户只需简单地点击界面底部的“发现”按钮即可开启新的旅程。