馬斯克的Grok3翻車了!竟答不對(duì)9.11和9.9哪個(gè)大

時(shí)間：2025/02/19 16:44:17 編輯：川崎伊俊

北京時(shí)間2月18日，馬斯克與xAI團(tuán)隊(duì)在直播中正式發(fā)布了Grok最新版本Grok3。早在本次發(fā)布會(huì)之前，依靠著種種相關(guān)信息的拋出，加上馬斯克本人24/7不間斷的預(yù)熱炒作，讓全球?qū)rok3的期待值被拉到了空前的程度。

在一周前，馬斯克在直播中評(píng)論DeepSeek R1時(shí)，還信心滿滿地表示「xAI即將推出更優(yōu)秀的AI模型」。從現(xiàn)場(chǎng)展示的數(shù)據(jù)來(lái)看，Grok3在數(shù)學(xué)、科學(xué)與編程的基準(zhǔn)測(cè)試上已經(jīng)超越了目前所有的主流模型，馬斯克甚至宣稱Grok 3未來(lái)將用于SpaceX火星任務(wù)計(jì)算，并預(yù)測(cè)「三年內(nèi)將實(shí)現(xiàn)諾貝爾獎(jiǎng)級(jí)別突破」。

但這些目前都只是馬斯克的一家之言。筆者在發(fā)布后，就測(cè)試了最新的Beta版Grok3，并提出了那個(gè)經(jīng)典的用來(lái)刁難大模型的問(wèn)題：「9.11與9.9哪個(gè)大？」遺憾的是，在不加任何定語(yǔ)以及標(biāo)注的情況下，號(hào)稱目前最聰明的Grok3，仍然無(wú)法正確回答這個(gè)問(wèn)題。

在這個(gè)測(cè)試發(fā)出之后，很短的時(shí)間內(nèi)迅速引發(fā)了不少朋友的關(guān)注，無(wú)獨(dú)有偶，在海外也有很多類似問(wèn)題的測(cè)試，例如「比薩斜塔上兩個(gè)球哪個(gè)先落下」這些基礎(chǔ)物理/數(shù)學(xué)問(wèn)題，Grok3也被發(fā)現(xiàn)仍然無(wú)法應(yīng)對(duì)。因此被戲稱為「天才不愿意回答簡(jiǎn)單問(wèn)題」。

除了網(wǎng)友自發(fā)測(cè)試的這些基礎(chǔ)知識(shí)上Grok3出現(xiàn)了翻車，在xAI發(fā)布會(huì)直播中，馬斯克演示使用Grok3來(lái)分析他號(hào)稱經(jīng)常玩的Path of Exile 2 (流放之路2)對(duì)應(yīng)的職業(yè)與升華效果，但實(shí)際上Grok3給出的對(duì)應(yīng)答案絕大部分都是錯(cuò)誤的。直播中的馬斯克并沒(méi)有看出這個(gè)明顯的問(wèn)題。

這一事件迅速引發(fā)了社會(huì)各界的廣泛關(guān)注和討論。Grok3的翻車并非偶然。從發(fā)布會(huì)現(xiàn)場(chǎng)及后續(xù)實(shí)測(cè)來(lái)看，該模型在數(shù)學(xué)、科學(xué)與編程等基準(zhǔn)測(cè)試上雖然表現(xiàn)出色，但在處理常識(shí)性問(wèn)題時(shí)卻顯得力不從心。這不僅讓人質(zhì)疑其人類級(jí)推理能力」的真實(shí)性，更暴露出當(dāng)前AI技術(shù)在常識(shí)判斷上的巨大缺陷。馬斯克在發(fā)布會(huì)上曾信心滿滿地表示，Grok3未來(lái)將用于SpaceX火星任務(wù)計(jì)算，并預(yù)測(cè)三年內(nèi)將實(shí)現(xiàn)諾貝爾獎(jiǎng)級(jí)別突破」。然而，連簡(jiǎn)單的數(shù)字大小判斷都出錯(cuò)，這樣的AI如何能讓人放心地將其應(yīng)用于復(fù)雜的航天計(jì)算任務(wù)中？

從技術(shù)層面分析，Grok3的翻車主要源于其訓(xùn)練數(shù)據(jù)和算法設(shè)計(jì)。Grok-3在數(shù)學(xué)、科學(xué)與編程的基準(zhǔn)測(cè)試上已經(jīng)超越了目前所有的主流模型，但常識(shí)依舊很難。xAI透露，Grok-3的開(kāi)發(fā)得益于用8個(gè)月時(shí)間建成的Colossus超級(jí)計(jì)算機(jī)，它由10萬(wàn)個(gè)英偉達(dá)的H100 GPU驅(qū)動(dòng)，為訓(xùn)練提供了2億個(gè)GPU小時(shí)。此外，xAI宣布推出名為Deepsearch的Grok-3智能搜索引擎。

這一事件再次提醒我們，盡管AI技術(shù)在某些領(lǐng)域取得了顯著進(jìn)展，但在常識(shí)判斷和人類級(jí)推理能力方面，仍存在明顯的不足。未來(lái)，AI技術(shù)的發(fā)展還需要在更多領(lǐng)域進(jìn)行深入探索和優(yōu)化，以實(shí)現(xiàn)更全面和智能的AI應(yīng)用。

上一個(gè)：《守望先鋒》國(guó)服震撼回歸！海量福利等你來(lái)拿
下一個(gè)：《哪吒之魔童鬧海》官方發(fā)文宣布：《哪吒2》延長(zhǎng)上映至3月30日。

相關(guān)資訊

馬斯克的Grok3翻車了!竟答不對(duì)9.11和9.9哪個(gè)大

瀏覽量：02025-02-19

相關(guān)游戲

欧美77_狠狠干网站_午夜亚洲影院_一级看片免费视频_日本欧美视频_性片久久

馬斯克的Grok3翻車了!竟答不對(duì)9.11和9.9哪個(gè)大

馬斯克的Grok3翻車了!竟答不對(duì)9.11和9.9哪個(gè)大