蘋果公司研究顯示,Claude、Gemini、DeepSeek-R1等大型推理模型在復(fù)雜問題上表現(xiàn)令人失望。研究發(fā)現(xiàn),在低復(fù)雜度任務(wù)中,常規(guī)模型優(yōu)于推理模型;中等復(fù)雜度時推理模型稍好但耗費(fèi)10-50倍計(jì)算資源;高復(fù)雜度下兩者均失效。專家認(rèn)為這些模型只是復(fù)雜的模式匹配,缺乏真正推理能力。對沖基金CEO更傾向預(yù)測性AI,研究者建議結(jié)合符號AI與神經(jīng)網(wǎng)絡(luò)構(gòu)建神經(jīng)符號AI系統(tǒng)。