12月20日消息,近日,有媒體報(bào)道,以色列特拉維夫大學(xué)的一項(xiàng)研究表明AI已有數(shù)字癡呆癥。
在這項(xiàng)研究中,科學(xué)家測(cè)試了幾乎所有全球頂尖AI大型語(yǔ)言模型,結(jié)果都表現(xiàn)出類似于早期老年癡呆的認(rèn)知障礙,并且版本越老,表現(xiàn)就越差。
為了評(píng)估實(shí)驗(yàn)效果,科學(xué)家使用了經(jīng)常被用來(lái)測(cè)試?yán)夏臧V呆癥的蒙特利爾認(rèn)知評(píng)估量表,針對(duì)幾種公開(kāi)的領(lǐng)先大型語(yǔ)言模型進(jìn)行測(cè)試,包括ChatGPT的新老版本,Gemini新老版本等。設(shè)定的測(cè)試高分為30分,26分或以上被認(rèn)為是正常的。
實(shí)驗(yàn)結(jié)果顯示,只有GPT-4o在測(cè)試中獲得了高分26分,其次是GPT-4是25分,Gemini 1.0僅得16分。
研究還發(fā)現(xiàn)幾乎所有模型在視覺(jué)空間能力和執(zhí)行任務(wù)方面都表現(xiàn)不佳,無(wú)法表現(xiàn)出同理心或準(zhǔn)確解釋復(fù)雜的視覺(jué)場(chǎng)景。
科學(xué)家指出,所有大型語(yǔ)言模型在需要視覺(jué)抽象和執(zhí)行功能的任務(wù)中都一致失敗,這凸顯了一個(gè)可能阻礙其在臨床環(huán)境中使用的重要弱點(diǎn)。因此,他們做出了有數(shù)字癡呆的AI,不可能很快取代醫(yī)生的這一結(jié)論。
本文鏈接:http://www.zh1234.com/news43029.htmlAI也會(huì)得老年癡呆!新研究:AI版本越老越糊涂