咨詢熱線:021-80392549

谷歌發(fā)布最新人工智能模型Gemini 智力測試優(yōu)于“專家級”人類

放大字體  縮小字體 發(fā)布日期:2023-12-12     來源:科技日報     作者:張夢然     瀏覽次數(shù):95
 谷歌發(fā)布最新人工智能模型Gemini 智力測試優(yōu)于“專家級”人類

科技日報記者 張夢然

據(jù)《新科學(xué)家》雜志網(wǎng)站報道,谷歌公司6日宣布推出一種名為Gemini的新人工智能模型,聲稱該模型在一系列智力測試中的表現(xiàn)優(yōu)于OpenAI的GPT-4模型和“專家級”人類。

Gemini已針對不同的應(yīng)用創(chuàng)建了3個版本,分別是Nano、Pro和Ultra,它們的大小和功能均有所增加。谷歌拒絕回答有關(guān)Pro和Ultra的規(guī)模、它們包含的參數(shù)數(shù)量或訓(xùn)練數(shù)據(jù)的規(guī);騺碓吹葐栴}。

其最小版本Nano旨在在智能手機上本地運行,實際上有兩種模型:一種用于速度較慢的手機,擁有18億個參數(shù),另一種用于功能更強大的設(shè)備,擁有32.5億個參數(shù)。據(jù)傳GPT-4包含多達1.7萬億個參數(shù),而Meta的LLAMA-2則包含700億個參數(shù)。

谷歌聲稱,Gemini的中檔Pro版本擊敗了其他一些模型,例如OpenAI的GPT3.5,但更強大的Ultra超過了所有現(xiàn)有AI模型的能力。它在行業(yè)標(biāo)準(zhǔn)MMLU基準(zhǔn)上的得分為90%,而“專家級”的人類預(yù)計能達到89.8%。

這是人工智能首次在測試中擊敗人類,也是現(xiàn)有模型中得分最高的。該測試涉及一系列棘手的問題,主題包括邏輯謬誤、日常場景中的道德問題、醫(yī)療問題、經(jīng)濟和地理。

在同一測試中,GPT-4的得分為87%,LLAMA-2的得分為68%,Anthropic Claude 2的得分為78.5%。Gemini在其他9項常見基準(zhǔn)測試中的8項中擊敗了所有這些模型。

Pro模型將集成到谷歌今年3月推出的在線聊天機器人Bard中。該公司表示,名為Bard Advanced的新版本將于明年初推出,并配備更大的Gemini Ultra模型。

谷歌“深度思維”的艾力·柯林斯表示,Gemini是該公司最大、能力最強的模型,但也是最通用的模型,這意味著它可適應(yīng)各種任務(wù)。與當(dāng)前許多專注于文本的模型不同,Gemini接受過文本、圖像和聲音方面的訓(xùn)練,據(jù)稱能接受所有這些格式的輸入并提供輸出。

柯林斯稱,Gemini“幾乎在每個領(lǐng)域都是最先進的”,并且仍在測試中,以確定它在不同媒體、語言和應(yīng)用程序中的工作能力。

在發(fā)布會上,Gemini沒有提高可供測試的版本,但谷歌展示了人工智能解決家庭作業(yè)問題和處理實時視頻輸入的演示。據(jù)稱,它比以前的模型更擅長開發(fā)軟件。去年,“深度思維”發(fā)布了一款名為AlphaCode的人工智能代碼生成器,它可擊敗50%的人類開發(fā)人員,新發(fā)布的Gemini聲稱可擊敗85%的人類編程師。

Gemini可處理文本、音頻和視頻。圖片來源:谷歌公司

工博士工業(yè)品商城聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點,也不代表本網(wǎng)站對其真實性負(fù)責(zé)。您若對該文章內(nèi)容有任何疑問或質(zhì)疑,請立即與商城(www.podvhdv.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
聯(lián)系電話:021-31666777
新聞、技術(shù)文章投稿QQ:3267146135  投稿郵箱:syy@gongboshi.com