-
斯坦福AI團隊被質(zhì)疑抄襲國產(chǎn)大模型
-
賀喜格hexige@guancha.cn 來撩
分享到:最后更新: 2024-06-03 18:02:51一個由斯坦福學(xué)生組成的AI團隊,近日被曝出了抄襲行為,疑似抄襲了中國的大模型成果。6月3日,團隊成員之一在社交媒體發(fā)文道歉,但在不久之后又刪除了博文。
5月29日,一個研究團隊發(fā)布了一個名為“Llama3-V”的模型,聲稱只需要500美元(約合人民幣3625元)就能訓(xùn)練出一個SOTA(State of the Art,即最先進的)多模態(tài)大模型,效果比肩 GPT4-V、Gemini Ultra 、 Claude Opus ,但模型小100倍。
公開信息顯示,Llama3-V團隊的其中兩位作者 Siddharth Sharma 與 Aksh Garg 是斯坦福大學(xué)計算機系的本科生,曾發(fā)表過數(shù)篇機器學(xué)習(xí)相關(guān)的論文。名校背景,特斯拉、SpaceX等大廠經(jīng)歷的成員,再加上號稱足以“改變現(xiàn)狀”的研究成果,Llama3-V受到了相當(dāng)程度的關(guān)注。Llama3-V不僅在社交媒體上迅速躥紅,還一度沖上了HuggingFace趨勢榜首頁(機器學(xué)習(xí)領(lǐng)域中較有影響力的平臺,其趨勢榜一定程度反映出模型的流行度)。
但很快,便出現(xiàn)了對Llama3-V的質(zhì)疑。有網(wǎng)友爆料Llama3-V套殼國內(nèi)大模型初創(chuàng)企業(yè)“面壁智能”和清華大學(xué)自然語言處理實驗室聯(lián)合推出的MiniCPM-Llama3-V 2.5,并在面壁智能GitHub的項目下放出了證據(jù)。
這些證據(jù)包括:Llama3-V的模型架構(gòu)和代碼與MiniCPM-Llama3-V 2.5幾乎完全相同,僅有一些變量名和格式化的差異;Llama3-V使用了MiniCPM-Llama3-V 2.5的分詞器(tokenizer),并且連同MiniCPM-Llama3-V 2.5定義的特殊符號也出現(xiàn)在了Llama3-V中;將從HuggingFace下載的Llama3-V模型權(quán)重中的變量名改成MiniCPM-Llama3-V 2.5的,模型可以用MiniCPM-V代碼成功運行。
兩個模型的代碼對比
網(wǎng)友為什么不直接質(zhì)疑Llama3-V,而是在面壁智能GitHub的項目下進行爆料?事實上,網(wǎng)友此前于6月2日在Llama3-V頁面上提出的質(zhì)疑,不過很快便被Llama3-V的作者已經(jīng)刪除了。
在MiniCPM-Llama3-V 2.5團隊收到提醒后也迅速作出反應(yīng),于是一個新的證據(jù)出現(xiàn)。Llama3-V模型居然可以識別“清華簡”。
公開資料顯示,清華簡是清華大學(xué)于2008年7月收藏的一批戰(zhàn)國竹簡,為戰(zhàn)國中晚期文物。MiniCPM-Llama3-V 2.5團隊透露,識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能,訓(xùn)練圖像是最近從出土文物中掃描并由MiniCPM-Llama3-V 2.5團隊標(biāo)注,且尚未公開發(fā)布。
而兩個模型在識別的表現(xiàn)上,正確的結(jié)果上基本一致,錯誤的情況也頗為相似。
識別結(jié)果對比
鑒于這些結(jié)果,MiniCPM-Llama3-V 2.5團隊表示,很難用巧合來解釋這種不尋常的相似性,希望Llama3-V的作者能夠?qū)@個問題給出官方解釋。相信這對開源社區(qū)的共同利益很重要。
而在受到質(zhì)疑后,目前Llama3-V 的 GitHub 項目主頁已顯示為“404”,HuggingFace上Llama3-V項目也已經(jīng)不可見,在作者社交媒體賬號上也找不到此前宣傳 Llama3-V 的內(nèi)容。
6月3日,Llama3-V團隊成員Aksh Garg在社交媒體上發(fā)文回應(yīng)了質(zhì)疑。但隨后不久這條回應(yīng)便被刪除。
網(wǎng)友截圖,目前這條動態(tài)已不可見
另據(jù)媒體消息,面壁智能CEO李大海也對此做出回應(yīng),他表示,“技術(shù)創(chuàng)新不易,每一項工作都是團隊夜以繼日的奮斗結(jié)果,也是以有限算力對全世界技術(shù)進步與創(chuàng)新發(fā)展作出的真誠奉獻。 我們希望團隊的好工作被更多人關(guān)注與認可,但不是以這種方式。我們對這件事深表遺憾!一方面感概這也是一種受到國際團隊認可的方式,另一方面也呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境。一起加油合作,讓世界因AGI的到來變得更好!”
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
標(biāo)簽 AI大模型- 責(zé)任編輯: 賀喜格
-
“國產(chǎn)手機芯”新融資超40億,京滬國資參投
2024-06-03 13:44 觀網(wǎng)財經(jīng)-科創(chuàng) -
央行今日進行20億元7天期逆回購操作,本周6140億逆回購到期
2024-06-03 12:49 產(chǎn)業(yè)萬象 -
業(yè)界預(yù)計5月份新增信貸環(huán)比增長,社融增量有望達2.3萬億元
2024-06-03 12:36 觀網(wǎng)財經(jīng)-金融 -
央行批準(zhǔn)31家支付機構(gòu)更名
2024-06-03 12:36 觀網(wǎng)財經(jīng)-金融 -
一季度商業(yè)銀行凈息差降至1.54%,多家大行低于行業(yè)均值
2024-06-03 12:14 產(chǎn)業(yè)萬象 -
蘇州:全市范圍內(nèi)不再審核購房資格
2024-06-02 14:56 觀網(wǎng)財經(jīng)-房產(chǎn) -
首單人民幣跨境結(jié)算國產(chǎn)飛機ARJ21抵達印尼
2024-06-01 15:12 中國大飛機 -
蘋果大降價反擊華為,奏效了?
2024-05-31 19:07 觀網(wǎng)財經(jīng)-科創(chuàng) -
騰訊今年的第一個大爆款?機構(gòu)稱DNF手游首周吸金超10億
2024-05-31 19:01 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
取消預(yù)售制以后,今年618電商平臺們都“卷”什么?
2024-05-31 18:06 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
證監(jiān)會:對恒大地產(chǎn)罰款41.75億,對許家印頂格罰款4700萬
2024-05-31 16:41 大公司 -
開發(fā)“美國版本”算法?TikTok回應(yīng)
2024-05-31 10:55 觀網(wǎng)財經(jīng)-海外 -
5月制造業(yè)PMI為49.5% ,比上月下降0.9個百分點
2024-05-31 10:03 觀網(wǎng)財經(jīng)-宏觀 -
用尼康相機拍的照片宣傳自家產(chǎn)品?松下承認造假并致歉
2024-05-30 17:35 觀網(wǎng)財經(jīng)-海外 -
被洋品牌主導(dǎo)的寵糧市場,中國人到底多掏了多少錢?
2024-05-30 16:49 觀網(wǎng)財經(jīng)-消費 -
-
價格卷無可卷,百度大模型開始卷場景
2024-05-30 13:43 -
日均單量創(chuàng)新高,滴滴一季度收入同比增長14.9%
2024-05-30 12:38 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
中國“蘋果稅”反壟斷第一案消費者敗訴
2024-05-30 08:49 蘋果新“品” -
監(jiān)管發(fā)威!今年已有100只A股被實施風(fēng)險警示
2024-05-30 07:56 股市
相關(guān)推薦 -
-
“中國正投入萬億美元,我們卻在這胡搞” 評論 133這場貿(mào)易戰(zhàn),美國就是個“紙老虎” 評論 114最新聞 Hot
-
“五角大樓里完全崩潰了”,3名美國防部高官被解雇
-
“趁納瓦羅不在,他們沖進白宮勸說特朗普暫停關(guān)稅”
-
澤連斯基回應(yīng):?;?0小時太短,建議30天
-
韓國一戰(zhàn)機飛行訓(xùn)練中掉落機炮吊艙和空油箱
-
“美國在地球上跟中國爭,卻把太空主導(dǎo)地位拱手讓出”
-
內(nèi)塔尼亞胡:摧毀哈馬斯前不會結(jié)束軍事行動
-
超900人簽署“反關(guān)稅宣言”,包括兩位諾貝爾獎獲得者
-
“中國正投入萬億美元,我們卻在這胡搞”
-
真急了!“白宮擬成立涉華關(guān)稅應(yīng)急工作組”
-
黃仁勛訪華盼繼續(xù)合作,特朗普回應(yīng)
-
中國男子在TikTok“神評”美國關(guān)稅,米爾斯海默秒答:贊同
-
“內(nèi)地電影票房過億那一刻,香港電影就被顛覆了”
-
美國稅局代理局長剛上任三天就被免,“貝森特抱怨他是馬斯克的人”
-
特朗普也直說了:不行,就放棄
-
“中國深知‘廣場協(xié)議’是致命的,特朗普別想了”
-
“中國稀土,關(guān)乎美國人生死”
-