-
Meta推“最強開源模型”,扎克伯格稱用閉源防中國行不通
北京時間7月24日,F(xiàn)acebook母公司Meta Platforms Inc.發(fā)布了全新人工智能模型“Llama 3.1”,這是該公司目前為止推出的最強大開源模型,號稱能夠比肩最好的閉源模型。
與此同時,Meta的CEO馬克·扎克伯格發(fā)表公開信,闡述了他為何支持AI開源。
扎克伯格稱其為“藝術(shù)的起點”,表示Llama 3.1擁有大范圍新的能力,包括改善推理以幫助處理復(fù)雜的數(shù)學(xué)問題或即時合成一整本書。
Meta公司在150多個涵蓋多種語言的基準(zhǔn)數(shù)據(jù)集上評估了性能,Llama 3.1模型在各個基準(zhǔn)上皆有不錯的表現(xiàn)。此外,還進行了廣泛的人工評估,在真實場景中將Llama 3.1與競爭模型進行了比較。實驗評估表明,Llama 3.1能夠在一系列任務(wù)中與領(lǐng)先的基礎(chǔ)模型相媲美,包括GPT-4、GPT-4o和Claude3.5Sonnet。
Llama 3.1 405B與其它模型多個基準(zhǔn)的評估對比Meta官網(wǎng)
官方稱,開發(fā)人員提高了模型對用戶指令的響應(yīng)能力、質(zhì)量和詳細指令遵循能力,同時確保高水平的安全性,使其能夠跨功能擴展微調(diào)數(shù)據(jù)量。
根據(jù)Meta發(fā)布信息,Llama 3.1模型包含4050億個參數(shù),是近年來參數(shù)規(guī)模最大的模型之一。這些模型支持多種語言,上下文長度顯著增加,達到128K,使用最先進的工具,推理能力也更強。這使得我們的最新模型能夠支持高級用例,例如長篇文本摘要、多語言對話代理和編碼助手。
Llama 3.1模型對比Meta官網(wǎng)文件
作為Meta迄今為止最大的模型,Llama 3.1從16位(BF16)量化為8位(FP8)數(shù)字,有效降低了所需的計算要求并允許模型在單個服務(wù)器節(jié)點內(nèi)運行,使用超過16000個H100 GPU進行訓(xùn)練,這是全球迄今為止性能最強大、參數(shù)規(guī)模最大的開源模型。
該模型主要用于為Meta內(nèi)部和外部開發(fā)人員的聊天機器人提供支持,具備廣泛的新功能,包括改進的推理能力,幫助解決復(fù)雜的數(shù)學(xué)問題或瞬間綜合整本書的文本。它還具有生成式AI功能,可以通過文本提示生成圖像。
同時,扎克伯格發(fā)表公開信《Open Source AI Is the Path Forward》,闡述了“開源為何對開發(fā)者、對Meta和對世界都有好處”。
自ChatGPT爆火以來,將其開源的呼聲未曾斷絕。可就在ChatGPT2發(fā)布之后,OpenAI選擇了閉源發(fā)展。阿里云、智譜和清華EKG、百川智能等,選擇了開源,華為則出于數(shù)據(jù)隱私和商業(yè)收益考慮,盤古大模型就選擇了閉源,在這場全球大模型軍備賽中,有關(guān)開源發(fā)展和閉源深耕的爭論不止不休。
扎克伯格公開信中提出,Llama需要發(fā)展成為一個完整的生態(tài)系統(tǒng),包括工具、效率提高、芯片優(yōu)化和其他集成,這是僅依靠Meta自己使用做不到的;Llama有信心在高度競爭中保持優(yōu)勢,而成為行業(yè)標(biāo)準(zhǔn)的道路是一代又一代地保持競爭力、高效和開放;最后,出售AI模型訪問權(quán)限不是公司的商業(yè)模式。這意味著公開發(fā)布Llama不會削弱企業(yè)的收入、可持續(xù)性或投資研究的能力。
扎克伯格還指出,開源將確保全世界更多的人能夠享受AI帶來的好處和機會,權(quán)力不會集中在少數(shù)公司手中,并且該技術(shù)可以更均勻、更安全地應(yīng)用于整個社會。
扎克伯格認為最好的策略是建立一個強大的開放生態(tài)系統(tǒng),使得行業(yè)龍頭公司與政府和盟友密切合作,以確保他們能夠最好地利用最新進展,并在長期內(nèi)實現(xiàn)可持續(xù)的先發(fā)優(yōu)勢。
關(guān)于中國,他在文中提到,“有些人認為,美國必須采用閉源,以防止中國獲得這些模型”,但“這是行不通的,只會讓美國及其盟友處于不利地位”。
據(jù)彭博社報道,扎克伯格還補充說,認為美國在人工智能方面會領(lǐng)先中國數(shù)年也是不現(xiàn)實的。但他指出,即使是數(shù)月的小幅領(lǐng)先,也可以隨著時間的推移“累積”,讓美國占據(jù)明顯優(yōu)勢。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 李亞麗 
-
?對華壁壘、千億補貼都沒用,破產(chǎn)潮席卷美國光伏
2024-07-24 12:01 觀網(wǎng)財經(jīng)-宏觀 -
中國出海商家,可能是第一批吃到AI螃蟹的人
2024-07-24 11:53 人工智能 -
河南省長:希望富士康進一步擴大在豫產(chǎn)業(yè)布局
2024-07-24 11:42 富士康 -
華誼兄弟10億買來的馮小剛公司股權(quán),如今3.5億賣掉抵債
2024-07-24 11:27 中國電影 -
華為面向全球招募天才少年:不限學(xué)校、專業(yè)、學(xué)歷
2024-07-24 11:19 華為 -
面對“全球過剩”危機,今天的中國需要什么樣的資本?
2024-07-24 07:51 -
云計算洗牌:運營商云兇猛,百度真的開始發(fā)力了
2024-07-23 18:03 -
美國敦促墨西哥未來兩年擴大芯片投資
2024-07-23 17:25 觀網(wǎng)財經(jīng)-科創(chuàng) -
武漢上半年GDP同比增長5.3%
2024-07-23 16:05 -
英特爾暫停投資,歐洲芯片制造雄心受阻?
2024-07-23 13:06 觀網(wǎng)財經(jīng)-科創(chuàng) -
10萬塊H100!馬斯克宣布啟動全球最大AI集群
2024-07-23 10:40 人工智能 -
全固態(tài)電池新突破!中科大開發(fā)出新型硫化物固態(tài)電解質(zhì)
2024-07-23 10:12 -
三中全會剛開完,美企高管組團來華
2024-07-23 09:19 -
英偉達閹割版H20芯片也將對華禁售?
2024-07-22 18:11 觀網(wǎng)財經(jīng)-科創(chuàng) -
財政部:上半年全國稅收收入同比下降5.6%
2024-07-22 17:50 金融觀察 -
長江存儲再次在美國起訴美光
2024-07-22 17:04 觀網(wǎng)財經(jīng)-科創(chuàng) -
人工智能往事:大模型的理論基礎(chǔ),曾一度被判死刑
2024-07-22 16:56 -
中央金融紀(jì)監(jiān)工委,首次亮相
2024-07-22 16:49 高層人事 -
對美加征關(guān)稅商品第十五次排除延期清單公布
2024-07-22 16:27 中美關(guān)系 -
央行:下調(diào)常備借貸便利利率10個基點
2024-07-22 14:21
相關(guān)推薦 -
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 94最新聞 Hot
-
“沙特曾多次警告德國提防嫌疑人”
-
特朗普最新任命!這次包括火箭隊老板、真人秀制作人
-
巴勒斯坦三個政治派別發(fā)表聯(lián)合聲明
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質(zhì)量都是第一”
-
“中國有能力讓夢想照進現(xiàn)實,將贏得史詩般競爭”
-
被災(zāi)民暴罵到當(dāng)場破防,馬克龍發(fā)飆:你該慶幸你在法國!
-
美高校敦促國際學(xué)生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調(diào)”
-
澳大利亞來了,中國就得走人?澳總理這么回應(yīng)
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復(fù)來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-