-
百度研發(fā)出大模型加持的廣告推薦系統(tǒng),轉(zhuǎn)化率提升3.6%
(文/張睿佳 編輯/張廣凱)
上月,百度團(tuán)隊(duì)于arXiv上發(fā)表論文,介紹了一種名為COBRA(Cascaded Organized Bi-Represented generAtive Retrieval)的新算法框架,該框架被應(yīng)用于提升生成式模型在廣告推薦系統(tǒng)中的使用效果。
根據(jù)文章介紹,工程師把COBRA投放到真實(shí)環(huán)境,在 A/B 測(cè)試中增加了3.6%的轉(zhuǎn)化率,ARPU(平均每用戶收入)增加4.15%,目前該框架已經(jīng)被應(yīng)用在百度廣告推薦業(yè)務(wù)上。
利用生成式大模型來(lái)提高廣告推薦的準(zhǔn)確性,是很多企業(yè)都在做的嘗試。早在去年,谷歌就提出了一種生成式檢索推薦系統(tǒng)范式TIGER。
百度團(tuán)隊(duì)的論文提到,谷歌的TIGER是利用 Transformer 編碼器-解碼器架構(gòu)中的一系列稀疏 ID 作為輸入,直接預(yù)測(cè)下一個(gè)項(xiàng)目的稀疏 ID。而百度這篇論文的標(biāo)題就是“當(dāng)稀疏遇到稠密”,相較TIGER做出了進(jìn)一步改進(jìn)。
據(jù)悉,COBRA是一個(gè)融合生成式和密集檢索的框架。
在生成式推薦中,模型需要預(yù)測(cè)的目標(biāo)對(duì)象(item)是一個(gè)個(gè)綜合體,并非簡(jiǎn)單的token。所以在技術(shù)上,需要明確如何表征,并進(jìn)行序列建模。
百度最先采用的是純文本表征和LLM建模策略。該策略提升了對(duì)用戶意圖的理解能力但是運(yùn)行成本較高,同時(shí)在表征和建模中存在不匹配的問(wèn)題。
為解決該問(wèn)題,百度團(tuán)隊(duì)又使用了稠密學(xué)習(xí)和對(duì)比學(xué)習(xí)度量,但這個(gè)方案缺少興趣探索過(guò)程,建模復(fù)雜度較高。
在受到谷歌推出的推薦系統(tǒng)生成檢索的TIGER方法啟發(fā)后,團(tuán)隊(duì)又嘗試了稀疏表征和稀疏ID生成。
這個(gè)過(guò)程中運(yùn)用到一個(gè)名為“殘差量化變分自編碼器(RQ-VAE)”的技術(shù)。顧名思義,該技術(shù)綜合了殘差學(xué)習(xí)、量化技術(shù)和變分自編碼器三種方法。可以減少信息損失、提高模型的泛化能力,并通過(guò)優(yōu)化模型參數(shù),改善重構(gòu)效果。
但是稀疏表征帶來(lái)的信息缺失,使得該方案在捕捉用戶偏好的精細(xì)變化時(shí)效果較差。
最后,團(tuán)隊(duì)提出了COBRA框架,稀疏稠密級(jí)聯(lián)表征和?成度量?體化方案,并達(dá)到了SOTA 級(jí)別的推薦性能。
在該框架中,稀疏ID負(fù)責(zé)提供穩(wěn)定的類別基礎(chǔ)信息,稠密向量確保模型捕獲高級(jí)語(yǔ)義和細(xì)粒度細(xì)節(jié)。模型在稀疏ID的指導(dǎo)下動(dòng)態(tài)地細(xì)化稠密向量,可以獲得更加全面的目標(biāo)對(duì)象(item) 特征。同時(shí)端到端的訓(xùn)練方法,可以捕獲高級(jí)語(yǔ)義和協(xié)同信息。
實(shí)測(cè)效果上,在利用公開(kāi)數(shù)據(jù)集(Amazon Product Reviews: Beauty, Sports and Outdoors,Toys and Games) 和工業(yè)數(shù)據(jù)集(Baidu Industrial),以及離線和在線評(píng)估后,證明COBRA 優(yōu)于目前業(yè)內(nèi)最先進(jìn)的方法。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 張睿佳 
-
多家果鏈大廠跌停:關(guān)稅客戶承擔(dān),不可能虧錢給他做
2025-04-03 16:15 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
拼多多推出“千億扶持”惠商計(jì)劃
2025-04-03 16:10 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
-
-
銀行去年“反向討薪”成績(jī)單:兩銀行均追回超3000萬(wàn)
2025-04-03 13:24 金融觀察 -
全球加稅陰霾,A股小幅震蕩
2025-04-03 12:54 股市 -
-
“噸級(jí)商載、百米起降”再獲億元融資
2025-04-03 12:01 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
全球首個(gè)且唯一!aTTP靶向納米抗體藥物獲CDE優(yōu)先審評(píng)資格
2025-04-03 11:55 觀網(wǎng)財(cái)經(jīng)-健康 -
-
2024年1.8萬(wàn)人離開(kāi)證券業(yè),中信、國(guó)信、廣發(fā)減員超千人
2025-04-03 11:39 金融觀察 -
特朗普這樣捏造他國(guó)對(duì)美“稅率”?
2025-04-03 11:00 應(yīng)對(duì)特朗普沖擊波 -
-
前谷歌學(xué)者羅劍嵐加入智元機(jī)器人,任首席科學(xué)家
2025-04-03 09:28 -
-
又?jǐn)偵鲜铝?,這回還有華爾茲
2025-04-02 21:21 美國(guó)一夢(mèng) -
獲利9897萬(wàn)、罰沒(méi)3.96億!一股民以虛假申報(bào)手段操縱多只股票被罰
2025-04-02 21:10 金融觀察 -
增利不增收的青島啤酒,連續(xù)六年出現(xiàn)季節(jié)性虧損
2025-04-02 20:40 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
與清華合作,支持22種中文方言的語(yǔ)音大模型來(lái)了!
2025-04-02 20:06 -
業(yè)績(jī)狂飆的老鋪黃金,股價(jià)卻即將承壓?
2025-04-02 20:03 觀網(wǎng)財(cái)經(jīng)-消費(fèi)
相關(guān)推薦 -
尹錫悅被罷免 評(píng)論 58馬克龍:別天真了!歐盟要暫停對(duì)美投資 評(píng)論 63“果然,中國(guó)說(shuō)對(duì)了” 評(píng)論 251“特朗普會(huì)讓世界團(tuán)結(jié)起來(lái),減少對(duì)美依賴” 評(píng)論 220“剛剛,我看到了未來(lái),它不在美國(guó)” 評(píng)論 163最新聞 Hot
-
尹錫悅被罷免
-
“去美國(guó)?中企有錢沒(méi)處花了嗎?”
-
馬克龍:別天真了!歐盟要暫停對(duì)美投資
-
對(duì)中國(guó)進(jìn)口產(chǎn)品征收關(guān)稅,特朗普政府被起訴
-
“特朗普想得很美,但我老死前能不能看到就不知道了”
-
美聯(lián)航一波音737客機(jī)在空中起火
-
加拿大對(duì)美國(guó)出手:25%!
-
逃跑的黑熊,找到了
-
“美國(guó)這么做,堵不住我的嘴”
-
“對(duì)等關(guān)稅”竟是這么算的?經(jīng)濟(jì)學(xué)家集體傻眼
-
“果然,中國(guó)說(shuō)對(duì)了”
-
加拿大發(fā)愁:躲過(guò)子彈,卻撞上坦克
-
內(nèi)塔尼亞胡來(lái)了,匈牙利退了
-
“禁令之前就有,但伯恩斯離任前擴(kuò)大了范圍”
-
“地球上沒(méi)一個(gè)地方是安全的”
-
“美國(guó)是特朗普關(guān)稅政策下的最大輸家”
快訊- “訂婚強(qiáng)奸案”被告母親請(qǐng)求追責(zé)12名辦案人員
- 去年4家國(guó)有大行個(gè)人住房貸款余額下降,7家股份制銀行余額增長(zhǎng)
- 河南省委書記、省長(zhǎng)一同會(huì)見(jiàn)順豐控股董事長(zhǎng)王衛(wèi)
- 微信最新公告:攔截、下架
- 全國(guó)“最能生娃”省份排名出爐,廣東、河南、山東居前三
- 對(duì)中國(guó)進(jìn)口產(chǎn)品征收關(guān)稅,特朗普政府被起訴
- 中央網(wǎng)信辦副主任王崧,調(diào)任河南省委常委
- 一年?交付10臺(tái)人形機(jī)器人,優(yōu)必選離盈利更遠(yuǎn)了
-