-
機器學習并不“萬能”
關鍵字:“如果一個人可以在1秒以內(nèi)完成一項思維任務,那么可能在現(xiàn)在或者不久的將來,我們可以使用人工智能(AI)來自動化處理這項任務?!?
——吳恩達
本文讀者大多數(shù)比較熟悉機器學習,也會使用相關算法來根據(jù)數(shù)據(jù)對結(jié)果進行分類和預測。然而,很重要的一點,就是機器學習并不是解決一切問題的萬能鑰匙。機器學習如此有用,所以大家很難接受一個事實——有時候機器學習并不是一個問題的最佳解決方法。
這篇文章就是想告訴大家,機器學習有時候是好的解決方案,有時候則不是。
眾所周知,機器學習作為人工智能的一部分,在過去十年對世界產(chǎn)生了革命性的影響。信息爆炸引起了大數(shù)據(jù)的采集,尤其是像臉書、谷歌這樣的大公司。數(shù)據(jù)量加上處理器功耗和計算機并行處理的快速發(fā)展,使得大數(shù)據(jù)的獲取和學習變得相對容易。
今天,對機器學習和人工智能的吹捧無處不再。這可能是對的,因為這個領域的潛力是巨大的。人工智能公司數(shù)量在過去幾年里爆發(fā)式增加,根據(jù) Indeed 的一份報告,2015-2018 年,與人工智能相關的崗位數(shù)量增加了 100%。
截至2018年12月,福布斯發(fā)現(xiàn) 47% 的企業(yè)在其業(yè)務流程中包含至少一個人工智能功能。根據(jù) Deloitte 的報告,內(nèi)置 AI 和基于云的 AI 開發(fā)服務在企業(yè)軟件的滲透率估計分別達到 87% 和 83%。這些數(shù)據(jù)是非常驚人的——如果近期你想做些職業(yè)變動,人工智能看上去是個不錯的選擇。
一切看上去都挺美好的?公司滿意,想來消費者也是滿意的——否則企業(yè)是不會使用人工智能的。
這很好,因為我是機器學習和人工智能的超級粉絲。然而,有時候使用機器學習就沒什么必要,也說不通,甚至在操作的時候會給人帶來困難。
局限1——倫理
眾所周知,機器學習作為人工智能的一部分,在過去十年對世界產(chǎn)生了革命性的影響。信息爆炸引起了大數(shù)據(jù)的采集,尤其是像臉書、谷歌這樣的大公司。數(shù)據(jù)量加上處理器功耗和計算機并行處理的快速發(fā)展,使得大數(shù)據(jù)的獲取和學習變得相對容易。
不難理解為什么機器學習會對世界產(chǎn)生如此大的影響,不用再明確它的能力是什么,可能更重要的,是知道它的局限是什么。尤瓦爾·赫拉利創(chuàng)造了有名的“數(shù)據(jù)主義”一詞,指的是我們正在進入的一個假定的文明新階段,在這個階段里,我們對算法和數(shù)據(jù)的信任超過了對我們自身判斷和邏輯的信任。
雖然會覺得這個想法可笑,但你想想上次去旅行的時候,是不是跟著 GPS 的導航而不是自己看著地圖走——你質(zhì)疑過 GPS 的判斷嗎?人們盲目地跟隨 GPS 的指引,結(jié)果掉進了湖里...
信任數(shù)據(jù)和算法超過自身的判斷,有利有弊。顯然地,我們從算法中獲益,不然一開始也不會使用。算法通過可用數(shù)據(jù)作出預期判斷來實現(xiàn)自動化處理。雖然有時候,這意味著某個人的工作會被一種算法取代,產(chǎn)生一些倫理問題。加之,如果事情變得糟糕,我們應歸責于誰?
最近討論最廣泛的例子就是自動駕駛——我們應該如何選擇汽車在撞死人后應該作出的反應?未來我們在購買汽車的時候,也不得不選擇自己購買自動駕駛車輛的倫理框架嗎?
如果我的自動駕駛車在路上撞死了人,那么是誰的責任?
這些都是引人深思的問題,但并不是本文的主要目的。顯然,機器學習不能告訴我們應該接受什么規(guī)范價值,即在世界上特定的處境里,應該如何采取行動。就像大衛(wèi)·休謨著名諺語所說,一個人永遠不能從“本來如此”得出“應該如此”。
限制2——確定性問題
這是我個人必須面對的一個問題,因為我的專業(yè)領域是環(huán)境科學,它嚴重依賴于計算建模和使用傳感器/物聯(lián)網(wǎng)設備。
機器學習對于傳感器來說是非常強大的,當連接到其他測量環(huán)境變量(如溫度、壓力和濕度)的傳感器時,機器學習可以幫助校準和校正傳感器。這些傳感器信號之間的相關性可以用來發(fā)展自校準程序,這在我研究的大氣化學研究領域中是一個熱點研究課題。
然而,當涉及到計算建模時,事情會變得更有趣。
運行模擬全球天氣、地球的排放和這些排放的傳輸?shù)挠嬎隳P驮谟嬎闵鲜欠浅0嘿F的。事實上,計算成本太高,即使在超級計算機上運行,研究級的模擬也可能需要數(shù)周的時間。
MM5和WRF是這方面的很好的例子,它們是用于氣候研究和在早間新聞上給你天氣預報的數(shù)值天氣預報模型。知道天氣預報員一整天都做些什么嗎?答案:運行并研究這些模型。
運行天氣模型是很好,但是現(xiàn)在我們有了機器學習,我們是否可以用它來獲取我們的天氣預報呢?我們能利用衛(wèi)星、氣象站的數(shù)據(jù),并使用基本的預測算法來判斷明天是否會下雨嗎?
令人驚訝,答案是肯定的。如果我們了解某一區(qū)域周圍的空氣壓力、空氣中的濕度水平、風速、與相鄰點及其自身變量有關的信息,就有可能訓練,例如,神經(jīng)網(wǎng)絡。但代價是什么?
用一個有上千個輸入的神經(jīng)網(wǎng)絡來確定明天波士頓是否會下雨是可能的。然而,利用神經(jīng)網(wǎng)絡忽略了整個天氣系統(tǒng)的物理過程。
機器學習是隨機的,而不是確定性的。
神經(jīng)網(wǎng)絡不理解牛頓第二定律,或者說密度不可能是負的-沒有物理約束。
然而,這可能不會是一個長期的限制。有多個研究人員正在研究在神經(jīng)網(wǎng)絡和其他算法中加入物理約束,以便它們能夠被用于類似這樣的目的。
局限3——數(shù)據(jù)
這是最明顯的限制。模型喂得不好,輸出結(jié)果就不好,主要表現(xiàn)為兩種方式:缺乏數(shù)據(jù)和缺乏優(yōu)質(zhì)數(shù)據(jù)。
缺乏數(shù)據(jù)
許多機器學習算法在給出有用結(jié)果之前需要大量的數(shù)據(jù),一個好的例子就是神經(jīng)網(wǎng)絡。神經(jīng)網(wǎng)絡是需要大量訓練數(shù)據(jù)的數(shù)據(jù)喂養(yǎng)機器。網(wǎng)絡的架構(gòu)越大,產(chǎn)生可用結(jié)果需要的數(shù)據(jù)就越多。重復使用數(shù)據(jù)是不好的想法,一定程度上數(shù)據(jù)增強是有用的,但是有更多的數(shù)據(jù)往往是更好的解決方法。
如果可以獲得數(shù)據(jù),那就用上。
缺乏優(yōu)質(zhì)數(shù)據(jù)
雖然看上去相似,這種情況和上述情況也是不同的。我們來想象一下,你認為你可以通過給神經(jīng)網(wǎng)絡放入1萬個生成的假數(shù)據(jù)來蒙混過關,當你把它們放進入的時候,會發(fā)生什么?
網(wǎng)絡會自己訓練自己,當你用一組沒見過的數(shù)據(jù)測試網(wǎng)絡的時候,效果就不會好:你有了數(shù)據(jù),但是數(shù)據(jù)的質(zhì)量沒有達到標準。
同樣地,缺乏優(yōu)質(zhì)的特征會導致算法表現(xiàn)不佳,缺乏優(yōu)質(zhì)的正確標注數(shù)據(jù)也會限制模型的能力。沒有一家公司愿意使用比人工水平誤差還大的機器學習模型。
類似地,將在一種情況下一組數(shù)據(jù)訓練出地模型應用于另一種情況,效果并不相當。目前為止我發(fā)現(xiàn)最好的例子,就是乳腺癌預測。
胸部X光數(shù)據(jù)庫包含了大量照片,但是近幾年這些數(shù)據(jù)庫面臨一個共同的引發(fā)熱議的問題——幾乎所有的X光片都來源于白人女性。這聽起來不像什么大事,但實際上,因為檢測和獲取醫(yī)療的差異等各種因素,黑人女性死于乳腺癌的概率已達到了42%。因此,主要基于白人女性訓練出的算法,對黑人女性并不友好。
在這個例子里,需要的就是在訓練集中增加更多黑人病人的 X 光片數(shù)量。更多與導致這42%增加的相關特征,以及通過相關性進行數(shù)據(jù)分層的更客觀的算法。
如果你還有疑問或想要了解更多,建議閱讀這篇文章。
局限4——誤用
和前面第二個討論的局限性相關,不管是自然界中的確定性問題還是統(tǒng)計性問題,人們盲目地使用機器學習來嘗試分析系統(tǒng),于是形成了所謂的“學術(shù)研究中機器學習的危害”。
在局限 2 中討論原因的時候提到,將機器學習應用于統(tǒng)計性系統(tǒng)是可行的,但算法不會學習兩個變量間的關系,也不知道何時違背了物理定律。我們只是給網(wǎng)絡一些輸入和輸出,告訴它們?nèi)W習聯(lián)系——就像一個人將字典又用文字翻譯一遍,算法只是掌握簡單的基礎物理。
對于統(tǒng)計性(隨機)系統(tǒng),情況就不太明顯。機器學習用于統(tǒng)計性系統(tǒng)的危害主要有兩種表現(xiàn)形式:
P 值篡改
分析范圍
P 值篡改
當一個人可以獲得大量數(shù)據(jù),可能上百、上千,甚至上百萬的變量,就不難發(fā)現(xiàn)顯著性統(tǒng)計結(jié)果(假設大多數(shù)研究設定的顯著性水平 p分析范圍
統(tǒng)計模型和機器學習的分析范圍存在本質(zhì)區(qū)別——統(tǒng)計模型本質(zhì)是確定性的,機器學習本質(zhì)是探索性的。
我們可以把確定性分析和模型看成某人的博士課題或研究領域。想象一下,你和一個顧問合作,試著建立一個理論框架來學習一些真實世界的系統(tǒng)。這個系統(tǒng)有一組受其影響的預定義特征,并且,在仔細設計實驗和開發(fā)假設后,可以運行測試以確定假設的有效性。
另一方面,探索性缺乏和確定性分析的相關的一些特點。事實上,在真正大量數(shù)據(jù)和信息的情況下,由于數(shù)據(jù)的巨大體量,確認性方法完全無法使用。換言之,在存在上百個、上千個,乃至上百萬個特征的情況下,根本不可能仔細地布置一組有限的可測試假設。
因此從廣義上講,在有大量數(shù)據(jù)和可計算負責特征的情況下,機器學習算法和方法是探索預測模型和分類的最佳選擇。一些人認為它們可以用于“小”數(shù)據(jù),但為什么在經(jīng)典的多變量統(tǒng)計方法這樣做時,信息更多呢?
機器學習是一個領域,很大程度上解決了來自信息技術(shù)、計算機科學等領域的重要問題,這些問題既有理論性的也有應用問題。正如此,機器學習和像物理、數(shù)學、概率論、統(tǒng)計學等領域也相關,但它也確實是一個獨立的領域。機器學習領域不會受其他學科提出問題的影響。大多是機器學習專家和從業(yè)者提出的解決方法都犯了嚴重錯誤...但他們還是完成了工作。
局限5——可解釋性
可解釋性是機器學習的主要問題之一。一家人工智能公司試圖向一家只使用傳統(tǒng)統(tǒng)計方法的企業(yè)講解,但如果他們認為模型不可解釋,就可以停止了。如果你不能向客戶確保你明白算法是如何得到結(jié)果的,那如何讓他們信任你和你的專業(yè)度?
正如《商業(yè)數(shù)據(jù)挖掘——機器學習視角》中所言:
“在商務項目中,如果機器學習的結(jié)果是可解釋的,那么商業(yè)經(jīng)理人會更傾向于機器學習的推薦?!?
除非可以解釋這些模型,不然它們顯得無能為力,而且人類解釋過程遵守的規(guī)則,遠遠超出技術(shù)能力。因此,可解釋性成為機器學習應用于實踐需要實現(xiàn)的一個重要指標。
特別地,興起的組學科學(基因組學,蛋白質(zhì)組學,代謝組學等)已經(jīng)成為機器學習研究者的主要目標,因為這些科學對大型和有意義數(shù)據(jù)庫具有依賴性。然而,盡管取得了明顯的成功,但他們的方法缺乏可解釋性。
總結(jié)及Peter Voss" 列表
不可否認,在人工智能開辟了大量有前景機會的同時,也導致了一種被稱為“人工智能解決主義”的心態(tài)的出現(xiàn)。這種心態(tài)是一種哲學,假定數(shù)據(jù)足夠多,機器學習算法就可以解決所有的人類問題。
希望我在文中清楚表示了在目前情況下機器學習存在的一些限制,從而防止一些情況的發(fā)生。神經(jīng)網(wǎng)絡永遠不會告訴我們?nèi)绾巫鲆粋€好人,至少現(xiàn)在不會,也不會理解牛頓運動定律和愛因斯坦相對論。
機器學習基礎理論——計算學習理論里也存在基本限制,主要是統(tǒng)計限制。我們已經(jīng)討論了分析范圍和 p 值篡改危害的相關問題,這些會帶來虛假結(jié)論。還有結(jié)果可解釋性的問題,如果不能讓客戶和投資者確信他們的方法是準確可信的,就對商業(yè)會產(chǎn)生消極影響。
我己經(jīng)在文章內(nèi)大量介紹了人工智能的最重要的局限,最后,我會把Peter Voss’在 2016 年 10 月發(fā)布的文章列一張表,整理更全面的關于人工智能的局限。雖然目前在細小領域內(nèi)主流技術(shù)是非常強大的,但它們通常會列出部分或所有約束列表,我在這里進行完整引用:
每個特定的應用都需要經(jīng)過專門訓練
需要大量手工標記的結(jié)構(gòu)化的數(shù)據(jù)
學習通常必須要受監(jiān)督:訓練數(shù)據(jù)必須被標記
需要冗長的離線/批量訓練
不要實時地以增量或交互的方式學習
遷移學習、模型重復使用和集成的能力差
系統(tǒng)不透明,很難進行調(diào)試
“長尾”效應難以審核和保證
它們編碼相關性,而不是因果關系或本體論關系
實體之間不進行實體或空間的編碼
只能處理自然語言里非常局限的部分
不適合高層次,象征推理或計劃
話雖如此,機器學習和人工智能將繼續(xù)為工業(yè)帶來革命,而且在未來幾年只會變得更加普及。雖然我建議大家最大限度地利用機器學習和人工智能,但我也建議你記住手里工具的局限性——畢竟,沒有什么是完美的。(雷鋒網(wǎng))
- 原標題:機器學習并不“萬能”
- 責任編輯:劉響
- 最后更新: 2019-08-16 12:15:33
-
臺積電高管:摩爾定律還沒死
2019-08-16 12:00 -
專利暗示戴爾正在打造折疊屏PC 且鉸鏈部分很窄
2019-08-16 11:58 -
蘋果確認封殺iPhone第三方電池!
2019-08-16 11:56 -
微軟系統(tǒng)更新又出錯:Surface Book 2處理器被限頻
2019-08-16 11:53 -
鄔賀銓:5G是高科技戰(zhàn)略必爭高地 我國必須掌握自主權(quán)
2019-08-16 10:33 -
5G如何改進芯片制造?三星在美國工廠進行試點
2019-08-16 10:33 -
紅米跟realme,就看誰被打臉!盧偉冰:6400萬像素新機已量產(chǎn)
2019-08-16 09:05 大公司 -
中國鐵塔今年預計應梯次利用電池約5GWh,替換鉛酸電池約15萬噸
2019-08-16 09:00 大公司 -
寒武紀宣布云端AI芯片思元270:自主指令集 性能提升4倍
2019-08-16 08:55 大公司 -
華為首款5G手機預約量破100萬
2019-08-15 18:52 華為 -
第7代微軟小冰亮相,落地場景從手機智能音箱拓展到汽車平臺
2019-08-15 18:34 商業(yè) -
全球第三大晶圓廠GF賣廠
2019-08-15 16:01 -
打了免費廣告 華為手機在臺灣反響熱烈賣斷貨
2019-08-15 15:52 -
中國聯(lián)通:5G套餐最低190元
2019-08-15 15:42 5G -
美光擴建NAND閃存工廠但不增產(chǎn) 128層閃存有重大變化
2019-08-15 13:06 -
鴻蒙來了!國產(chǎn)操作系統(tǒng)到底能不能頂上去?
2019-08-15 12:19 -
華碩推出30周年限定版筆記本,高端定制售價過萬
2019-08-15 10:25 -
14nm工藝再次續(xù)命:牙膏廠真會玩
2019-08-15 09:54 -
華為Mate 30無線充電器獲FCC認證:最高支持30W
2019-08-15 09:04 -
我國成立研發(fā)中心攻關集成電路硅材料和高純特種氣體關鍵技術(shù)
2019-08-15 08:14
相關推薦 -
三季報全公布,10省份增速超上半年 評論 58“無論誰贏,歐洲已輸” 評論 128市場瘋狂下注特朗普,真金白銀比民調(diào)更準確? 評論 113看!中國人的雙航母編隊 評論 578無論誰勝選,華裔科學家們都擔心再遭迫害 評論 342最新聞 Hot
-
三季報全公布,10省份增速超上半年
-
“中國不再是從前那個學徒,完全能和西方正面交鋒”
-
美軍高官又“擔憂”上了:別老盯著俄羅斯,中國這速度才嚇人
-
被中方制裁后,這家美無人機廠商向美政府“喊疼”
-
“德國依賴中俄,就像被下藥了”
-
“‘歐盟CIA’即將成立”
-
特朗普還沒上臺,他們已經(jīng)慌了:斷了美國這個財路
-
“中印邊境士兵互贈糖果”
-
“曾有烏將軍打電話投降,讓我?guī)兔β?lián)系普京”
-
拜登最后一次白宮萬圣節(jié),她扮成…
-
“無論誰贏,歐洲已輸”
-
用腳投票!歐盟對華綠地投資創(chuàng)歷史新高
-
市場瘋狂下注特朗普,真金白銀比民調(diào)更準確?
-
看!中國人的雙航母編隊
-
“末日種子庫”收到3萬份新樣本,“人類在與時間賽跑”
-
90后上天,“中國傳遞的信息很明確”
-