99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

深度學(xué)習(xí)的天賜和詛咒:最大的優(yōu)勢也是最大的缺陷

2019-04-15 09:14:44 未知
點擊關(guān)注->創(chuàng)芯網(wǎng)公眾號,后臺告知EETOP論壇用戶名,獎勵200信元
視覺問題中沒有純粹的“簡單”和“復(fù)雜”

 

首先需要就視覺/計算機(jī)視覺做一點說明。原則上可以表述如下:給定一臺攝像機(jī)拍攝的圖像,計算機(jī)可以回答關(guān)于該圖像內(nèi)容的一些問題。 

 

簡單的問題比如“圖像中是否存在三角形”,“圖像中是否存在人臉”;復(fù)雜的問題例如“是否有狗在圖像中追逐貓”。這些對人類來說小兒科的問題看似有很多相似的地方,然而事實卻證明這些問題的背后的復(fù)雜性存在巨大差異。

 

同樣是讓計算機(jī)回答“圖中是否有XX”的問題,“圖中是否有貓”顯然要比“圖中是否有紅色”更難。你看,試圖將視覺問題劃分為“簡單”或“復(fù)雜”將會陷入無止境的深淵。

 

這一點很重要。因為像我們?nèi)祟愡@種高度視覺化的動物,以上問題都不是問題。但對計算機(jī)深度學(xué)習(xí)來說,確實非常復(fù)雜。

 

傳統(tǒng)計算機(jī)視覺存在的問題

 

傳統(tǒng)的計算機(jī)視覺就是使用一套算法,從圖片里提取信息(通常表示為像素值數(shù)組)。比如去噪、增強(qiáng)和檢測的算法,一些方法旨在尋找簡單的幾何圖元,例如邊緣檢測、形態(tài)分析、霍夫變換、斑點檢測、角點檢測、各種圖像閾值處理技術(shù)等。還有特征表示技術(shù)和變換,如定向梯度的直方圖、Haar級聯(lián)等可以用作機(jī)器學(xué)習(xí)分類器的前端以構(gòu)建更復(fù)雜的檢測器。

 

與流行的看法相反,上述工具結(jié)合在一起可以組成非常強(qiáng)大有效的特定物體探測器。人們可以構(gòu)建面部檢測器、汽車檢測器、路牌檢測器,并且它們很可能在精度和計算復(fù)雜性方面,優(yōu)于這些特定對象的深度學(xué)習(xí)解決方案。 

 

 

 

但問題是,每個探測器都需要由有能力的人員從頭開始構(gòu)建,低效又昂貴,且不可擴(kuò)展的。

 

因此,李上上那些很厲害的探測器只適用于必須高頻場景,還需要證明前期投資的合理性。許多探測器都是專有的,一般公眾無法使用。

 

優(yōu)秀的面部探測器、車牌閱讀器很多,但狗探測器卻很少。沒有一個心智正常的人會投入人力和物力去編寫狗探測器或分類器,從圖像中分類出一種狗,貴且不切實際。

 

這是傳統(tǒng)視覺的死穴,卻是深度學(xué)習(xí)的用武之地。

 

用一個聰明學(xué)生的故事來解釋深度學(xué)習(xí)的本質(zhì)

 

想象一下,你正在教授計算機(jī)視覺課程。在開始的幾個講座中,學(xué)生了解到豐富的技術(shù)(例如上面討論的技術(shù)),接下來就是給學(xué)生布置一些任務(wù)。

 

先從一些簡單的任務(wù)開始,例如通過詢問圖像中是否有圓形或正方形;接下來逐漸提高復(fù)雜度。學(xué)生每周都要編寫計算機(jī)程序來解決下一個任務(wù)。而你來查看代碼,并在某些示例上運(yùn)行代碼來檢驗效果。

 

這個學(xué)期,來了一個新生,他不跟周圍人說話,也從不問問題。但當(dāng)他提交第一個解決方案時,你會發(fā)現(xiàn)這是一堆難以理解的代碼,跟你以前看到的代碼都不同。

 

看起來他正在用一些隨機(jī)看的過濾器對每個圖像進(jìn)行卷積,然后使用一些非常奇怪的邏輯,許多“if then else”語句具有大量搞不懂的參數(shù)來獲得最終答案。你在樣本上運(yùn)行此代碼,它居然完全正常!你心想,這個方法是在不同尋常難以理解,但管他呢,確實有效啊!

 

幾周過去了,任務(wù)復(fù)雜度在不斷提升,你越來越看不懂這個學(xué)生的代碼,但就算是最復(fù)雜的任務(wù),它的效果也令人驚訝。最后一個問題是在一組真實的圖像中區(qū)分貓和狗。其他學(xué)生代碼的準(zhǔn)確率都沒有超過65%,但新學(xué)員的代碼能夠達(dá)到95%!太不可思議了。

 

你對代碼進(jìn)行了逆向工程,結(jié)果發(fā)現(xiàn)他那堆復(fù)雜的代碼,背后的邏輯其實非常簡單:

 

  1. 檢測是否有狗牌:如果有返回“狗”;沒有返回“貓”

  2. 如果沒有狗牌,檢測圖像的左側(cè)部分是否比右側(cè)部分更黃:如果是返回“狗”;不是返回“貓”

 

 

你把這個學(xué)生叫到辦公室問他是怎么想的,他表示其實自己也不知道,他根本不明白貓和狗是什么,只知道通過什么方法將二者區(qū)分出來。這算作弊嗎?從人類的角度來看,是的,他的出發(fā)點和你想的完全不同。

 

雖然其他學(xué)生使用原始數(shù)據(jù)集并沒有得到特別突出的結(jié)果,但也不會出什么奇怪的錯誤。相比而言,新學(xué)生的方式雖然在使用當(dāng)前數(shù)據(jù)集的時候,效果卓著,然而一旦稍微對數(shù)據(jù)集做一點改動,例如將狗牌貼在貓身上,結(jié)果就是完全錯誤的。

 

深度學(xué)習(xí)的天賜和詛咒

 

上面那個新學(xué)生的例子,其實很形象的表述了深度學(xué)習(xí)的特性。

 

深度學(xué)習(xí)是一種使用梯度反向傳播的、特定優(yōu)化技術(shù)來生成“程序”(也稱為“神經(jīng)網(wǎng)絡(luò)”)的技術(shù)。上面學(xué)生的程序只是構(gòu)建一組轉(zhuǎn)換和條件,將正確的標(biāo)簽分配給數(shù)據(jù)集中的正確圖像。而且總是在尋求解決問題最省力的方法,比如給定數(shù)據(jù)集里,狗的圖片都在右上角有一道藍(lán)色的光暈,那么深度學(xué)習(xí)就會立刻使用這作為區(qū)分貓狗的標(biāo)準(zhǔn)。

 

為了消除這些虛假的偏差,我們通常會向訓(xùn)練集添加更多數(shù)據(jù)、反向傳播生成的“程序”可能非常大、非常復(fù)雜,具有數(shù)百萬個參數(shù)和數(shù)千個條件檢查,可以鎖定到組合更精細(xì)偏見的組合。任何允許分配正確標(biāo)簽以統(tǒng)計優(yōu)化目標(biāo)函數(shù)的東西都會做,無論是否與任務(wù)的“語義精神”相關(guān)。 

 

深度網(wǎng)絡(luò)能否最終鎖定到“語義正確”先驗的東西上?當(dāng)然可以。但現(xiàn)在有大量證據(jù)表明,實際上并非五次。對抗性的例子表明,對圖像的微小修改都可以導(dǎo)致錯誤的結(jié)果。對類似于先前訓(xùn)練的數(shù)據(jù)集的新樣本的研究表明,超出原始數(shù)據(jù)集的泛化遠(yuǎn)比數(shù)據(jù)集中的泛化弱得多。

 

自動創(chuàng)建無人能想到的功能,是深度學(xué)習(xí)的最大優(yōu)勢,同時也是它的最大弱點、因為大多數(shù)時候,至少在語義上是存疑的。

 

深度學(xué)習(xí)在什么情況下好用,什么情況下不可用?

 

深度學(xué)習(xí)無疑是計算機(jī)視覺工具箱的一個有趣補(bǔ)充。現(xiàn)在可以相對容易地“訓(xùn)練”探測器來探測物體,還可以在一定程度通過調(diào)整探測器來使用更多算力。但同時也需要為深度網(wǎng)絡(luò)的黑盒屬性付出高昂的代價,我們無法確定他如何做出決定,而且跟我們認(rèn)可的“語義精神”毫無關(guān)系。因此,在輸入數(shù)據(jù)中出現(xiàn)的任何低級偏差都會導(dǎo)致檢測器意外地失敗,而且這些失效條件實際上無法表征。

 

因此在落地應(yīng)用時,深度學(xué)習(xí)主要用于對錯誤不敏感、且能夠保證輸入不會與訓(xùn)練數(shù)據(jù)集有很大差異場景,例如圖像搜索,可能是監(jiān)視,自動零售以及幾乎所有的“非關(guān)鍵任務(wù)”,95%的準(zhǔn)確率非常夠用了。

 

具有諷刺意味的是,大多數(shù)人堅信深度學(xué)習(xí)在無人駕駛汽車、自動機(jī)器人場景下的應(yīng)用是一場革命,Piekniewski認(rèn)為,只能將這種信念描述為“不幸”的誤解。因為這些場景需要需要實時決策,容錯率極低,經(jīng)常會導(dǎo)致致命的結(jié)果,最近的研究顯示基于深度神經(jīng)的自動駕駛解決方案在現(xiàn)實生活中確實容易受到對抗性攻擊。 

 

還有人對深度學(xué)習(xí)應(yīng)用在醫(yī)學(xué)和診斷中寄予厚望。然而,在這個領(lǐng)域,也有一些相關(guān)的發(fā)現(xiàn),例如,在一個機(jī)構(gòu)數(shù)據(jù)上訓(xùn)練的模型失敗了,換一個機(jī)構(gòu)數(shù)據(jù)卻成功了,說明這些模型使用比許多研究人員所希望的更淺度的數(shù)據(jù)。

 

數(shù)據(jù)比我們想象的更淺。

 

深度學(xué)習(xí) vs 傳統(tǒng)計算機(jī)視覺

 

深度學(xué)習(xí)現(xiàn)在非常流行,但傳統(tǒng)的計算機(jī)視覺也并非就失去價值。

 

傳統(tǒng)計算機(jī)視覺仍然可以用來構(gòu)建強(qiáng)大的探測器。這些手工做成的探測器可能無法在某些特定數(shù)據(jù)集指標(biāo)上實現(xiàn)高性能,但可以保證依賴于輸入的“語義相關(guān)”特征集,它的故障模式可以更好地表征和預(yù)期。 

 

深度學(xué)習(xí)提供統(tǒng)計上強(qiáng)大的探測器,而不需要昂貴的特征工程,盡管仍需要大量已標(biāo)記的數(shù)據(jù),外加大量GPU和現(xiàn)場的深度學(xué)習(xí)專家。而且,這些探測器會意外地失效,適用范圍也不容易被(完全)表征。

 

所以,在容錯率高的場景中,可以選擇深度學(xué)習(xí);在容錯率低且計算復(fù)雜性更重要的場景中,經(jīng)典機(jī)器視覺管道將在可預(yù)見的未來繼續(xù)占據(jù)重要位置。

關(guān)鍵詞: 深度學(xué)習(xí) AI

  • EETOP 官方微信

  • 創(chuàng)芯大講堂 在線教育

  • 半導(dǎo)體創(chuàng)芯網(wǎng) 快訊

全部評論

主站蜘蛛池模板: 日韩高清网站| 337d欧美人体大胆瓣开下面| 亚洲国产精品网| 免费视频观看在线www日本| 国产日产欧产精品精品推荐在线 | 日韩精品一区二区三区不卡| 91精品国产露脸在线观看| 久久黄色视屏| 日本一级作爱片在线观看| 日韩欧美在线观看视频一区二区| 亚州一级毛片在线| 亚洲最大的黄色网址| 成人永久免费高清| 红色一级毛片| 免费一级淫片aa| 免费网站看v片在线香蕉| 欧美成人免费在线观看| 欧美精品不卡| 国产97在线 | 亚洲| 国产成人福利色视频| 国产护士一级毛片高清| 国产福利在线视频尤物tv| 性欧美巨大| 美女视频一区二区三区在线| 黄色在线视频在线观看| 韩国福利影视一区二区三区| 黑人好太好长爱不了| 啪一啪在线| 视频一区 国产| 黄色一级片录像| 高清毛片在线看高清| 特黄特色网站| 性插网站| 国产精品欧美亚洲韩国日本99 | 爱爱爱免费视频观看在线网站| 成人国产激情福利久久精品| 国产成人精品一区| 92午夜剧场| 131午夜美女爱做视频| 黄站在线| 视频一区二区三区在线观看|