什么是機(jī)器學(xué)習(xí)?
2015-06-18 22:50:14 n此博文作者為John Platt,一位杰出的科學(xué)家,現(xiàn)在為微軟工作。
大家好,我是John Platt。17年以來(lái),我一直在微軟做機(jī)器學(xué)習(xí)算法的研發(fā)和應(yīng)用。這段時(shí)間機(jī)器學(xué)習(xí)開始流行起來(lái),有很多人問我說,“到底什么叫機(jī)器學(xué)習(xí)?你能用它來(lái)干嘛?”
我很愿意解答這些疑問,因?yàn)槭聦?shí)上,在數(shù)量龐大的微軟產(chǎn)品當(dāng)中,微軟的機(jī)器學(xué)習(xí)算是應(yīng)用非常多的了,而正是這一點(diǎn)成就了微軟成為一個(gè)有趣又很有影響力的廠家(這就像是糖果店對(duì)小孩子來(lái)說一樣)。
總的來(lái)說,機(jī)器學(xué)習(xí)是將一串串?dāng)?shù)據(jù)轉(zhuǎn)化為一個(gè)個(gè)軟件,我們稱它們?yōu)橐粋€(gè)個(gè)“模型“,這些模型就代表著原來(lái)的數(shù)據(jù)集并且會(huì)整合數(shù)據(jù)以對(duì)接下來(lái)的新數(shù)據(jù)作出一些預(yù)測(cè)。因?yàn)闄C(jī)器學(xué)習(xí)應(yīng)用如此廣泛,我覺得可以對(duì)機(jī)器學(xué)習(xí)的應(yīng)用做出一個(gè)籠統(tǒng)的分類。機(jī)器學(xué)習(xí)有這樣三種應(yīng)用:
1. 挖掘數(shù)據(jù):機(jī)器學(xué)習(xí)可以幫助人們從龐大的數(shù)據(jù)中獲得深入的理解。
2. 數(shù)據(jù)工程:機(jī)器學(xué)習(xí)可以幫助人們把數(shù)據(jù)轉(zhuǎn)化成軟件,從而對(duì)未知的數(shù)據(jù)做出一些判斷。
3. 人工智能:機(jī)器學(xué)習(xí)可以模仿人的思維,可以發(fā)明出像人一樣能夠看見、聽見、能夠理解事物的計(jì)算機(jī)。
在微軟,我們用機(jī)器學(xué)習(xí)來(lái)作上述所有的事。讓我來(lái)分別舉個(gè)例子:
應(yīng)對(duì)惡意軟件
微軟惡意軟件防御中心與微軟調(diào)查小組合作,使用機(jī)器學(xué)習(xí)研發(fā)出一種新軟件,可以自動(dòng)監(jiān)測(cè)惡意軟件,還可以幫助分析員了解惡意軟件的開發(fā)過程。如果感興趣大家還可以在Dennis Batchelder的博客上了解更多。
建一個(gè)搜索引擎
微軟旗下的“Bing"搜索引擎是一個(gè)復(fù)雜的系統(tǒng),它能理解你的提問,搜索整個(gè)網(wǎng)站,然后得出能夠幫到你的信息。因?yàn)椤癇ing”用戶群極大,我們只有通過“自動(dòng)決定程序”才能處理用戶大量帶有不確定性的且可能有歧義的日常語(yǔ)言。我們繼續(xù)利用機(jī)器學(xué)習(xí)的技術(shù)去研發(fā)了“Bing”下面的一些小軟件,與“Bing”一起構(gòu)成一整個(gè)高效工作的搜索引擎。機(jī)器學(xué)習(xí)技術(shù)的一個(gè)重要搜索功能是排序功能:幾年前,就是用我們研發(fā)的算法,微軟調(diào)查小組的一隊(duì)工作人員贏得了“學(xué)習(xí)如何排序”的比賽。
讓計(jì)算機(jī)也能看見、能聽見
微軟一直在推動(dòng)計(jì)算機(jī)視覺和語(yǔ)音識(shí)別領(lǐng)域的發(fā)展。在體感設(shè)備里有一種軟件能識(shí)別你的手勢(shì),這種軟件就是通過機(jī)器學(xué)習(xí)開發(fā)出來(lái)的。微軟的語(yǔ)音識(shí)別系統(tǒng)是建立在計(jì)算機(jī)有能夠深入學(xué)習(xí)的能力上的,我們從人腦結(jié)構(gòu)中得到靈感研發(fā)了這種機(jī)器學(xué)習(xí)的模型。我們還用機(jī)器學(xué)習(xí)創(chuàng)造出了一種能夠?qū)崟r(shí)同聲翻譯的軟件。
看到這些激動(dòng)人心的應(yīng)用程序,我意識(shí)到機(jī)器學(xué)習(xí)技術(shù)正給我們帶來(lái)一個(gè)充滿魔力的時(shí)代。有很多的研究者和開發(fā)者多年來(lái)都致力于這項(xiàng)技術(shù)的研發(fā)。基于摩爾定律和互聯(lián)網(wǎng),我們現(xiàn)在擁有足夠的已分類的數(shù)據(jù)和計(jì)算方式去很好地利用機(jī)器學(xué)習(xí)技術(shù)來(lái)創(chuàng)造好的軟件。我很期待能夠與更多的研發(fā)者分享我們的算法和工具,從而讓更多人可以運(yùn)用他們的創(chuàng)造力去發(fā)明屬于他們自己的計(jì)算機(jī)程序。
在我的下一篇文章里,我將說一說這二十年來(lái)微軟如何一步一步開發(fā)出機(jī)器學(xué)習(xí)這門技術(shù)。我很期待能在我的博客里與大家交流。
EETOP 官方微信
創(chuàng)芯大講堂 在線教育
半導(dǎo)體創(chuàng)芯網(wǎng) 快訊
相關(guān)文章