古风名字,穿越小说完本 ,神武八荒一颗小说

什么是機(jī)器學(xué)習(xí)?

2015-06-18 22:50:14 n

點(diǎn)擊關(guān)注->創(chuàng)芯網(wǎng)公眾號(hào)，后臺(tái)告知EETOP論壇用戶名，獎(jiǎng)勵(lì)200信元

此博文作者為John Platt，一位杰出的科學(xué)家，現(xiàn)在為微軟工作。

大家好，我是John Platt。17年以來(lái)，我一直在微軟做機(jī)器學(xué)習(xí)算法的研發(fā)和應(yīng)用。這段時(shí)間機(jī)器學(xué)習(xí)開始流行起來(lái)，有很多人問我說，“到底什么叫機(jī)器學(xué)習(xí)？你能用它來(lái)干嘛？”

我很愿意解答這些疑問，因?yàn)槭聦?shí)上，在數(shù)量龐大的微軟產(chǎn)品當(dāng)中，微軟的機(jī)器學(xué)習(xí)算是應(yīng)用非常多的了，而正是這一點(diǎn)成就了微軟成為一個(gè)有趣又很有影響力的廠家（這就像是糖果店對(duì)小孩子來(lái)說一樣）。

什么是機(jī)器學(xué)習(xí)?

總的來(lái)說，機(jī)器學(xué)習(xí)是將一串串?dāng)?shù)據(jù)轉(zhuǎn)化為一個(gè)個(gè)軟件，我們稱它們?yōu)橐粋€(gè)個(gè)“模型“，這些模型就代表著原來(lái)的數(shù)據(jù)集并且會(huì)整合數(shù)據(jù)以對(duì)接下來(lái)的新數(shù)據(jù)作出一些預(yù)測(cè)。因?yàn)闄C(jī)器學(xué)習(xí)應(yīng)用如此廣泛，我覺得可以對(duì)機(jī)器學(xué)習(xí)的應(yīng)用做出一個(gè)籠統(tǒng)的分類。機(jī)器學(xué)習(xí)有這樣三種應(yīng)用：

1. 挖掘數(shù)據(jù)：機(jī)器學(xué)習(xí)可以幫助人們從龐大的數(shù)據(jù)中獲得深入的理解。

2. 數(shù)據(jù)工程：機(jī)器學(xué)習(xí)可以幫助人們把數(shù)據(jù)轉(zhuǎn)化成軟件，從而對(duì)未知的數(shù)據(jù)做出一些判斷。

3. 人工智能：機(jī)器學(xué)習(xí)可以模仿人的思維，可以發(fā)明出像人一樣能夠看見、聽見、能夠理解事物的計(jì)算機(jī)。

在微軟，我們用機(jī)器學(xué)習(xí)來(lái)作上述所有的事。讓我來(lái)分別舉個(gè)例子：

應(yīng)對(duì)惡意軟件

微軟惡意軟件防御中心與微軟調(diào)查小組合作，使用機(jī)器學(xué)習(xí)研發(fā)出一種新軟件，可以自動(dòng)監(jiān)測(cè)惡意軟件，還可以幫助分析員了解惡意軟件的開發(fā)過程。如果感興趣大家還可以在Dennis Batchelder的博客上了解更多。

建一個(gè)搜索引擎

微軟旗下的“Bing"搜索引擎是一個(gè)復(fù)雜的系統(tǒng)，它能理解你的提問，搜索整個(gè)網(wǎng)站，然后得出能夠幫到你的信息。因?yàn)椤癇ing”用戶群極大，我們只有通過“自動(dòng)決定程序”才能處理用戶大量帶有不確定性的且可能有歧義的日常語(yǔ)言。我們繼續(xù)利用機(jī)器學(xué)習(xí)的技術(shù)去研發(fā)了“Bing”下面的一些小軟件，與“Bing”一起構(gòu)成一整個(gè)高效工作的搜索引擎。機(jī)器學(xué)習(xí)技術(shù)的一個(gè)重要搜索功能是排序功能：幾年前，就是用我們研發(fā)的算法，微軟調(diào)查小組的一隊(duì)工作人員贏得了“學(xué)習(xí)如何排序”的比賽。

讓計(jì)算機(jī)也能看見、能聽見

微軟一直在推動(dòng)計(jì)算機(jī)視覺和語(yǔ)音識(shí)別領(lǐng)域的發(fā)展。在體感設(shè)備里有一種軟件能識(shí)別你的手勢(shì)，這種軟件就是通過機(jī)器學(xué)習(xí)開發(fā)出來(lái)的。微軟的語(yǔ)音識(shí)別系統(tǒng)是建立在計(jì)算機(jī)有能夠深入學(xué)習(xí)的能力上的，我們從人腦結(jié)構(gòu)中得到靈感研發(fā)了這種機(jī)器學(xué)習(xí)的模型。我們還用機(jī)器學(xué)習(xí)創(chuàng)造出了一種能夠?qū)崟r(shí)同聲翻譯的軟件。

看到這些激動(dòng)人心的應(yīng)用程序，我意識(shí)到機(jī)器學(xué)習(xí)技術(shù)正給我們帶來(lái)一個(gè)充滿魔力的時(shí)代。有很多的研究者和開發(fā)者多年來(lái)都致力于這項(xiàng)技術(shù)的研發(fā)。基于摩爾定律和互聯(lián)網(wǎng)，我們現(xiàn)在擁有足夠的已分類的數(shù)據(jù)和計(jì)算方式去很好地利用機(jī)器學(xué)習(xí)技術(shù)來(lái)創(chuàng)造好的軟件。我很期待能夠與更多的研發(fā)者分享我們的算法和工具，從而讓更多人可以運(yùn)用他們的創(chuàng)造力去發(fā)明屬于他們自己的計(jì)算機(jī)程序。

在我的下一篇文章里，我將說一說這二十年來(lái)微軟如何一步一步開發(fā)出機(jī)器學(xué)習(xí)這門技術(shù)。我很期待能在我的博客里與大家交流。