什么是機器學習--中國數字科技館
./t20191126_931992_taonews.html
首頁  >  音視頻  >  音頻  >  科學播報

什么是機器學習

什么是機器學習(科學播報) 0:00/0:00
最新發布時間: 2019-11-26   瀏覽數:
分享到:

  機器學習是人工智能在近期最重要的發展之一。機器學習的理念是,不將智能看作是給機器傳授東西,而是機器會自己學習東西。這樣一來,機器就可以直接從經驗(或數據)中學習如何處理復雜的任務。

  隨著計算速度和用于編程的算法的巨大進步與發展,機器學習成長迅速。由此產生的算法對我們的生活開始產生重大影響,而且它們的表現往往勝過人類。那么,機器學習是如何工作的呢?

  在機器學習系統中,計算機通常是通過在相同任務的大型數據庫中進行訓練,然后自己編寫代碼去執行一項任務。其中很大一部分涉及到識別這些任務中的模式,然后根據這些模式做出決策。

  舉個例子,假設一家公司正要招聘一名新員工,在招聘廣告登出之后有1000個人申請,每個人都投了簡歷。如果要親自一個個篩選,這實在太多了,所以你想訓練一臺機器來完成這項任務。

  為了做到這一點,你需要把公司過往的許多應聘者的簡歷都記錄下來。對于每一份簡歷,你都有記錄表明這個人是否最終被聘用了。為了訓練機器,你拿出一半的簡歷,讓機器通過學習這些簡歷最終是否成功地申請到了一份工作來找出其中的模式。

  這樣一來,當機器收收到一份簡歷時,它就可以對這個人是否適合被雇傭做出判斷。訓練完畢,就可以接著用另一半簡歷來對機器進行測試。如果它的成功率足夠高,也就是機器做出正確判斷的概率夠高,那么你就可以安心地讓機器根據一個人的簡歷來判斷他是否適合被聘用。在任何階段都不需要人的判斷。

  為了更清楚地理解機器學習的過程,我們將以開發能夠識別手寫數字的機器為具體例子來考慮模式識別的問題。這樣的機器應該能夠準確識別一個字符所代表的數字,而無論它的書寫格式如何變化。

  數字識別的過程分為兩個階段。首先,我們必須能夠將手寫數字的圖像掃描到機器中,并從這張(數字)圖像中提取出有意義的數據。這通常是通過主成分分析(PCA)的統計方法實現的,這種方法會自動提取圖像中的主要特征,例如圖像的長度、寬度、線條的交點等。這個過程與求解矩陣的本征值和本征向量的過程密切相關,也與谷歌用來在萬維網上搜索信息的過程非常相似。

  然后,我們想訓練機器從這些提取的特征中識別數字。一種非常主流的用來訓練機器的方法是神經網絡。神經網絡算法的最初靈感來源是我們認為的人類大腦的工作方式,但并不嚴格地建立在我們認為的人類大腦的工作方式之上。

隨著訓練數據的增加,算法會更新其選擇的直線。(圖片來源:University of Bath)

  首先要創建一組“神經元”,并將它們連接起來,它們可以相互發送消息。接下來,讓神經網絡去解決大量已經知道結果的問題,這樣做能讓算法“學習”到應該如何確定神經元之間的連接,以便能成功地識別出數據中的哪些模式導致了正確的結果。

  將許多感知機耦合在一起就可以進行更多的計算,但這一發展必須等待更強大的計算機的出現。當多層感知機耦合起來形成一個神經網絡時,這一重大突破就出現了。這種神經網絡的典型結構如下圖所示,它包括輸入層、隱藏層和輸出層。在這種情況下,輸入會組合起來以觸發感知機的第一層神經元,由此產生的輸出也會組合起來以觸發下一層神經元,最后,這些組合起來給出最終的輸出。

層數越多,神經網絡就越“深”。(圖片來源:University of Bath)

  然后,這樣一個神經網絡就會通過為上面的神經元之間的每個連接分配加權而得到訓練。這個過程是為了模仿大腦神經通路強化或衰減的方式。深度學習描述了訓練這樣一個神經網絡的過程。

  神經網絡學習的過程有多種形式。在監督學習中,用戶會事先提供一組成對的實例,也就是輸入和輸出。然后,學習的目標是找到一個給出的輸出能與實例匹配的神經網絡。通常,用來比較神經網絡的輸出與實例的輸出的方法是計算兩者的均方誤差;然后對網絡進行訓練,讓這一誤差對所有訓練數據集最小化。這種方法的一個非常標準的應用是在統計學中使用的曲線擬合,它對手寫數字和其他的模式識別問題都有很好的效果。

  在強化學習中,數據不會由用戶事先給出,而是由神經網絡控制的機器與環境交互作用時生成的。機器會在每個時間點上對環境執行一個操作,由此生成一個觀察結果,以及這個操作的成本。然后訓練這個神經網絡去選擇那些將總體成本降至最低的操作。在許多方面,這個過程類似于人類學習的方式。

  機器學習進展迅速,在更快的訓練算法和越來越多的數據的驅動下,發展更復雜、更深層神經網絡的趨勢越來越明顯。

 

原創稿件

制作:西南交通大學 曾子芹

參考來源:

[1] https://plus.maths.org/content/what-machine-learning


專輯里的聲音
查看更多
©2011-2019 版權所有:中國數字科技館
未經書面許可任何人不得復制或鏡像
京ICP備11000850號 京公網安備110105007388號
信息網絡傳播視聽節目許可證0111611號
國家科技基礎條件平臺
中华彩票网