深度學習12大常見問題解答(附答案)

NO IMAGE
1 Star2 Stars3 Stars4 Stars5 Stars 給文章打分!
Loading...

阿爾法狗讓深度學習登上了資料科學世界的巔峰。深度學習成為了當今最熱門的話題之一,但對於大多數人來說,這是一個陌生而又神祕的學科。很多人認為,深度學習就是包括了大量的數學和統計知識。

本文列舉了常見的12個深度學習的問題。

clipboard.png

1.什麼是深度學習?為什麼它會如此受歡迎?

深度學習作為機器學習的典範,近年來已經顯示出了廣闊的前景。這是因為深度學習與人類大腦的功能很相似。人腦是迄今為止最通用、最有效的自我學習模型。讓我們從下面的例子中更好的理解深度學習模型的特點:

clipboard.png

你在上圖中看到了什麼?很明顯,“一輛車”。儘管圖中也有沙子、綠葉、雲彩等,但大腦會將這張圖示記為一輛汽車。這是因為我們的大腦已經學會識別影象中的主要物件。

深度學習的特殊之處就在於從大量無關資料中獲取有用資訊。隨著現在生成資料量的增加,我們希望模型能夠更好地處理更多資料,深度學習模型變得更好。

儘管深度學習已經出現多年,但其重大突破僅僅在近幾年才實現。這其中有兩個主要原因,首先是資料量的增加,如下圖所示;其次是模型所需的硬體資源的增長,作為執行深度學習模型的GPU,處理速度更快,允許我們在更少的時間內構建更大更深的深度學習模型。

clipboard.png

2.深度學習只是一種炒作,還是有真實的應用程式?

現在,深度學習已經在很多實際中得到應用:從Netflix著名的電影推薦系統到Google的無人駕駛,從創造藝術和文學寫作到創造現實生活中的錢,都在使用深度學習模型。因此,如果說它只是一個炒作,這是錯誤的。

目前,深度學習的一些主要應用有:

(1)Google一次性將文字翻譯成數百種語言,通過一些應用於自然語言處理任務的深度學習模型實現。

(2)Siri、Alexa、Cortana等智慧會話代理通過LSTM和RNN來簡化語音識別技術,語音命令開啟了一個全新的領域。

(3)計算機視覺領域的應用,例如OCR(光學字元識別)和實時語言翻譯。

(4)Snapchat和Instagram等多媒體共享應用程式進行面部特徵檢測。

(5)醫療領域的應用,用來定位惡性細胞和其他異物,檢測疾病。

然而,由於訓練深度學習模型所需的標記資料並不容易獲得,因此一些人認為深度學習是一種炒作。即使資料可用,訓練這些模型所需的計算裝置也不便宜。因此人們無法體驗到深度學習的力量,並將其視為炒作。

3.深度學習與機器學習有什麼區別?

(1)資料依賴性

二者之間最主要的區別與資料的規模有關。當資料很小時,深度學習表現一般,而傳統的機器學習表現較好;隨著資料量的增加,深度學習的效能則遠遠高於機器學習。如下圖所示。

clipboard.png

(2)特徵工程

特徵工程是一個將原始影象放入特徵提取器的建立過程,降低資料複雜性,並使資料更適合於學習演算法。這一過程比較耗時、花費較大。

機器學習中,大部分應用特徵需要由專家識別,再根據域和資料型別進行手動編碼深度學習的獨特之處在於從資料中學習高階特徵,也是傳統機器學習領域的一大進步。因此,深度學習減少了為每個問題開發新的特徵提取器的任務。

(3)可解釋性

解釋性作為機器學習和深度學習的比較因素。

假設使用深度學習給散文自動評分,並接近人類的表現,但沒有揭示為什麼它給出了這個分數。而像決策樹這樣的機器學習演算法可以解釋其背後的推理。因此,決策樹和線性邏輯迴歸等演算法主要用於解釋性行業。

4.深度學習的先決條件是什麼?

在進行深度學習前,你需要了解以下知識:數學:概率、導數、線性代數等。統計:統計的基礎知識是進行任何機器學習問題所必需的。工具:具有一定程度的編碼技巧。機器學習:機器學習是深度學習的基礎。在學習深度學習前,一定要理解機器學習的概念。更多詳細資訊請看:Python入門深度學習的完整指南

5.在深度學習領域是否需要獲得博士學位?

博士學位不是必須品,任何工作重點通常是展示你的能力,而不是學位本身。但是,如果你選擇在特定領域(如NLP語言學)進行博士深造,肯定會是個加分項。

6.選擇哪些工具/語言構建深度學習模型?

Python具有強大的機器學習生態系統,該系統由開發人員和編碼人員組成,他們為python使用者提供開源庫和技術支援。這使開發人員為各種演算法編寫複雜程式碼的任務變得更加容易,並且更易於實施和實驗。

另外,Python是一種可用於開發和實現的通用程式語言。這極大地簡化了從開發到實現的過渡。也就是說,一個可以預測機票價格的深度學習模型不僅可以用python開發,還可以用同樣的形式附在網站上。

除此之外,我建議初學者使用像Keras這樣的高階庫,對演算法中隱藏的不必要資訊進行抽象,並允許訪問可以調整的引數,使實驗簡化且提高模型效能。

在R、Julia、C 和Java等深度學習領域,除了Python之外,還有其他的語言。你也可以關注TensorFlow、Pytorch、Caffe2、DL4J等的發展,將他們作為庫的替代品。

如果不熟悉程式設計,還有一些基於GUI的軟體,不需要編碼,就可以構建深度學習模型,如Lobe或Google的AutoML等。

7.為什麼構建深度學習模型需要使用GPU?

深度學習模型有兩個主要的操作:前向傳遞和後向傳遞。

前向傳遞將輸入資料通過神經網路後生成輸出;後向傳遞根據前向傳遞得到的誤差來更新神經網路的權重。

clipboard.png

其本質上都是矩陣乘法,簡單的矩陣乘法如下圖所示。

clipboard.png

在這裡,我們可以看到第一個陣列的行與第二個陣列的列元素分別相乘。因此,在神經網路中,我們可以將第一個矩陣視為神經網路的輸入,第二個矩陣可以視為網路的權重。

這似乎是一個簡單的任務。VGG16(在深度學習應用中經常使用16個隱藏層的卷積神經網路)大約具有1.4億個引數,又稱權重和偏見。想想你需要做的矩陣乘法,如果我們用傳統的方法,訓練這種系統需要幾年的時間。

神經網路的計算密集部分由多個矩陣乘法組成。那麼如何才能更快?

我們可以簡單地通過同時執行所有操作,而不是一個接一個地執行。這就是為什麼我們要使用GPU(圖形處理單元)而不是CPU(中央處理單元)來訓練神經網路的原因。

8.何時(何處)應用神經網路?

首先,深度學習模型需要清晰且豐富的資料來訓練。將深度學習想象為一個孩子。它首先觀察其父母如何走路。然後試圖獨立行走,並且每走一步,孩子都會學習如何執行特定的任務。經過幾次不成功的嘗試後,它會學習如何走路。

其次,對於影象處理等複雜問題使用深度學習需要很謹慎。深度學習演算法屬於表示學習演算法。這些演算法將複雜問題分解為更簡單的形式以便理解(或“可表示”)。對於傳統的演算法來說,這將更困難。

硬體要求對於執行深度神經網路模型也至關重要。神經網路很久以前就被“發現”了,但近年來得以成功實現,硬體資源更加強大也是其主要原因。

9.是否需要大量資料來訓練深度學習模型?

我們確實需要大量的資料來訓練深度學習模型,但也可以通過遷移學習來克服資料量不大這一障礙。

訓練深度學習模型所需的一些資料如下所示:

clipboard.png

即使資料量不大,針對特定任務進行訓練的深度學習模型也可以重用於同一個域中的不同問題,這種技術被稱為遷移學習。

10.哪裡可以找到一些基本的深度學習專案用來練習?

我強烈建議初學者使用MNIST資料,該資料集包含手寫數字及其實際標籤,即數字從0到9。

對於中級使用者來說,這個 Age Detection競賽是一個不錯的專案,該資料集由印度電影演員的面部影象組成,任務是根據面部屬性預測年齡。為了簡單起見,這個問題已被轉換為類,如青年、中年和老年等多個類問題。

11.深度學習的一些免費學習資源有哪些?

(1)影象處理學習資源

卷積神經網路-吳恩達

解密卷積神經網路(CNN)架構

理解卷積神經網路入門指南

機器學習很有趣! 第3部分:深度學習和卷積神經網路

深度卷積神經網路的ImageNet分類

R-CNN

越來越深入的卷積

(2)序列預測/時間序列學習資源

序列模型-吳恩達

深度學習要點:長期短時記憶

遞迴神經網路的不合理有效性

瞭解LSTM網路

迴圈神經網路和LSTM

(3)自然語言處理

自然語言處理的深度學習模型

詞語和短語的分散式表徵及其組合性

用神經網路進行序列學習

深度語音識別:擴大端對端語音識別

12.深度學習的相關面試問題有哪些?

(1)深度學習模型如何學習?

(2)深度學習模型有哪些侷限性?

(3)前饋神經網路和遞迴神經網路之間有什麼區別?

(4)什麼是啟用特徵函式?

(5)什麼是CNN,它有什麼用途?

(6)什麼是池化? 簡述其工作原理。

(7)什麼是dropout層,為什麼要用dropout層?

(8)什麼是消失梯度問題,如何克服?

(9)什麼是優化函式?說出幾個常見的優化函式。

更多面試問題如下:

30個資料科學家關於深度學習的問題

40個資料科學家關於深度學習的問題

45個有關深度學習基礎知識的問題

13.深度學習的未來是什麼?

近年來,深度學習已經取得了很大的進步,但仍有很大的潛力。在不久的將來,深度學習將成為每個資料科學實踐者所需的技能。事實上,現在有一個崗位是“深度學習工程師”——負責部署和維護該公司各部門使用的深度學習模型。毋庸置疑,這個職位在未來將會有很大的需求。

目前,深度學習的侷限之一在於:需要符合人類的要求。它需要大量的資料進行學習,這也引起了很多偏見。但隨著時間的推移,這種偏見將會逐漸被消除。

本文作者:【方向】
閱讀原文
本文為雲棲社群原創內容,未經允許不得轉載。

相關文章

人工智慧 最新文章