DL

1/5ページ

學界 | 機器翻譯新突破:谷歌實現完全基於attention的翻譯架構

摘要:機器之心編譯參與:吳攀、黃小天、李亞洲近兩年來,機器翻譯的突破讓人目不暇接,從去年穀歌的顛覆性突破開始到一個月前Facebook的全新CNN翻譯技術,人工智慧的巴別塔正越建越高。近日,谷歌再次宣佈又在 機器之心編譯 參與:吳攀、黃小天、李亞洲 近兩年來,機器翻譯的突破讓人目不暇接,從去年穀歌的 […]

常見的兩種注意力機制

為什麼需要注意力機制 seq2seq模型已經在機器翻譯、自然語言處理領域取得了很大的進步,基於貝葉斯條件概率公式,seq2seq由一個編碼器和一個解碼器構成,編碼器將源序列A編碼成一個固定長度的特徵向量,這個向量作為輸入被傳送到解碼器得到目標序列B。 seq2seq雖然相比傳統的n-gram統計模型 […]

卷積神經網路之目標檢測總結

概述 傳統的目標檢測任務主要通過人工提取特徵模型建立,常用的特徵包括:HOG、SIFT、Haar等,特徵提取模型之後進行支援向量機或者Adaboost的分類任務,進而得到我們所關注的目標結果。由於特徵模型的侷限性,我們引入卷積特徵,也就是經過卷積神經網路得到的特徵資訊,包括淺層資訊和深層資訊,淺層資 […]

CV | Image Super-Resolution Using Deep Convolutional Networks 使用深度卷積網路的影象超解析度演算法

背景介紹: 超解析度的目標是將輸入的低解析度影象(畫質較差、畫素低)輸出為高解析度影象,如輸入256×256pixels大小的低解析度lr影象,輸出512×512pixels大小的超解析度super resolution的影象。因為需要評估演算法的效能,所以還會涉及到原圖的高解析度hr影象。 作者介 […]

5.0 深度學習之公式詳細推導Softmax和Overfitting

softmax這個結果就可以描述為每個類的概率 故,不會造成學習慢! Overfitting 例如我們利用1000個資料作為訓練,表現出的情況: Cost表現看起來還不錯,Test的變化如下: 上訴表示:過擬合能夠把訓練集上的都對,但是測試集上就哭了! 當然了還有其他的方式來客服Overfittin […]