tensorflow

1/90ページ

30分鐘手把手帶你入門TensorFlow——Mnist手寫數字識別實戰教程

Hello大家好,這一次睿老師將會帶領大家實現mnist的手寫數字識別,手把手教會你如何使用TensorFlow進行基本的操作。本次課程中,我會保持一貫的囉嗦風格,事無鉅細地深入講解每一個操作細節,為每一位讀者提供最貼心的服務。 準備工作 安裝TensorFlow我就不多說了,主要是mnist資料集 […]

神經網路經典損失函式-交叉熵和均方誤差

在神經網路中,如何判斷一個輸出向量和期望的向量有多接近呢?交叉熵(cross entropy)是常用的方法之一,刻畫了兩個概率分佈之間的距離,是分類問題中使用較多的一種損失函式。 給定兩個概率分佈p和q,通過q來表示p的交叉熵為: 如何將神經網路前向傳播得到的結果也變成概率分佈,比較常用的方法為So […]

TensorFlow Mac學習篇 開發環境(一)

                                                    TensorFlow 學習篇(一)        這兩年AI、人工智慧、深度學習、機器學習、這些技術都比較火,然後想自己學習一下,但是不得入門。於是我去各個招聘平臺去搜尋相應的職位需求,這時候“T […]

Tensorflow在不同訓練場景下讀取和使用不同格式pretrained model的方法

不同應用場景分析與示例 Tensorflow讀取預訓練模型是模型訓練中常見的操作,通常的應用的場景包括: 1)訓練中斷後需要重新開始,將儲存之前的checkpoint(包括.data .meta .index checkpoint這四個檔案),然後重新載入模型,從上次斷點處繼續訓練或預測。實現方法如 […]

Tensorflow中的Lazy load問題

問題描述 用tensorflow訓練或者inference模型的時候,有時候會遇到執行越來越慢,最終記憶體被佔滿,導致電腦宕機的問題,我們稱之為記憶體溢位。出現這種問題很可能是因為在一個session中,graph迴圈建立重複的節點所導致的Lazy load問題。 舉例說明 舉個例子,用tensor […]

機器翻譯模型Transformer程式碼詳細解析

谷歌一個月前發了一篇論文Attention is all you need,文中提出了一種新的架構叫做Transformer,用以來實現機器翻譯。它拋棄了傳統用CNN或者RNN的定式,取得了很好的效果,激起了工業界和學術界的廣泛討論。本人的另一篇部落格也對改論文進行了一定的分析:對Attention […]

1 90