資料集

1/3ページ

斯坦福大學自然語言處理的QA資料集SQuAD

真英雄,成名於少林寺武俠大會;好演算法,驗證在斯坦福公開資料。 武俠小說中一個公平且有影響力的平臺,可以讓俠之大者脫穎而出,科研也是,一個優秀的公開資料集可以讓好演算法脫穎而出,並同時讓那些靠吹的演算法身敗名裂。本文將詳細敘述今年目前為止自然語言處理界最重量級的資料集 SQuad。 1. SQuAD […]

【機器學習】機器學習資料集大全

下面,您將找到一個由使用者組織的資料科學和機器學習免費資料集的策劃列表。您將找到精選的資料集和我們最喜歡的聚合器。   目錄 探索性分析 通用機器學習 深度學習 自然語言處理 基於雲的機器學習 時間序列分析 推薦系統 特定行業 流資料 網頁蒐羅 現在發生的事​​​​​​​   探索性分析的資料集 探 […]

深度學習對話系統理論篇–資料集和評價指標介紹

對話系統常用評價指標 當前對話系統之所以還沒有取得突破性的進展,很大程度上是因為沒有一個可以準確表示回答效果好壞的評價標準。對話系統中大都使用機器翻譯、摘要生成領域提出來的評價指標,但是很明顯對話系統的場景和需求與他們是存在差別的,這也是當前模型效果不是很好的原因之一。從對話系統不同的層次角度來評價 […]

深度學習CV中常用的資料集

介紹一些深度學習中CV方面的一些常用的資料集: (一)mnist手寫字型資料集: mnist資料是由Google實驗室的Corinna Cortes和紐約大學柯朗研究所的YannLeCun建立的一個手寫字型資料集,其中訓練集包含60000訓練的手寫數字圖片,測試集包含10000張圖片,一個訓練集的標 […]

計算機視覺(影象分類、檢測、分割)資料集和比賽

1 ImageNet資料集和ILSVRC Imagenet資料集是目前深度學習影象領域應用得非常多的一個資料集,關於影象分類、定位、檢測等研究工作大多基於此資料集展開。Imagenet資料集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標註和影象中物體位置的標註。Image […]

使用 tfrecord 製作自己的資料集 (附上原始碼)

相信很多剛入手深度學習的人,最早接觸的程式就是Mnist 手寫數字的識別。Mnist 資料集都已被事先整理好,我們只有拿來用即可。但是如何製作自己的資料集,相信很多剛入門的人還是會一團霧水。作為剛入門不就的小白,我也花了很長時間才完整的製作了自己的資料集。製作自己的資料集,大概可以分為這麼幾步: S […]