機器視覺

1/7ページ

用dlib和opencv進行不同角度人臉檢測及68個關鍵點提取(Python)

用dlib和opencv進行不同角度人臉檢測及68個關鍵點提取(Python) 前幾日為了在自己的單個旋轉人臉資料集上覆現SDM for face Alignment演算法,研究了用dlib機器學習工具箱和opencv進行旋轉人臉的檢測及關鍵點提取,整理一下思路,希望有所幫助。 1. 軟體要求 Ub […]

影象分類 | 深度學習PK傳統機器學習

原文:Image Classification in 5 Methods 作者:Shiyu Mou 翻譯:何冰心 影象分類,顧名思義,是一個輸入影象,輸出對該影象內容分類的描述的問題。它是計算機視覺的核心,實際應用廣泛。 影象分類的傳統方法是特徵描述及檢測,這類傳統方法可能對於一些簡單的影象分類是有 […]

無人駕駛技術系列(乾貨)

作者簡介: 吳雙,原百度研究院矽谷人工智慧實驗室高階研究員,百度美國研發中心高階架構師。美國南加州大學物理博士,加州大學洛杉磯分校博士後,研究方向包括計算機和生物視覺,網際網路廣告演算法,網際網路文字和視訊的推薦系統,語音識別和自然語言處理,曾在NIPS等國際會議中發表文章。  劉少山,Percep […]

數峰科技榮獲"智在人為"2017年度浙商人工智慧最具創新性企業稱號

人工智慧的風潮正以不可抵擋的姿態席捲全球,在人工智慧全面爆發的2017年,資本大量湧入,巨頭紛紛佈局,而浙商也在以敢為人先的精神促進人工智慧的落地生花。 錢塘江畔,八方來潮。12月21日下午,作為第三屆中國(杭州)國際機器人西湖論壇的專題論壇之一,2017人工智慧產業融合創新峰會暨『產業融合·接力浙 […]

STFT和聲譜圖,梅爾頻譜(Mel Bank Features)與梅爾倒譜(MFCCs)

最近小編在做ASC(Acoustic Scene Classification)問題,不管是用傳統的GMM模型,還是用機器學習中的SVM或神經網路模型,提取聲音特徵都是第一步。梅爾頻譜和梅爾倒譜就是使用非常廣泛的聲音特徵形式,小編與它們鬥爭已有一段時間了,在此總結一下使用它們的經驗。 STFT和聲譜 […]