2015年微軟亞洲研究院的驚豔專案,人工智慧搶眼

NO IMAGE

2015年微軟亞洲研究院的驚豔專案,人工智慧搶眼

發表於2015-12-01 14:20|
949次閱讀| 來源CSDN| 6 條評論| 作者錢曙光
摘要:日前,2015微軟亞洲研究院“合作創•研”年會在微軟亞洲研究院成功舉行,本文總結了今年幾個重點專案:智慧花卉識別知識系統、智慧校園、支援實時卷積神經網路的智慧攝像頭等。

日前,2015微軟亞洲研究院 “合作創•研”年會(原微軟亞洲研究院聯合實驗室研討會)在微軟亞洲研究院成功舉行。據悉,聯合實驗室在過去十六年間做出了大量卓有成效的工作,到2015年為止,聯合實驗室共匯聚計算機各研究領域的60餘位學術帶頭人,開展了480多個合作專案,此外,微軟亞洲研究院在多個研究領域中贊助了880個科研合作專案,與52所高校的1200多位教授保持密切的科研合作關係。

下面就讓我們來認識下,今年微軟亞洲研究院的幾個重點專案,但發現都和人工智慧相關,該領域即將迎來井噴?

1. 智慧花卉識別知識系統

你是一個植物學家嗎?如果不是的話,你一定會遇到在戶外看到一些鮮花卻叫不出它們的名字的情況,更不用說鮮花背後的故事了。不要著急,拍一張照片發給我們的Project Blossom系統,它會告訴你想知道的花卉知識。

植物分類是植物科學研究領域和農林業生產經營中重要的基礎性工作,分類依據包括花、葉、果、莖等。花卉分類是植物分類學的重要組成部分,用計算機對花卉進行識別和分類是近來植物學家、農林專家和電腦科學家正在聯合攻關的課題,其價值不僅僅在於專業領域,更是對公眾科普有著重要意義。

植物的分類系統是十分複雜的,界、門、綱、目、科、屬、種。對一張花卉圖片,區分不同種類花卉的資訊往往在於區域性細微處,如何從紛繁的分類中進行定位呢?微軟亞洲研究院多媒體搜尋研究組和中國科學院植物所合作,利用深度學習演算法和視覺注意演算法,運用260萬張花卉照片訓練深度模型,研發出了智慧花卉的識別和知識系統。計算機專家和植物專家在專案中的合作,可以發揮各自的強項,將系統的準確度不斷提升。

此次“智慧花卉識別”專案合作中,微軟亞洲研究院多媒體搜尋組的研究員結合深度學習演算法和視覺注意模型,藉助中科院植物所提供的260萬花卉資料庫,讓機器自動關注影象中關鍵區域,同時自動學習鑑別花卉的區分特徵,最終研發出了智慧花卉識別和知識系統。該系統拓展了計算機在花卉領域的感知能力,並能夠延展普通使用者對於花卉的認知深度。

研究組從海量花卉圖片中提取各類花卉特徵要素形成資料庫

2. 深度學習在健康、醫療監測中的應用

人一生中三分之一的時間都在睡眠中度過,睡眠質量無疑是衡量生活質量的重要指標。正常睡眠狀態的標準化分期包括清醒期、非快速眼動1期(N1)、非快速眼動2期(N2)、非快速眼動3期(N3)和快速眼動期(REM)。睡眠分析的研究對於睡眠的分析具有重要的意義。

中國用的分期標註是美國加州大學根據美國人的睡眠訊號劃分出來的。用此分類標準,在多導睡眠儀中自動的分期演算法,美國人的準確率為84%,中國人的準確率為50%。而且目前,中國醫院所有的多導睡眠分期的結果都為人工產生,耗費了大量的人力和財力。因此,急需一套基於中國人睡眠資料產生的正常睡眠狀態的標準化分期。智慧手環作為簡單方便的可穿戴裝置,可以基於內建感測器監測資料對病人整晚睡眠分期,並給出睡眠建議。但目前手環等產品因演算法正確率低,預測的結果與真實的預測結果相差很大。

 本專案將醫生的標準檢測結果和手環採集得到的資料進行整合,通過機器深度學習自動將訓練資料分期,最終可替代人工分期的工作。通過多導睡眠監測儀和智慧手環採集得到的各方面睡眠資料,將手環採集得到的心率訊號作為特徵(feature),醫生人工判讀睡眠分期作為標準(label),通過多層反饋神經網路(RNN)演算法進行機器學習,最終得到的演算法結果可以只需要心率資料等生物訊號即可判斷被試者的睡眠分期,從而代替了繁瑣的人工環節。同時,演算法的複雜程度和正確率相比於市場上同類水平的其他手環配套軟體有了很大的提升,針對快速眼動期,正確率為83%。本專案結果可應用於手環內部的睡眠演算法設計,未來研究還可以從睡眠分期的結果入手讓機器自動判斷受試者當晚的睡眠狀況。

目前,該專案已經取得一系列成果,專案論文“智慧手環的臨床有效性評估”在《世界睡眠醫學雜誌》發表,並且在第六屆睡眠醫學學術年會上進行了報告。該專案由微軟亞洲研究院和北京航空航天大學合作完成,作為專案負責人的許燕老師表示“作為高校青年教師,來微軟亞洲研究院和這邊的研究員合作,真的能碰撞出很多意想不到的火花!”

該專案是微軟亞洲研究院青年學者訪問專案“鑄星計劃”的一部分,該計劃旨在為優秀的青年學者提供在微軟亞洲研究院參與專案合作的機會。他們有機會加入不同的研究團隊,與微軟的頂級研究員進行半年的合作。該專案的最終目的在於幫助青年學者明確其長期研究目標。研究員與學者一對一的合作模式確保了訪問學者與其指導研究員之間的密切聯絡,以幫助其明確長期的研究方向。同時,該專案還可以為訪問學者提供國際一流的研究氛圍和指導。經過八年發展,到目前為止全國共有超過100名學者參與這一專案。調查顯示,大部分訪問學者對該專案體驗評價很高,且在結束訪問之後仍然與微軟亞洲研究院保持密切聯絡。

3. 智慧校園

早上7時,手機客戶端準時提醒校園大巴到站時間,催促你準時上課;下午3時,系統推送三項你可能感興趣的體育活動;晚上10時,手機為你呈現明日的課程安排及自習方案……在雲端計算、物聯網等新一代資訊科技蓬勃興起的今天,智慧校園的建設已經在許多高校火熱地開展起來。藉助大資料驅動的虛擬化和雲端計算平臺,中國科技大學正致力於打造一體化的數字化智慧校園服務系統,將教學、科研、管理、社交網路和校園生活充分融合。例如,基於社交網路資訊、校園郵箱資料、圖書借閱記錄等,該系統能夠精準地記錄並再現每個學生的生活方式,如入睡時間、飲食規律等,並通過網頁端呈現個人生活資料,針對每個學生的生活習慣給出具體性建議。此外,該專案還開發出一系列跨平臺的移動應用,如通過 “大巴時刻表”和校園地圖來幫助大一新生快速融入大學生活。

隨著專案建設的不斷完善,使用者行為資料日漸豐富,為研究者提供了良好的資料分析支援。通過密切合作,目前已經完成並投入使用的專案有 “掌上科大校園移動應用平臺”、“學生資料畫像系統”等。

在“智慧校園”平臺合作中,微軟亞洲研究院向研究組提供了強大效能的Azure雲平臺等基礎設施支援。Azure滿足了數以萬計的全校師生每日行為活動資料的計算需求。微軟亞洲研究院謝幸研究員和中國科大計算機學院老師對於相關問題的研究成果已經發表在了KDD, SBDMV, PDCAT等國際會議上。

同時,基於此專案,雙方聯合培養的多名研究生、本科生,通過微軟亞洲研究院進行實習,他們在資料探勘、機器學習、人工智慧等領域的能力有了鍛鍊與提高。

智慧校園平臺介面

智慧校園系統將根據學生最近借閱書目推薦相關書目

4. A-Eye: 支援實時卷積神經網路的智慧攝像頭

人類獲得資訊的主要渠道是視覺。基於卷積神經網路(CNN)的深度學習演算法在視覺識別領域的一系列應用中取得了巨大的成功,在有些領域甚至超越了人類。但是典型的深度神經網路引數多計算量大,所以影象識別主要在資料中心或者“雲”裡面進行。在沒有網路支援差或者僅靠電池供電的情況下,“端”無法獲得實時的高質量影象識別能力。 

A-Eye專案關注如何讓 “端” (比如手機或者機器人)獲得可媲美人類的視覺理解能力。為此,研究團隊研發了高效能智慧視覺晶片,可以廣泛應用在智慧安防,嬰兒和老人看護,戰場機器人,汽車和無人機等各種需要視覺智慧的領域。目前的攝像頭,主要完成記錄、儲存等功能。在攝像頭上加入A-Eye視覺晶片,就可以讓攝像頭具有視覺理解能力。比如,現在城市可能有成千上萬個安防攝像頭,如果這些攝像頭配備了A-Eye晶片,你就可以告訴所有的攝像頭同時尋找一個 “穿黃上衣背黑揹包的人” ,並且這個智慧識別是可以不漏過每一幀影象的。這在反恐形勢日益嚴峻的今天,是非常有意義的。再比如現在非常火的智慧家用機器人,可以用A-Eye晶片,來理解周圍的環境和物體,主動提醒異常行為的發生,如及時發現老人跌倒並採取行動,或者幫你尋找忘記的鑰匙。

該專案核心技術主要是模型壓縮技術以及針對深度神經網路定製的晶片架構。A-Eye專案在模型壓縮技術上面獲得了突破,把一個典型的模型壓縮了將近五倍,而且這個壓縮技術可以廣泛應用在基於深度神經網路的一大類模型上。定製的晶片架構,可以把卷積神經網路的效能發揮到極致。

微軟亞洲研究院硬體計算組和清華電子工程系一直在硬體加速領域保持合作。去年雙方一起開始研究怎樣把DNN做的更快。該專案的主要工作由清華團隊完成,微軟亞洲研究院的研究員在演算法及FPGA平臺和晶片結構方面提出了指導建議。

而A-Eye專案裡的姚頌和郭開元既是微軟亞洲研究院的實習生,同時也是清華大學電子工程系黨委副書記汪玉教授的研究生。值得一提的是,專案合作的論文 “Going Deeper with Embedded FPGA Platform for Convolutional Neural Network”,最近被可重構計算領域的頂級會議FPGA全文接收並將於2016年2月份在美國蒙特雷市(Monterrey)進行宣講。

5. 博物館文物數字化與展示關鍵技術

文物作為傳統文化的重要物質載體,蘊含著傳統文化的思想精華和道德精髓,是不可再生的珍貴資源。隨著中國智慧博物館建設的推動,文物遺產的科學保護成為博物館的重點工作物件。然而現有的文物遺產展示應用多受限於文物數字化採集技術的不足且展示手段的單一,因此亟需探索更為切實可行的方案。

本專案涉及文物數字化採集、編輯和視覺化呈現三個方面。文物數字化採集側重於針對不同種類的文物材質,例如絲綢、青銅器等,進行材質物理屬性的數字化建模。文物的數字化編輯包括提取文物自身的代表性元素,如整體幾何造型、區域性幾何造型等,以及基於文物的模型樣式提取和傳遞。文物的視覺化呈現則側重於設計喜聞樂見的互動展覽方式,更好的將原本的靜態文物呈現給大眾。

文物的數字化和視覺化具備廣闊的應用前途,除了文物本身的高保真展示外,基於文物要素的提取和編輯將為文化創意產品提供大量素材,大力促進文化產業的發展。此外,基於新型人機互動技術的文物展示將向遊客提供一種全新的觀覽文博的體驗,讓遊客能穿越千年,真正做到和文物“零距離對話”。

該專案由微軟亞洲研究院和天津大學合作開展,專案成果中的兩篇論文發表在ACM Transactions on Graphics上。此次科研合作中,微軟亞洲研究院首席研究員童欣為課題提供了關鍵技術指導,專案成員中陳國軍、李亮還是微軟亞洲研究院和天津大學的聯合培養博士。微軟亞洲研究院和天津大學這樣跨領域、跨專業的合作,不僅為研究專案提供了新思路,同時拓寬了高校人才培養渠道。

空間變化雙向反射材質的渲染效果

半透明玉器文物的數字化

對於文物,提取其區域性幾何要素和全域性結構資訊