NO IMAGE

計算機視覺、機器學習、自然語言處理、機器人和語音識別是人工智慧的五大核心技術,它們均會成為獨立的子產業。

  計算機視覺
 
  計算機視覺是指計算機從影象中識別出物體、場景和活動的能力。計算機視覺技術運用由影象處理操作及其他技術所組成的序列,來將影象分析任務分解為便於管理的小塊任務。比如,一些技術能夠從影象中檢測到物體的邊緣及紋理,分類技術可被用作確定識別到的特徵是否能夠代表系統已知的一類物體。
 
  計算機視覺有著廣泛的應用,其中包括:醫療成像分析被用來提高疾病預測、診斷和治療;人臉識別被Facebook用來自動識別照片裡的人物;在安防及監控領域被用來指認嫌疑人;在購物方面,消費者現在可以用智慧手機拍攝下產品以獲得更多購買選擇。
 
  機器視覺作為相關學科,泛指在工業自動化領域的視覺應用。在這些應用裡,計算機在高度受限的工廠環境裡識別諸如生產零件一類的物體,因此相對於尋求在非受限環境裡操作的計算機視覺來說目標更為簡單。計算機視覺是一個正在進行中的研究,而機器視覺則是“已經解決的問題”,是系統工程方面的課題而非研究層面的課題。因為應用範圍的持續擴大,某些計算機視覺領域的初創公司自2011年起已經吸引了數億美元的風投資本。
 
  機器學習
 
  機器學習指的是計算機系統無須遵照顯式的程式指令,而只依靠資料來提升自身效能的能力。其核心在於,機器學習是從資料中自動發現模式,模式一旦被發現便可用於預測。比如,給予機器學習系統一個關於交易時間、商家、地點、價格及交易是否正當等信用卡交易資訊的資料庫,系統就會學習到可用來預測信用卡欺詐的模式。處理的交易資料越多,預測就會越準確。
 
  機器學習的應用範圍非常廣泛,針對那些產生龐大資料的活動,它幾乎擁有改進一切效能的潛力。除了欺詐甄別之外,這些活動還包括銷售預測、庫存管理、石油和天然氣勘探,以及公共衛生等。機器學習技術在其他的認知技術領域也扮演著重要角色,比如計算機視覺,它能在海量影象中通過不斷訓練和改進視覺模型來提高其識別物件的能力。
 

  現如今,機器學習已經成為認知技術中最炙手可熱的研究領域之一,在2011~2014年這段時間內就已吸引了近10億美元的風險投資。谷歌也在2014年斥資4億美元收購Deepmind這家研究機器學習技術的公司。

自然語言處理
 
  自然語言處理是指計算機擁有的人類般的文字處理的能力。比如,從文字中提取意義,甚至從那些可讀的、風格自然、語法正確的文字中自主解讀出含義。一個自然語言處理系統並不瞭解人類處理文字的方式,但是它卻可以用非常複雜與成熟的手段巧妙處理文字。例如,自動識別一份文件中所有被提及的人與地點;識別文件的核心議題;在一堆僅人類可讀的合同中,將各種條款與條件提取出來並製作成表。以上這些任務通過傳統的文字處理軟體根本不可能完成,後者僅針對簡單的文字匹配與模式就能進行操作。
 
  自然語言處理像計算機視覺技術一樣,將各種有助於實現目標的多種技術進行了融合。建立語言模型來預測語言表達的概率分佈,舉例來說,就是某一串給定字元或單詞表達某一特定語義的最大可能性。選定的特徵可以和文中的某些元素結合來識別一段文字,通過識別這些元素可以把某類文字同其他文字區別開來,比如垃圾郵件同正常郵件。以機器學習為驅動的分類方法將成為篩選的標準,用來決定一封郵件是否屬於垃圾郵件。
 
  因為語境對於理解“timeflies”(時光飛逝)和“fruitflies”(果蠅)的區別是如此重要,所以自然語言處理技術的實際應用領域相對較窄,這些領域包括分析顧客對某項特定產品和服務的反饋,自動發現民事訴訟或政府調查中的某些含義,自動書寫諸如企業營收和體育運動的公式化範文,等等。
  機器人
 
  將機器視覺、自動規劃等認知技術整合至極小卻高效能的感測器、制動器以及設計巧妙的硬體中,這就催生了新一代的機器人,它有能力與人類一起工作,能在各種未知環境中靈活處理不同的任務。例如,無人機、可以在車間為人類分擔工作的“cobots”等。
 
  語音識別
 
  語音識別主要是關注自動且準確地轉錄人類的語音技術。該技術必須面對一些與自然語言處理類似的問題,在不同口音的處理、背景噪聲、區分同音異形/異義詞(“buy”和“by”聽起來是一樣的)方面存在一些困難,同時還需要具有跟上正常語速的工作速度。語音識別系統使用一些與自然語言處理系統相同的技術,再輔以其他技術,比如描述聲音和其出現在特定序列與語言中概率的聲學模型等。語音識別的主要應用包括醫療聽寫、語音書寫、電腦系統聲控、電話客服等。比如Domino抯Pizza,最近推出了一個允許使用者通過語音下單的移動APP。
 
  上述5項技術的產業化,是人工智慧產業化的要素。人工智慧將是一個萬億級的市場,甚至是10萬億級的市場,將會為我們帶來一些全新且容量巨大的子產業,比如機器人、智慧感測器、可穿戴裝置等,其中最令人期待的是機器人子產業。
 
  機器人應用的分法有很多種,從應用層面可以粗略地分為以下幾個類別。第一個類別是工業級機器人,像富士康這種公司已經運用得很好了,因為勞工成本越來越高,用工風險越來越高,而機器人則可以解決這些問題。第二個類別是監護級機器人,它可以在家裡和醫院裡作為病人、老人或孩子的護理,幫助他們做一定複雜程度的事情。中國對監護級機器人需求其實更迫切一些,因為中國人口紅利在下降,同時老齡化又不斷地上升,這兩個矛盾,機器人都可以幫助解決。因此,這個領域的需求在民用市場佔比很大。第三個類別就是探險級機器人,用來採礦或者探險等,大大避免了人所要經歷的危險。此外還有用來打仗的軍事機器人等。
 
  網路媒體Business Insider預測,機器人將在許多崗位上取替人類:電話營銷員、校對員、手工裁縫師、數學家、保險核保人、鐘錶修理師、貨運代理商、報稅員、影象處理人員、銀行開戶員、圖書館員、打字員等。因為它們的價格競爭力驚人。麥肯錫全球研究院的研究表明,當中國製造業工資每年增長10%~20%時,全球機器人的價格每年下調10%,一臺最便宜的低階機器人只需花費美國人年平均工資的一半。國際研究機構顧能預測:2020年機器人將導致全球新一波失業潮。
 
  同時,人工智慧技術的發展還將讓許多舊產業獲得改頭換面式的新生,其中最典型的是汽車產業。汽車產業已存在上百年了,其間的變革也是非常大的,但駕駛汽車的始終是人,可最近幾年,隨著谷歌等公司的大力投入,機器或者說某種自動化的系統已經有望取代人來駕駛汽車,從而形成一個市場容量巨大的新產業,即無人駕駛汽車產業。這個產業的規模也將是萬億級甚至是10萬億級的。而且,這個產業還將與新能源產業疊加、融合在一起,形成“車聯網+能聯網+網際網路+電動汽車”的複合產業——未來,我們會把插電式汽車和氫燃料汽車作為發電廠使用,從而使新能源汽車成為電網的一部分,成為新能源的供給者,與現在一些裝有太陽能發電系統的房屋是太陽能的供給者一樣。
 
  毫無疑問,與網際網路一樣,智慧技術會向幾乎所有舊產業滲透。華泰證券在一份人工智慧產業的研究報告中提及了九大行業:生活服務O2O、醫療、零售業、金融業、數字營銷業、農業、工業、商業和線上教育。實際上,將獲得新生的舊產業還有許多,如軍事、傳媒、家居、醫療健康業、生命科學、能源、公共部門……甚至包括受VR/AR(虛擬現實與增強現實)技術發展影響而產生的虛擬產業。