NO IMAGE

計算機視覺相當於是人工智慧的大門,如果這個門不開啟,就沒有辦法真的研究真實世界的人工智慧。因為視覺資訊與聽覺觸覺相比要重要得多,人的大腦皮層70%的活動都在處理視覺資訊,如果沒有視覺資訊的話,整個人工智慧只是一個空架子,只能做符號推理(下棋,定理證明等)。

計算機視覺相當於一個研究領域,有很多問題要研究。而機器學習更像是一個方法和工具。
本身應當叫統計學習,方法都是從概率領域拿來的,但是機器學習領軍人物把統計和物理的數理模型,改名叫做機器,比如某某模型(model)叫某某機(machine);把一些層次模型(hierarchical model)說成網(net),搞出了許多機和網,就成了新的領域。
機器:統計模型。 學習:用資料來擬合模型。是計算機的人將統計的理論與方法應用到視覺、語音等領域,形成了機器學習這個模型。

機器學習與計算機視覺大概有60~70%的是重合的。

人工智慧是終極目標,讓機器像人那樣的思考、處理事情。

解決問題的過程:抽象成問題(表達),尋找演算法,實現。視覺是受任務驅動的,而任務是時刻在改變之中,我怎樣通過這千千萬萬的任務,而不是簡單一個分類,來驅動我的計算的過程,來找到我的需求,來支援我目前的任務,這是一個巨大的研究的方向 。

當你要去識別、分析一個模式,比如一個動物、人臉、 一個事件, 你首先要建立一個數理模型,這個模型通過資料來擬合,也就是當前的機器學習。那麼,判斷這個模型好壞,或者模型是否充分的一個依據是什麼?產生式建模的方法就是對這個模型隨機抽樣,也就是合成(synthesis)。