阿里巴巴的AI演算法程式媛是怎樣的一種存在?

摘要: 一個專注人臉識別技術長達11年的程式媛。

程式媛、AI、演算法、人臉識別、阿里安全圖靈實驗室……這些標籤任何一個都極具話題性,但如果一個女子同時擁有這些標籤,那會是怎樣的存在?

在見到於鯤之前,我的腦子裡是各種的想象,萌妹紙?御姐?還是?儘管於鯤說話語速有點快,但乾脆利落,邏輯清楚,所以“幹練”是她留給我的最深的印象。

阿里安全圖靈實驗室的AI演算法程式媛於鯤

在阿里巴巴這幾年的錘鍊,於鯤已經成長為國內人臉核心演算法領域的頂級專家。作為阿里安全圖靈實驗室的核心成員,研發了業界頂級水準的人臉識別技術和演算法,無論是1:1人臉比對還是1:N人臉搜尋的演算法,效果都在業內處於優勢地位。目前,線上的人臉比對核心演算法模型,就是於鯤和小夥伴們一起訓練和開發的。

不僅如此,於鯤還出色地緊貼業務場景,將技術成果完美落地。她主導了新零售(如未來美家、銀泰百貨、盒馬等)和其他1:N線下業務(包括園區門禁,菜鳥快遞取件櫃等)的人臉比對演算法;同時,還協同了1:1實人認證(手淘掃臉登入等)和1:N敏感人臉檢測(內部和綠網)等重要業務演算法的研發。

與使用者直接互動“很刺激”

2014年,於鯤接觸到阿里巴巴,然後被深深地吸引。

“我覺得實人認證和內容管控是非常有前景的,而且可以和終端使用者直接互動。”於鯤說,“這對於做技術的人來說,是非常有吸引力的,也挺有成就感的。”

於鯤認為,像是實人認證這種,如果技術層面沒有做好,就會導致體驗下降。但不管是技術原因還是業務原因,導致客戶的流程沒有走下去,使用者就會給到最為直接的反饋。比如掃臉登入,使用者的反應是最為直觀的,使用者所能接受的極限時間為2秒鐘,這對技術提出了極高的要求。

“對於技術人員來說,來自於使用者的直接反饋是一種最為難得的體驗。“於鯤強調。

由於演算法是偏後端的,所以和前臺使用者的互動,讓於鯤覺得是一種“很刺激“的體驗。

在於鯤眼中,阿里巴巴這種大平臺確實很吸引人。比如實人認證,規模很大,有數億人在使用。對於絕大多數技術人員來說,這並不是一個很容易得到的機會。

在阿里巴巴是一種全新的體驗

從2007年到現在,於鯤一直在做人臉識別技術的研究和開發。

從技術層面來看,於鯤算是輕車熟路,但這並不意味著前面是一片坦途。“對我來說,其實還是蠻挑戰的,因為需要角色有巨大的轉變。”於鯤說。

於鯤介紹,她之前一直在傳統企業做人臉技術的研發,但是到了阿里巴巴這種頭部網際網路公司後,需要對自己進行革新。包括企業的文化、工作的流程等,這些對於鯤都是全新的體驗。

“總體感覺是阿里的節奏非常快,開始還有些不太適應。”於鯤說。她覺得自己每天都是在小跑著前進,面對的業務比較複雜,對接的團隊也很多。每天多數時間都在開會中度過,基本上晚飯後的時間才是屬於自己的,此時才會坐下來做一些事情。“基本上,白天不是在開會就是在去開會的路上。“於鯤笑稱。

萬事開頭難。但通過不斷的交流和磨合,於鯤和小夥伴們越來越有默契,溝通越來越順暢,對業務也越來越瞭解,專案推動起來也就“得心應手”了。兩年之後,於鯤完全適應了這裡,適應了快節奏,適應了新環境。心裡也就自然而然地認為,“本來就應該是這樣的。”

“現在,如果是慢節奏,我反而不習慣了,會覺得是在浪費時間,浪費生命。”於鯤說,“工作就應該是這樣的。”

於鯤告訴我,她覺得到了阿里巴巴就是開啟了新的一頁,體會到了不同的人生。

程式媛並不是一種獨特的存在

阿里安全圖靈實驗的研究方向非常穩定,就是專注於計算機視覺、自然語言處理、機器學習和深度學習;其聚焦的業務也非常穩定,就是為手淘、天貓、支付寶、閒魚、優酷土豆、UC、阿里媽媽等核心業務線提供技術支撐,並對外輸出AI能力。因此,整個團隊也非常穩定。

阿里安全圖靈實驗室的部分技術同學

這幾年,於鯤一直在阿里安全圖靈實驗室。據她介紹,整個團隊有5個程式媛,3個Base杭州,2個Base北京。“我們團隊的氛圍特別好,大家在一起就是‘哥們兒’,會互相分享好的idea,像一家人似的。”於鯤說,“所有人同心協力,朝著同一個方向,同一個目標發力。”

於鯤認為,大家在團隊大目標之下,只有分工的不同,小夥伴們更多的是相互補位和背靠背的方式進行協作。“這個事情交給你,這個事情到此為止。就是這麼簡單的邏輯。”於鯤說。

於鯤笑著說,她之所以留著長髮只是想保留自己女生的特徵,但幹活兒從來沒有把自己當成一個特殊的存在,要享受特殊待遇。相反地,她認為自己從業的時間比較長,所以應該更多地去承擔一些事情。

有想法就盡情去發揮

團隊穩定與否,Leader很重要。這是於鯤的觀點。

在她眼中,阿里安全圖靈實驗室的負責人奧創是一個很有想法,有大局觀的人。正因為如此,整個團隊的氛圍很和諧,也沒有什麼職級之分。

於鯤還記得,某年的中秋節,奧創拎著大閘蟹來到公司,然後分給團隊的小夥伴們。“Leader有什麼事情,都會想到團隊成員,這非常棒!”於鯤說。

對比傳統企業和網際網路公司,於鯤也談了自己對於技術團隊的一些理解。她認為,團隊好不好,要看Leader有沒有遠見,有沒有前瞻性。傳統企業的技術團隊,Leader把任務拿來,然後給到團隊成員去落實,這是一種自上而下研發模式。但是在阿里巴巴不一樣,這裡是一種自下而上的模式,也就是說,組織的目標就在那裡,每個團隊成員都能看到,每個人能為這個目標做什麼?團隊成員是自發的,也就是阿里巴巴一直強調的自組織、自驅動,每個人都內心驅動。

“整個團隊都是這樣的,整個阿里也是這樣的。”於鯤說,“雖然有KPI的考核,但每個團隊都在思考還可以做些什麼?每個人也在想我可以做些什麼?這個力量是無窮的。”

於鯤認為,自上而下的指令,很多時候只是Leader一個人的思考,所以具體落地的時候可能結果並不好;但如果是自下而上,那麼每個人的想法都能得到充分發揮,每個人都會貢獻自己的智慧去為大目標做有益的工作,這是一種積少成多的力量。

“阿里巴巴的工作模式就是,有想法就盡情去發揮。”於鯤說。

演算法人靠“數字”說話

在阿里巴巴西溪園區,刷臉裝置已經替代了傳統的刷卡門禁,這就是於鯤和團隊小夥伴們的傑作。實際上,這是經過了內部激烈的技術PK之後,最終被阿里安全圖靈實驗室拿下的。

於鯤和小夥伴研發的人臉識別技術應用於阿里巴巴門禁系統

“演算法人是要靠數字說話的,誰的準確率高,誰就上。”於鯤告訴我,阿里安全圖靈實驗室研發的人臉識別系統在準確率方面拔得頭籌,因此才拿下了園區的門禁刷臉專案。

不僅在內部取得不俗的成績,在與外部友商的競爭中,阿里安全圖靈實驗室也順利拿下了某機場的安檢專案,而實驗室還通過阿里雲上的“實人認證”和“內容安全”兩大產品,服務了數萬家企業客戶。

“我們的業務都依託於我們的技術,因此,我們的技術並不是為了在某個競賽得獎而進行研發的,而是為了充分保障業務的順暢應用,為使用者提供極致的體驗。”於鯤告訴我,阿里安全圖靈實驗室實際上也經常會在一些大賽上斬獲殊榮,但通常情況下,這些都不過是技術小夥伴們做好業務專案之餘的“副業”而已。

於鯤告訴我,阿里安全圖靈實驗室的目標是要做最頂尖的演算法團隊,並保持領先的地位。

用技術改變生活

於鯤向我普及了一下人臉識別技術的發展簡史。

90年代初,手機還未普及,關於人臉識別的應用還非常初級,通常都是簡單的特徵分類,比如幾何或者灰度特徵。

2003年到2004年的時候,人臉識別技術開始轉向影象領域的傳統特徵,那時,更多的是需要看工程師對影象的理解,是非常挑戰的。不過,已經有一些比較初級的商業應用,比如一些考勤機。

到了2012年,深度學習進入到爆發期。隨著這一波的大發展,人臉識別也是獲益最為典型的應用之一。那個時候,不管是資料還是演算法,人臉識別都已經準備好了,可以隨時“起飛”。

最近的兩三年,人臉識別主要是在做使用者習慣的培養,畢竟還是有很多人不太能夠接受,但這個現狀正在發生著鉅變。比如掃臉支付、掃臉轉賬等,它們具備的便捷性是以往任何一種技術都無法比擬的。

於鯤告訴我,在人臉識別技術方面,中國是非常領先的,在使用者習慣的培養方面也是領先的。每年,國家在這一領域的科研投入,比如論文數量或專利數量在全球來看都是處於前列。

事實上,於鯤從事人臉識別技術的研究與開發已經11年,因此很多人都會奇怪她會不會厭煩了?或者說是否需要換一個方向?她並沒有這樣的想法。她認為,人臉識別並不是一個單點的技術,而是一整套的解決方案,除了方案本身,它底層的技術也是複合型的。

“人臉一直會在持續的變化,比如化妝、比如美容、比如衰老,比如光照等,這些都會導致人臉的變化。這些變化,遠比其他模型要複雜得多。這對於機器來說,是極大的挑戰。”於鯤說,“正因為人臉識別所具備的複雜性,所以才會有這麼長時間,這麼多人去研究。”

於鯤覺得,人臉識別是一個非常好的點,應用場景非常多,商業的可能性也很多,所以它能夠成為當前的熱點。

“這幾年人臉的應用越來越廣,其實並不是我們站在這個風口,而是說整個行業站在了這個風口。資本瘋狂追逐,各大公司也鉅額投入,這些都說明其市場前景巨大。”於鯤表示。

“我想能夠用技術服務大眾,真正的用技術改變生活,用技術去除惡揚善,這是我的夢想,相信也是每個技術人的夢想。”於鯤說。

原文連結

本文為雲棲社群原創內容,未經允許不得轉載。