2015阿里實習生面試經驗–資料探勘崗

NO IMAGE

本人小碩一枚,於2015年5月5日在廣州參加了阿里的資料探勘工程師面試,幾經波折,在此分享個人的面試經歷,給各位看官墊墊腳,希望你們順利。

筆試題:

筆試20題選擇,3題附加。選擇應該是所有技術崗一樣的,包括程式設計基礎,智力題,基礎概率統計等。附加題每個職位不一樣,資料探勘前兩題吹水的簡答題,第三題要求寫程式碼。

一面:

一面面試官比較隨和,面試以一種聊天的方式進行。

1、聊了一下專案。我的專案主要為了做學術,寫論文。我儘量往我學到的知識技能上面引,避免跳進學術細節的坑。

2、機器學習看過那些資料,覺得怎麼樣。

3、異常檢測,時序資料異常檢測。

4、lasso有什麼用。

5、LR和SVM的區別和特點。

6、阿里移動推薦演算法比賽的事情。

7、一些關於Python的問題,dict 和 函數語言程式設計(lambda, map(), filter()),函數語言程式設計我用很少,就跳過了。

8、場景題:阿里聚划算的很多團購專案還是人工挑選,如何資料探勘實現自動挑選。

二面:

二面面試官應該級別比較高。聊起來內容比較隨意,但是中間隨時打斷我,問我問題,也稍微嚴肅一點。自我介紹完,他就讓我挑自己擅長的機器學習演算法講。

1、講了一遍Tree based learning。這個是我自己選的,當時覺得講線性模型有點Low,想更多展示自己。講的內容包括CART, Bagging, Random Forest, Boosting Tree。主要講演算法原理,優缺點。這個佔用了大部分時間,但是還是時間原因,沒講完全。

2、繼續聊了一些我的專案。依然不能往論文細節裡跳,主要強調我學到了什麼,用了什麼有用的工具。(站到考官的角度想)

3、K-means聚類。講了演算法原理和應用,問我實際中怎麼用這個演算法的,效果如何。 

4、比賽為什麼用GBRT,效果如何,有沒有用Random Forest。

5、我在比賽過程中,對做資料有什麼體會,學到最重要的東西是什麼。

6、最後考一道益智類的題目,考查你解決問題能力的,與專業知識無關。

總結:

感覺阿里既看重演算法原理的掌握,又重視你是否有實際使用過。只學理論是不夠的,最好在專案中有實際應用,不然有時間多去刷刷比賽,阿里資料大賽,kaggle等等,最近kdd cup也剛開始。

大概就是這樣,以上的問題我都沒給答案,一方面因為我怕自己的答案誤導你們,另一方面如果你有心就要自己去找學習資料,自己領悟。筆者與昨天收到阿里HR哥哥的電話,商量實習時間。能去一家自己喜歡的公司,做自己感興趣的方向,真的很幸運。筆者以後要好好努力學習,跟大家分享心得。希望筆者的這篇處女貼能對你有所幫助。