熱播影視劇《親愛的,熱愛的》中的韓商言,癡迷網絡安全大賽,組建戰隊立志要為中國奪得冠軍。現實中也有一位像韓商言一樣的年輕人,上周,他與大安全-風險與決策中心幾個小伙伴一起代表螞蟻,在素有AI數據挖掘屆「世界杯」之稱的KDD CUP 2019中獲得第一名。1600支隊伍參賽,來自30多個國家,而冠軍是中國的。網友評論:這才是真正大結局。
這位現實版韓商言叫文烽,河南禹州人,圈內人稱赤子。用「赤子之心」來形容他對比賽的熱情,也一點都不為過。他畢業于哈爾濱工程大學通信工程專業,不是計算機科班出生,但畢業后靠自學參加國內外各項比賽,成為數據挖掘領域的一匹黑馬。
一位非科班出身、自學成才的人是如何成長為帶隊拿下世界冠軍的技術大牛?除了在本職工作之余參加國際比賽,支付寶安全實驗室又有哪些不足為外人道的「業余愛好」?我們帶著這些問題去和文烽聊了聊。
從小白到黑馬,認準一條道就要走到敞亮
文烽今年27歲,讀書時他還沒有接觸過數據挖掘,直到畢業后,有次無意中在知乎看到有人討論數據競賽,從小熱愛數學的他想「這不正適合我嗎」,從那時起,他把所有的空余時間都投入到這件事上,每天在機房里摸黑自學5個小時以上,借著電腦屏幕的熒光看書,靠在手機網絡上搜羅到的資料從0開始一點點探索數據世界。
這樣的日子持續了一年多,所有人都不理解他的做法,輔導員專門找他做心理疏導,話說得很重,判定他「背景不好,智商不行」,還拿出自己的例子勸文烽不要鉆牛角尖,「我上大學的時候還得過建模一等獎,你又有什么成績,想靠數據建模養活自己純粹是想當然」。
文烽不服氣,心里雖然也沒底,但認準了總要闖出點名堂來。那時候他甚至不太會寫代碼,2017年3月第一次參加比賽,是當時國內規模最大的數據競賽DataCastle,他拿著用excel做的數據模型就參賽了,靠基礎功能處理復雜的題目,一邊比賽一邊學寫代碼,最后竟也斬獲全國第三名。
此后就一發不可收拾,橫掃國內外10余項數據大獎,在擁有超過100萬注冊的國際頂尖數據競賽平臺Kaggle上積分排名世界前列。Kaggle里只有150人擁有Grandmaster頭銜,文烽就是其中之一。入選時他26歲,正式開始打比賽不過一年,就已經成為當時國內最年輕的特級大師之一。
專注比賽,意外收獲事業和伙伴
比賽取得的成就給文烽在數據挖掘專業方面帶來更大信心的同時,也激發了他想要找到一個能夠發揮自己更大價值的舞臺。技術只有給社會帶來價值才更有意義。在此同時,螞蟻金服的大安全團隊拋來了橄欖枝,希望跟他聊一下。在溝通中,文烽了解到了支付寶在做的事情,就是通過數據挖掘的技術來守衛上億用戶的萬億資金安全。此時他的心被點燃,最終經過層層面試,加入了大安全的模型團隊。
當時的面試官之一,也是他后來的隊友鯤中邀他一起組隊參加2018年的KDD CUP。
事出突然,他們倉促準備了下,中途參加比賽,首次參賽就取得不俗成績,把兩項大獎收入囊中。
工作中,文烽負責欺詐風險模型搭建,教會機器判斷交易是否存在詐騙風險,根據風險等級攔截交易或發起彈窗、人工致電等提醒。目前支付寶的交易風險率低至1/10000000(千萬分之一),大安全的風險與決策中心團隊便是背后的主要功臣之一。
現在在本職工作之余,文烽和同事還會利用周末時間集訓,一起參加比賽,因為安全實驗室歷來有這樣的傳統,除了守護支付寶用戶的安全,也會把安全技術運用于各類場景,惠及整個行業。比如支付寶非攻實驗室,便因為屢屢發現微軟、谷歌等的平臺級漏洞,使漏洞能第一時間修復,多次收到對方的感謝信。非攻實驗室還曾在騰訊的漏洞提交榜上排年度第一,避免了用戶因為這些漏洞被黑客攻擊。
不僅冠軍頭銜和能發揮所長的工作,打比賽給文烽帶來最寶貴的收獲還是認識了一群志同道合的朋友。比賽中他認識了最佳拍檔「植物」,在數據圈內他倆難逢敵手,有人戲稱,只要赤子和植物組隊出戰,那其他參賽團隊就只能爭第二,這次到好,倆人不組隊別人就只能爭第三了。
相對于當年那個彷徨被人質疑的他,小伙子現在已經更加堅定和自信了,獲得KDD CUP冠軍后,文烽說,想寫信給當時為他做心理疏導的輔導員,講講自己近況,告訴他,不要用傳統的眼光去看待全新的道路,「數據挖掘這條路,我走對了」。