數據的重要大家都知道,但是收集數據之後要如何應用,卻是一段漫長艱辛的學習過程。成立超過20年的104人力銀行,目前會員數超過650萬人、企業會員近32萬家,堪稱台灣最具代表性的人力銀行。今年初,104第一次設立「數據長」這個角色,準備好好從龐大資料中挖出更多金礦。
「其實在十年前,數據就是很重要的事了。包含工作上做決策,甚至是業務和產品設計上,都會參考數據。」104首任數據長呂承諭說。
笑稱自己「一輩子都在做data」的他,整個職涯的確都和數據牢牢綁在一起。呂承諭專長是資料探勘、社群網路和機器學習,過去曾任職於中研院資訊所博士後研究,後來在痞客邦待了五年。一開始,他是以資料科學家身分,負責開發痞客邦搜尋引擎和分群分類演算法。
2013年,他接任痞客邦技術長兼大數據平台產品經理,串連城邦集團旗下如商業週刊、遊戲基地、美麗佳人等約20個網站的使用者資料,將數據運用在痞客邦的文章推薦和廣告推播。今年1月他加入104,正式成為這家老牌企業創立以來的第一位數據長,與資訊長臧柏皓、技術長林嘉軒、資安長陳啟昌和資深架構師呂昭寬等建立起緊密互動。
「數據長在台灣比較少見,不過在國外,已經不是一個罕見的職位了。」他表示,104之所以設立數據長,就是為了善用手中大量數據來優化產品,提供更好的使用體驗。
然而,只有將領一人還不夠。所以這半年來,呂承諭的第一個工作重點就是籌組數據團隊。目前,他帶領的團隊約20多人,成員包含12位資料工程師,以及具有統計、數學背景的6位市場研究數據專家。另外,還有四位博士級的資料科學家,他們分別擁有機器學習、自然語言處理和社群分析專長,「這三個領域,也是我們因應104未來的數據分析和工作項目所衍伸出來的。」
第二個重點,則是為104補足彈藥,努力追上LinkedIn、Facebook、Google、Monster.com等國際品牌。
呂承諭觀察,LinkedIn進入台灣市場已經有一段時間,但是並沒有成功發酵。「以104擁有的資料量,應該是遠遠超過LinkedIn在台灣的求職者。」此外,LinkedIn的求職者多半落在高科技相關產業的中高階人才,104的工作則遍及360行,因此光論台灣,104不管在履歷表數、職缺數和媒合數都是遙遙領先。
不過他也坦言,104在使用者介面設計、數據分析和演算法推薦等產品設計方面「還是有落差」。「相較於他們在數據方面提供的優質服務,104還有一段路要追。」他指出,今年上半年,他和數據團隊就是專注找出「下一代的104」在資料科學和數據分析上應該要提供什麼樣的服務,才足以迎頭趕上國際競爭對手,並且幫使用者找到更好的工作。
接下來的路依舊不輕鬆。未來六個月,呂承諭帶領的數據團隊有兩項任務。
首先,他們要將800萬會員和近百萬個有效職缺快速做出語意分析和媒合。「在求職媒合的演算法中,有一些基本的profile包含性別、年紀、學歷和經歷。學歷又可以細分到高中以後的學歷,經歷就是他進入職場之後,是在哪一個產業、哪一個職務、服務多少期間。」除了個人資料,還會衍伸到性格取向和社交圖譜(Social Graph)。「舉例來說,我們經常聽到交大幫、成大幫、台大幫。甚至在你的Social Graph裡面可能還有前同事、社群上的好朋友,這些對於你的媒合其實都有影響力。」
其次則是運用數據優化產品,簡化使用者找工作的流程。「打個比方來說,每個人在使用Google搜尋的時候,相信應該很少人會看超過第五頁甚至第三頁以後的結果。」他說:「我們有做了一些努力,但是並沒有做到最好。所以很多求才、求職者在我們預設的平台上,可能要看超過三頁以上。這是我們該努力的目標。」
「104上面,沒有一筆資料來自本身,全部都是由這個社會貢獻的。」呂承諭指出,為了回饋國內開發者,104將在下周舉辦首場公開黑客松,在不洩露求職者個資和企業資料的前提下開放數據。據了解,目前已經有三百多人報名。「我非常期待!」他興奮說。