跳到主要內容

[科技]從痞客邦轉戰人力銀行,104第一位「數據長」呂承諭要帶隊追上國際品牌。


  數據的重要大家都知道,但是收集數據之後要如何應用,卻是一段漫長艱辛的學習過程。成立超過20年的104人力銀行,目前會員數超過650萬人、企業會員近32萬家,堪稱台灣最具代表性的人力銀行。今年初,104第一次設立「數據長」這個角色,準備好好從龐大資料中挖出更多金礦。

  「其實在十年前,數據就是很重要的事了。包含工作上做決策,甚至是業務和產品設計上,都會參考數據。」104首任數據長呂承諭說。

  笑稱自己「一輩子都在做data」的他,整個職涯的確都和數據牢牢綁在一起。呂承諭專長是資料探勘、社群網路和機器學習,過去曾任職於中研院資訊所博士後研究,後來在痞客邦待了五年。一開始,他是以資料科學家身分,負責開發痞客邦搜尋引擎和分群分類演算法。

  2013年,他接任痞客邦技術長兼大數據平台產品經理,串連城邦集團旗下如商業週刊、遊戲基地、美麗佳人等約20個網站的使用者資料,將數據運用在痞客邦的文章推薦和廣告推播。今年1月他加入104,正式成為這家老牌企業創立以來的第一位數據長,與資訊長臧柏皓、技術長林嘉軒、資安長陳啟昌和資深架構師呂昭寬等建立起緊密互動。

  「數據長在台灣比較少見,不過在國外,已經不是一個罕見的職位了。」他表示,104之所以設立數據長,就是為了善用手中大量數據來優化產品,提供更好的使用體驗。

  然而,只有將領一人還不夠。所以這半年來,呂承諭的第一個工作重點就是籌組數據團隊。目前,他帶領的團隊約20多人,成員包含12位資料工程師,以及具有統計、數學背景的6位市場研究數據專家。另外,還有四位博士級的資料科學家,他們分別擁有機器學習、自然語言處理和社群分析專長,「這三個領域,也是我們因應104未來的數據分析和工作項目所衍伸出來的。」

  第二個重點,則是為104補足彈藥,努力追上LinkedIn、Facebook、Google、Monster.com等國際品牌。

  呂承諭觀察,LinkedIn進入台灣市場已經有一段時間,但是並沒有成功發酵。「以104擁有的資料量,應該是遠遠超過LinkedIn在台灣的求職者。」此外,LinkedIn的求職者多半落在高科技相關產業的中高階人才,104的工作則遍及360行,因此光論台灣,104不管在履歷表數、職缺數和媒合數都是遙遙領先。

  不過他也坦言,104在使用者介面設計、數據分析和演算法推薦等產品設計方面「還是有落差」。「相較於他們在數據方面提供的優質服務,104還有一段路要追。」他指出,今年上半年,他和數據團隊就是專注找出「下一代的104」在資料科學和數據分析上應該要提供什麼樣的服務,才足以迎頭趕上國際競爭對手,並且幫使用者找到更好的工作。

  接下來的路依舊不輕鬆。未來六個月,呂承諭帶領的數據團隊有兩項任務。

  首先,他們要將800萬會員和近百萬個有效職缺快速做出語意分析和媒合。「在求職媒合的演算法中,有一些基本的profile包含性別、年紀、學歷和經歷。學歷又可以細分到高中以後的學歷,經歷就是他進入職場之後,是在哪一個產業、哪一個職務、服務多少期間。」除了個人資料,還會衍伸到性格取向和社交圖譜(Social Graph)。「舉例來說,我們經常聽到交大幫、成大幫、台大幫。甚至在你的Social Graph裡面可能還有前同事、社群上的好朋友,這些對於你的媒合其實都有影響力。」

  其次則是運用數據優化產品,簡化使用者找工作的流程。「打個比方來說,每個人在使用Google搜尋的時候,相信應該很少人會看超過第五頁甚至第三頁以後的結果。」他說:「我們有做了一些努力,但是並沒有做到最好。所以很多求才、求職者在我們預設的平台上,可能要看超過三頁以上。這是我們該努力的目標。」

  「104上面,沒有一筆資料來自本身,全部都是由這個社會貢獻的。」呂承諭指出,為了回饋國內開發者,104將在下周舉辦首場公開黑客松,在不洩露求職者個資和企業資料的前提下開放數據。據了解,目前已經有三百多人報名。「我非常期待!」他興奮說。

這個網誌中的熱門文章

[娛樂]玩了多年的撲克牌,其實背後是結合工程、歷史、設計的大學問!

  全世界各地的人們都知道撲克牌,也都有和撲克牌打過交道,幾乎每個地方都宣稱撲克牌是自己的發明成果。中國人認為撲克牌最早起源於十二、十三世紀南宋時期傳出的中國的葉子戲(按照四季分為四種類別)。法國人則認為撲克牌是由塔羅牌演變而成,而英國人則表示自己是在所有經過認證的記錄資料中最早提到紙牌遊戲的國家。   現在,大家可能都知道怎樣玩「二十一點」或者是橋牌,但很少有人會靜下心來想一下,一副撲克牌其實是工程學、設計和歷史多方面融合而成的一個奇蹟。撲克牌不僅是一種休閒娛樂時的消遣工具,也是高額賭博和魔術技巧的練習和展示工具,不僅是一種數學概率模型,甚至有時候也會被當作貨幣或者是機密訊息的傳播媒介。   在這個過程中,撲克牌不同起源的獨特之處也展現了出來。撲克牌的名稱、顏色、標誌和設計根據不同的出處以及玩家不同的想法而發生變化。這一張張的圖形卡片不僅僅是玩具,或者是工具,他們更是展現不同習俗的一種文化印記:   有關撲克牌的誕生地一直眾說紛紜,外界也沒有達成一個確定的共識,但就像火藥、茶和瓷器這些發明一樣,幾乎可以肯定的是撲克牌也是起源於東方。國際撲克牌協會(IPCS)主席 Gejus Van Diggele 也表示:「學者們和歷史學家對撲克牌的確切起源存在分歧,但他們普遍認為撲克牌是由東方向西方進行擴散傳播的。」   中國唐朝時期有史料提到了一種紙牌遊戲,雖然這種遊戲更像是現在的多米諾骨牌,但專家認為這是有關紙牌最早的書面記載材料。歐洲 14 世紀末期的一些參考文獻曾提到一種「撒拉遜人(阿拉伯人的古稱)玩的遊戲」突然傳入歐洲,這表明紙牌不是來源於中國,而是來自阿拉伯半島。   此外,還有一種說法是,紙牌最早是由游牧民族從印度帶來的一種能夠預測命運的卡片,為紙牌的起源打上了更為久遠的一個印記。但無論是哪一種起源,應該都是有一定的商業契機促進了紙牌在遙遠的東方與歐洲之間的傳播,與此同時印刷技術的發展也加速了紙牌跨國界的生產和傳播。   在中世紀的歐洲,紙牌遊戲多是與喝酒、賭博還有其他的一些陋習聯繫在一起。由於紙牌遊戲傳播的廣泛性,以及它給當地所帶來的破壞性,當局決定禁止紙牌遊戲。歷史學家 Michael Dummett 在他的《塔羅牌遊戲》一書中提到了巴黎的一項法令,禁止公民在工作日玩紙牌。後來,紙牌遊戲被教會視為異端邪說,傳教士也紛紛遊說,認為「...

[開發]如何讓 Unicode 圖案 (特殊符號) 在網頁上正常顯示?

展示了許多可以取代網站小圖示的 UNICODE,其優點非常顯而易見: ① 字元的傳輸量遠低於圖片的傳輸量。 ② 可以減少許多小圖示的 http 請求量。 那麼接下來的問題會是,要怎麼讓網站所使用的 UNICODE 表情圖案、特殊字元,都能讓所有訪客看到呢? ⑴ 符號數量。 符號數量越多,代表字型檔案越大。目前 Unicode 各國文字的數量太多先略過,屬於圖案的部分超過一千個,持續有新圖案推出。 ⑵ 編碼為 UTF8。 1 2 3 4 5 <!-- HTML4 --> <meta http-equiv= "Content-Type" content= "text/html; charset=utf-8" > <!-- HTML5 --> <meta charset= "utf-8" > ⑶  使用方式 使用 Unicode 的話,這一切就能懶人化,先查閱 Unicode 特殊符號一覽表,找到對應的圖案,例如西洋棋黑騎士圖案,那麼在網頁想顯示的地方,直接擺上 Html 代碼: 1 &#9822; 輸入以上字元就行,但是為方便維護,建議還是將該內容直接貼上「♞」。 注意:在使用不同的字體時,渲染出來的符號可能會有所不同,因此,iOS 和 Android 將一些unicode字元轉換為表情符號。在您使用這些 unicode 字元之前,最好測試一下它們,確定不會出現在不同瀏覽器表現不同的情況出現。

[特攝]網友票選《最帥特攝俳優》你知道這些人氣男星都是超級戰隊英雄出身的嗎?

  網路資源還沒那麼發達的小時候,第四台能看的日本節目其實很有限,偶爾轉到忍不住停下看的特攝作品也成了接收日本文化的媒介之一。如果說拍攝泳裝寫真是日本女星的必經之路,那麼校園劇和特攝日劇應該就是大部分男星的跳板了,尤其《假面騎士》根本等同"爆紅速成班"一樣主演男星幾乎都大紅,但別忘了《超級戰隊系列》也捧紅不少線上人氣俳優。最近日本網站就請網友們從戰隊英雄出身的俳優中票選了一下覺得最帥的戰隊英雄,大家又會第一個想到誰呢?   第10位:山田裕貴(海賊戰隊豪快者)。   第9位:金子昇(百獸戰隊牙吠連者)。   第8位:白川裕二郎(忍風戰隊破裏劍者)。   第7位:中尾暢樹(動物戰隊獸王者)。   第6位:志尊淳(烈車戰隊特急者)。   第5位 永井大(未來戰隊時間連者)。   第4位:千葉雄大(天裝戰隊護星者)。   第3位:玉山鐵二(百獸戰隊牙吠連者)。   第2位:橫濱流星(烈車戰隊特急者)。   第1位:松坂桃李(侍戰隊真劍者)。   真的好多都是日劇演紅之後才驚覺他們有演過特攝作品的俳優,也更讓人想回去重看這些出道作品呢。