轉換資料分析跑道 — 在美國科技公司內轉資深資料科學家的流程與學習

Henry Feng
Oct 29, 2023

前言

從2022年四月開始,我從亞馬遜第二個組別(硬體組)轉組回到公司內部廣告科技相關的產品組,開展了我從資深商業智能工程師 (Senior Business Intelligence Engineer — Sr BIE) 轉換工種到資料科學家(Senior Data Scientist)的旅途。相較於兩年前的升職經驗,我本來以為我已然駕輕就熟於公司內部階級職缺類型的轉換,但這一路以來的感受卻比升職踉蹌和波折許多,走了些彎路也進入一些低谷停駐不前,但最後總算在一年半的衝撞與磨練後,走到了我在2021年升職時給自己設定的職業目標,走入「資料科學」這個大堂。雖然大家都說自身的學習、工作上的影響力與職缺頭銜沒有非得要掛勾,但也不能否認成功轉換頭銜是一種公司內部體制的肯定,也算是過了一個職涯上的坎,得以踏足於此去看更不一樣的視野吧!

Photo by Shahadat Rahman on Unsplash

一開始先跟大家分享我為什麼想要轉職資料科學家的幾點思考,這或許並不適用於所有分析師,會隨著人的特質和在不同的人生階段而會有輕重緩急的差別,但或許讀者可以從我的思考脈絡中找到一些有幫助的點。

1. 「資深」作為公司晉升的終點/中點:在我們公司,Senior是level 6,大多數的主管階層也是以第六級為主,往上升到Lv7就是Principal level或是Senior manager了。而絕大多數的人要晉升到Lv7,往往需要很多的運氣、所在組別的規模、待的時間夠長跟政治角力折衝下的時機點,尤其以我的職缺「商業智能工程師」,整個公司principal level印象中屈指可數,由此可以知道當「資深」成為公司爬梯的終點,轉換不同的跑道或是成為管理職就成為可以在職涯上有所拓展的考量了,也是一個將體制內終點的局面轉換成中點,而可以繼續成長和學習的方式。

2. 商業分析師的侷限性:以後會在寫一篇我覺得分析師和科學家的差異,但簡單來說,分析師的邊界我在將近三年的工作跟不同組的體驗後,我自己感覺我已然看到甚至觸摸到這個職缺的邊界,說到底可能就只是同樣的技能點跟工作範疇換到不同的組別跟支援產品的差異了,尤其我擔任商業分析的組,很多都是支援的角色居多,對於指標數據往往是最後落後指標(output metrics)的追蹤,很少機會可以真正敲動到領先指標(input metrics),我做的分析往往成為「Nice to have」而不是「must have」,更遑論對於產品本身有決定性的影響跟主導性了(ownership),我們公司是產品經理主導的文化,不像Meta或Airbnb資料從業人員有大一點的發聲權,所以我自己的體感經驗是資料科學家或多或少可以化分析師的被動與支援角色成為更主動和與產品經理稍稍平起平坐的關係。而我自己也一直渴望在工作軌跡上離產品更加迫近,所以轉換跑道真的只是時間早晚的問題了!

3. 獨立貢獻者與主管的權衡:回扣到第一點,很多到資深Lv6的BI engineer往往會選擇成為管理職(BI Manager) 而隨著團隊和影響力變大進而成為資深商業分析經理(Sr BI Manager/Head),這即是獨立貢獻者(IC)與管理職(Manager)的選擇了!而我沒有想要立刻成為管理職的原因除了我個性比較內向、需要花費很多力氣進行社交外,我也想要在資料科學的領域多往深處探索,作為獨立貢獻者可以探索跟建立自己對於資料科學領域的獨特點和較深較廣的專業經驗,讓我在某個領域(廣告科技)可以有自己的聲音和拿得出手的專案!依照我在公司內的觀察,可能基於技術點的廣泛程度不同,資料科學主管可以同時帶領資料科學家和分析師,而分析主管通常只能帶領分析師,所以多培養一些技能點跟走到那個位子還是會有一些差異。最後一個小點是我自己的年紀考量,想說自己還年輕可以多累積hand-on的實務經驗、打磨自己的硬技能,畢竟有片面觀察到很多成為主管的人就不太寫程式或是建立模型了,思忖可以延遲一下這天的到來。

內轉過程中的五個學習

熟悉流程

如同我之前分享升職相關的學習,在一定規模的科技公司爬梯子、轉職、轉組等職涯相關的行動都已經有行之有年的流程與規範,因此如果要進行職位內轉首要工作絕對是了解流程和最基本的需求,像是步驟、所需文件、條件和審核者等等。以下講講我的認知裡,要從同職等的商業分析師(BI Engineer) 轉換成同職等的資料科學家(Data Scientist) 需要什麼流程。 首先,務必詳讀職位準則/Role Guidelines,通常職位分野明確的公司都會有各式職缺的職位準則,每個職缺會有對應的硬技能(例如程式語言、軟體工具等)、軟技能(哪種類型的分析、規劃產品藍圖、營運管理等)還有每個職級的專案需要影響的範疇(組織內、大組之間甚至跨大組的影響力評估),這給我很明確的方針去審核目前手邊負責的項目有沒有達到某職級某職缺最基本的要求,還有現狀和準則裡描述的差異大小。有了這層按照準則的評估後,職缺轉換成資料科學家在我們公司有兩種途徑。

第一個途徑是直接面試不同組的資料科學家空缺。最直接轉換職缺的方法是透過公司內部職缺系統找到有開資料科學家缺的用人主管,經過完整的面試流程最快完成轉換。通常這種流程會跟從外面招資料科學家一樣的關卡,測驗候選人行為面試和資料科學的深度與廣度,走這樣流程的商業分析師候選人通常已經在原組有一定資料科學的專案經驗或是相關面試準備的較充足,可以透過幾輪面試直接完成職缺轉換。由於我在原本組別沒有太多資料科學專案與建模的經驗,我不太敢直接走面試流程,因此就選擇走第二條路。

第二條途徑則是先以原職缺(商業分析師)的身分轉入以資料科學為主/有資料科學職缺的組別,跟主管合作累積符合職位準則的專案數個(提供三個Working Samples),完成這些專案後,主管會找一個組外的評估者(Accessor)閱讀你的專案和相關技術文件,如果評估者覺得符合資格,就可以核准轉換;如果不符合資格就會退回,那就要繼續進行其他專案直到評估者覺得有到達該職級「資料科學家」的條件為止。評估者核准後,接下來就是部門總監核准跟HR進行相對應的行政流程,最後就完成轉換啦!

由第二條路徑可以得知,最困難的地方是執行蒐集專案證據證明欲轉職者的能力和影響力已經達到「資料科學家」的門檻,並且通過評估者嚴格的審核。我自己的經驗是我在今年年中有試圖闖關,想要用已分析和執行的專案得到評估者的核准,但不幸被退回,所以得要重新做不同的研究和執行不同的資料科學專案,在第二次的評估中才通過審核。因此以下的學習也是針對這第二條路徑我一路走來的一些學習可以給想要在大公司內部轉換資料科學家的讀者一些參考和借鑑。

不同職缺的心態轉換

沿著第二條路徑在我第三個公司內組別努力拚轉職之際,我花了一些時日調整作為一名「商業智能工程師」和「資料科學家」的心態,畢竟我已經在BIE的位子上做了接近三年,大多數的工作習慣與思維模式都是很「分析師」導向的,儘管在硬技能上面的使用沒有差異太多(都是以SQL、Python為主),但沒有將心態轉換過來做事,的確讓我在一開始吃了一些苦頭。

在這裡舉兩個心態面的例子。

比如說,做為一個資料科學家不能「做事情做得太快」。過去我做分析師的時候,往往產品經理一個需求過來,我很快就能定義問題、取得相對應的數據和把數據呈現的發現寫出來,建立資料的ETL流程然後自動化報表也是彈指之間的事情。但在資料科學的專案裡面,做太快反而對於專案的深度與廣度是有害的,如果還抱著分析師的工作習慣只是把數據快速取得、回饋給客戶,那麼分析的結果往往無法引導至好的結果或是建議。資料科學家的工作是一個斟酌打磨的過程,要花很多時間去淘選雜訊,找到一些微小的機會點,用不同的方法去驗證機會點真實存在,並思考怎麼溝通這些發現,進而創造最大的影響力。

又比如說,作為一名資料科學家可以相較BIE少一點「長期主義」的工作思維。過去做BIE的工作時,面對大多數的報表工作時,在撰寫SQL查詢指令和建立資料Pipeline時,往往都要考量查詢指令的優化跟怎麼確保整個資料獲取自動化過程可以順利地長期運作下去,讓日/周/月報表盡可能無礙適時呈現資料給使用者,也會要設立一些警示系統如果資料上游出現問題等 — — 是一個較長遠資料流程的系統建構流程。但作為資料科學家在真正進入模型之前,可以稍稍放下對於長期主義的堅持,因為分析的數據往往就是以天或是星期為單位,可以用比較野蠻的方法取得數據,不太需要太考慮下游使用者,畢竟不像BIE時期,下游使用者是每周都需要有穩定性的資料進行決策。

以上是兩個小例子,也是分享給讀者一些心態面上的準備,轉換的過程是一個動態調整,同時要放下一些過往習慣的堅持,但又要同時有意識提醒自己需要裝備某些心態!

系統、統計模型與Production

在聚焦各種資料科學專案一年半以來,這三個面向是我主管訂出我需要達到的目標跟真正可以展現出一位資料科學家縱深的要求。前兩者是必須,最後一項是選擇性的,如果可以有Production的專案經驗會很加分。這三項也同時是我們公司內部資料科學家與BIE的技術與專案性質上的分野 — — 這是我自己轉換過程中依照感受和挫折程度自定義的,也鞭策自己在這三點到達一定的門檻。

一名資料科學家需要對於系統有很深度的了解。過往在做分析的時候,往往追蹤的是落後指標(output metric),像是廣告科技領域裡面的營收、曝光、Cost Per Click (CPC)等等,即使往上追溯到領先指標往往也是往上幾層而已。但身為一個資料科學家,如果要發現可以調整優化的機會點,往往要深入系統,用更細緻的資料點去找出差異和洞見,比如說CPC,就要去了解到底是哪些模型和參數的計算最終導致某一個點擊的收費是這個數字,往系統更深層去看每個步驟的公式和動態去找有機會可以敲動的點;又比如說一次的曝光:我們看到的結果是這個廣告秀出來在網站上面,得到一次曝光,那究竟這個廣告是經過哪些步驟,從被廣告主設置開始,走過哪些系統的淘選和競爭,最後得以在這個板位這個時間點秀出來。因此做為一個科學家你要看進去的數字是更大量級的Log data,就是要從這些具體而微的資料海中,找到系統的可優化點,產出建議。

一名資料科學家也要嫻熟於統計模型,並且可以熟練的運用統計知識庫解決問題,不一定要到那種看起來很酷炫的機器學習模型,而是針對一個問題,可以了解不同的統計概念和模型進行分析,並且找到最適切解釋資料邏輯的工具,並且闡述作為科學家做出各種權衡(trade off)的結果。這邊想要強調的是有別「系統深度」外,一名科學家對於當代分析技巧「廣度」的掌握。

最後一個加分項是Production,這個其實有點是亞馬遜「Applied Scientist」的要求了。即是你要讓程式碼不是只是一個線下分析用,而是他可以進入到後端系統運行、產出數據、訓練模型、真正在系統裡面影響產品,而這個部分往往需要跟工程師開展合作,讓專案經過重重測試和實驗最後真正可以啟動進入產品中。

身為資深科學家的影響力、洞見、建議、行動項目與寫作

剛剛提到的系統、模型與Production偏向科學家核心技能的闡明,而當我們展現出系統的深度、模型的廣度和production的實踐性後,真正重要的是這些分析的結果可以創造出影響力,而這些影響力體現在於1) 為落後指標(output metrics)帶來正面的影響,例如因為分析的結果產品經理調整一些方向帶來X%營收的提升、y%互動率的增加或是成本減少等等;2) 改變或是影響產品發展藍圖(Product Roadmap)的走向;3) 為組織與團隊的工作邏輯帶來質的改變,比如說讓團隊更重視資料科學的實踐等,像我其中一項專案就是建立組織如何系統性做AB Testing的流程與準則,讓工程師跟產品經理可以從實驗小白變得可以自己操作實驗和觀察實驗結果。

而要讓分析結果可以體現出如上闡述的幾點影響力,我學習到的是要更清楚的溝通從分析結果導引出來「可以被非技術背景同事」理解的洞見、建議和行動項目,讓客戶(產品經理們)可以知道下一步作為資料分析團隊的我們跟利益關係人可以定位甚麼樣的組別進行合作去調整改善一部份的產品功能或是模型。更進一步,資料科學家同時要負責去估算行動項目執行後帶來的預期影響力,我們在廣告部門通常最直接的就是「如果做了這項產品的調整,我們可以為部門帶來多少額外的年化收入」,因此怎麼推導出合理的營收預測也是我在這年培養起來的重要技能。

最後,這些分析、洞見和行動項目的傳達都是透過我們公司最注重的「寫作」嚴謹羅列和編織而成,透過這些研究報告的閱讀和討論,資料科學家們修改陳述的方式、增修針對不同讀者的段落進而謀求組織內和跨組的共識,進而推進產品的革新,創造真正的影響力。

與主管合作、與自己配速

最後一點,奠基於硬實力與軟性影響力的展現外,即是與主管「人和」的部分了!不管採取轉換職位的第一條或第二條路徑,主管能不能幫助你識別對的專案(有足夠的影響力、深度廣度和展現資料科學這項專業本身多樣性)是非常重要且關鍵的。他也要能一路上給轉換者很多的建議和弭平現狀與Role Guidelines差異,幫助轉換者達到門檻。就像升職一樣,轉換職位跑道也是自己的功課,所以一定要擁有主動性,包含跟主管有定期的職涯討論、查核點、里程碑的規劃,適時且有技巧的「催促」主管但不要造成反感也是需要一定的修練。

同時,這也是一個獨自完成長長馬拉松的過程。我自己體感感受是轉職資料科學家的過程比我分析師的晉升還要漫長且煎熬(雖然到頭來時間結算短了兩個月),而這個煎熬感來自專案的規模變大且不確定性很深,還有我第一次經歷要使用資料科學的結果去槓桿出產品的改變,所以走得踉蹌很多,中途也想說是不是要放棄就繼續留在商業分析師的工作就好,最後也是透過很多的心理建設跟一些前輩聊天才慢慢把心態導正,不太汲汲營營於「頭銜」,而是真正把職位準則要求門檻透過一次次的分析與溝通穩穩地展現傳達出來,「與自己配速」再一次在這個過程中重新溫習了一遍,果然在自己的時區裡不急不徐才能真正走到遠方吧!

小結 — 在很多很多的顛簸,然後呢?

我覺得美國公司對於員工晉升和職涯的轉換大抵是走一個邏輯:員工必須在現在的職級職缺表現出下一個階層的影響力與能力配適,公司才會將你晉升/轉換到那個位子。這也是在大公司裡面,知道遊戲規則的重要性,而每個員工都是在這個牌局裡面,使用運氣與實力兩手牌的玩家罷了。這也是為什麼我覺得好像逐漸參透這個架構、且在真正達到里程碑後會是激昂與失落的心情同時交雜吧!那下一步會是什麼呢?我頓時又看不太清,好像是處於一個目標達到後,現在新的目標還沒有浮現的青黃不接,但或許能有短暫的空檔可以喘息是好事一件,可以趁著這樣沒有未來目標相逼的純粹當下,回顧一下這一路走來的旅程、琢磨自己的對於產品的愛,還有到底我在做甚麼樣的事情時可以沉浸入心流,那麼接下來的小徑就會自然浮現了吧!

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

Henry Feng
Henry Feng

Written by Henry Feng

Sr. Data Scientist | UMN MSBA | Medium List: https://pse.is/SGEXZ | 諮詢服務: https://tinyurl.com/3h3uhmk7 | Podcast: 商業分析眨眨眼

Responses (1)

Write a response

Hi Henry

謝謝你精彩的分享資料分析師跟資料科學家需要準備技能的差異👏

你有提到 AB Testing 這段,剛好是我目前遇到問題,不太知道怎麼開始,想請教你是如何建立這套流程跟推動的?中間有沒有遇到困難的地方?

「建立組織如何系統性做AB Testing的流程與準則」


謝謝你🙏...

--

More from Henry Feng