數據分析師的工作內容是什麼?
在滿足數據需求這件事上,日常就是用SQL去數據庫裏提取想要的數據,如果數據庫裏沒有現成的數據,那就用爬蟲工具自己爬,或者告訴開發部門讓他們去弄。
拿到數據後就可以按照業務人員的要求,用Excel加工成各式報表,或者複雜一點寫個Python腳本來自動處理。
如果有一些數據是每天都是要看的,那就用tableau或者power bi去搭建成日常的數據監測,每天可以自動從數據庫裏提取數據,然後生成各類圖表,能方便數據分析師的常規工作。
我把這些工作歸納爲七個字:取數、做表、搭監控。
這部分的工作就會佔據數據分析師60%-70%的工作時間。
數據分析師日常工作是什麼?
數據類產品,簡單來說可以分爲4類典型的數據產品:決策分析類產品、智能推薦類產品(業務輔助)、數據業務類產品(業務功能)、數據管理類產品。
1) 決策分析類產品 BI工具就是一類典型的決策分析類產品,支持自助化數據看板設計。
不過這只是基礎功能,更高階的功能還應該有用戶行爲路徑分析、關鍵路徑分析、營銷策略分析等; 2) 智能推薦類產品 這類產品一般用來輔助業務運營,比如智慧投顧平臺,關聯了基金標籤和用戶標籤,支持標籤匹配迭代。
這類數據產品有很強的應用場景; 3) 數據業務功能類產品 這類數據產品基本就代替了業務運營,比如貸款風控平臺,直接頂替掉了貸款經理的大部分工作;還有數據人臉識別,也基本代替了很多安檢人員; 4) 數據管理類產品 這一類產品就是用來管理數據生成、數據治理和數據應用,特別是聚焦在數據應用,典型的場景是數據中臺和標籤中臺 2.3 數據科學家 數據分析師的第三個方向就是“擁抱技術”,如果既不想做運營,也不想做產品,而想做更“硬核”的工作,那麼可以選擇去做數據科學家。
讀旅遊管理專業的同志現在都在做什麼工作?
額,不被邀請差不多忘了自己是旅遊管理畢業生。
。
。
畢業是喜達屋集團管理培訓生,收益管理方向。
一年後留任集團收益管理專員,負責數據處理。
再隔不久跳槽去外資快遞公司,銷售數據分析師。
就轉型成BI工程師了。
畢業第三年時候去了洲際,依舊做市場銷售部的BI。
感覺洲際自上到下,普遍有一種撈一票走人的氛圍。
第五年時候到了某個外資製藥診斷公司,做人力資源一塊的數據工程,同時接手了一兩個數據科學的項目,現在感覺是BI諮詢顧問,BI工程師,數據庫工程師和AI調參數員的某種奇怪角色。
。
。
BI工程師、數據倉庫工程師、ETL工程師、數據開發工程師(大數據開發工程師)有什麼區別?
無障礙登錄/註冊數據分析商業智能(BI)數據倉庫工程師大數據 BI工程師、數據倉庫工程師、ETL工程師、數據開發工程師(大數據開發工程師) 有什麼區別? 如果你在考慮從事數據科學的工作,可能會覺得這個領域有點令人困惑!什麼是數據科學家?數據分析師和數據科學家之間有什麼區別?機器學習工程師做什麼?那麼數據工程師、商業智能( BI )工程師和機器學習( ML )研究員呢? 在這篇文章中,我們將描述數據科學中的不同角色,解釋他們的定義以及差異。
我們還將爲每個角色建立一個“理想能力畫像”。
這對於職業滿意度和求職成功非常重要——如果你申請了一個適合你的角色,你將有更大的機會獲得這份工作;如果你做了自己喜歡的事情,那麼你會享受,而不是每天都想逃避! 下面一起看看數據科學中的不同角色。
我們會做一些擴展,以涵蓋對具有數據技能的候選人來說,所有可考慮的數據科學職業角色。
從廣義上講,我們可以將數據角色分爲兩類:業務導向或工程導向 。
不同之處在於,業務向角色需要兼備技術和業務技能 ,例如溝通和演示;而工程向的角色着重在建模和軟件工程技能上。
另一方面,一些傳統角色已經存在了很長時間,而其他角色僅僅出現了幾年或者剛剛興起。
讓我們更詳細地看一下每個角色。
數據分析師/數據科學家 從本質來說數據分析師和數據科學家是相同的,因爲他們做同樣的事情——從數據中獲取價值 。
價值可以有不同的形式:對於數據分析師來說,價值意味着洞察 ,而對於數據科學家來說,是在洞察之上的產品發展智能 。
數據分析師分析數據以獲得洞察,並幫助形成業務決策。
例如是什麼導致網站流量增加,或者用戶離開網站的主要原因是什麼?而數據科學家更關心的是使用機器學習和 A / B 測試來驅動和改進產品。
他們可能會對諸如“更大尺寸的按鈕會增加點擊率嗎?”以及“哪些客戶可能取消訂閱?”等問題感興趣。
數據科學家專注於前瞻,即做出預測 ,而數據分析師則更多地聚焦在回顧 ,如分析歷史數據。
數據科學家應該更有經驗,能夠用科學的方法解決業務問題,包括構建業務問題、提出假設,然後設計和進行實驗來檢驗假設,最後得出結論(主要是研究技能,這就是爲什麼硬科學博士有時候是數據科學家角色的首選候選人)。
而數據分析師應該使用報告或數據可視化技術收集,清理,分析數據並傳達結果。
以上是這兩個角色之間的一般差異,但情況並非總是如此,因爲數據科學仍然是新的方向,並且遠未實現標準化 。
有時數據科學家可以進行基本分析工作,數據分析師可以執行機器學習建模。
對於數據科學中分析類的角色而言,無論頭銜如何,這兩類絕對是最受僱主追捧的重要角色。
因此在求職時應考慮與畫像的最佳契合,併成爲我們的目標(以下角色同理)。
需要指出的是,這裏我們指的是通常意義的數據科學家,主要處理統計建模,A / B 測試,機器學習,數據清洗和數據可視化。
而專注機器學習的數據科學家,我們實際上將其歸類爲機器學習研究員/科學家,下文會有介紹。
數據工程師 我們已經討論了很多關於數據科學家的事情,但實際上,如果沒有數據工程師的幫助,數據科學家就無法做出貢獻。
爲什麼?由於數據工程師構建了引入數據的數據管道 !如同煉油廠閒置,是由於沒有原油進入,最終原因是石油管道還沒有建成。
我們舉一家廣告技術公司爲例,我們有來自多種內外部數據源的實時數據;有來自服務器的廣告投放數據,來自我們內部數據庫的投放和客戶數據,還有來自第三方提供商的投放效果數據和我們的內部日誌......爲了構建實時廣告效果分析看板並進一步做分析和建模,我們需要將所有數據整合成合適的級別。
在此之上,我們需要構建一個數據倉庫,以便我們的查詢不會影響生產服務器的性能。
這就是數據工程師爲我們提供的幫助。
如你所見,這基本上是數據的軟件工程。
ML / DL / AI研究員/科學家/工程師 ML 研究員實際上與專注於 ML 的數據科學家相同。
但與通常意義上處理所有數據科學問題的“全棧”數據科學家不同,ML 數據科學家將專注於 ML 建模,以及(或者)新機器學習算法的研究和開發 。
另一方面,ML工程師更關心機器學習模型的生產 。
想象一下使用公共數據集構建的推薦模型。
在對模型進行微調之後,我們已經取得了很好的性能結果,但該模型仍然沒有用,因爲它只是我們計算機中的一個軟件。
爲了讓它有用,我們需要將模型部署到生產環境中,比如我們的電子商務網站,以便它可以實時爲用戶提供推薦,從而幫助我們增加收入。
將機器學習模型部署到生產中是一項工程問題,與構建模型不同,它涉及不同類型的工程工作,例如將 ML 模型集成到軟件系統中,優化模型以提高性能和可擴展性,監控 ML 系統,以及用新數據重新訓練它。
當然,還有建模部分,使用各種 ML 庫實驗和構建機器學習模型,以及實現 ML 算法以滿足業務需求。
研究人員/科學家和工程師之間的區別在於 “部署”部分,即是否負責將 ML 模型投入生產。
如果是,那麼我們討論的是上述的工程問題,而角色是工程師,否則,它是一個研究角色。
業務分析師(各種職能) 我們這裏談到的業務分析師不是傳統的IT業務分析師( BA )。
傳統的 BA 引導,記錄業務需求並充當業務和技術之間的聯絡人。
相反,我們使用業務分析師的頭銜作爲總括頭銜來涵蓋所有具有業務性質(非技術性)且需要重要數據技能的分析師角色。
由於數據的普及,幾乎所有分析師角色都需要某些數據技能集。
因此,業務分析師角色是對於具有領域專業知識,並且精於數據的候選人來說,業務分析師是非常不錯的職位目標。
找出這些角色的最佳方法是在求職搜索引擎上使用關鍵字。
例如,在 http:// Indeed.com上,如果輸入“ analyst sql ”作爲關鍵字,您將找到許多不同的職位,如 Performance Analyst,Healthcare Data Analyst 和 Demand Planning Analyst。
這些是精通數據的候選人可以考慮的,不同類型的業務分析師。
BI分析師/工程師/開發人員 我們還擁有傳統的商業智能( BI )分析師和商業智能工程師角色。
一般來說,當我們談論 BI 時,我們指的是使用“定義良好的BI基礎設施”在“大公司”環境中進行數據分析和報告, 基礎設施指的是各種企業軟件系統( ERP,CRM 等)以及在他們之上進行連接和報告 BI 工具; “大公司” - 因爲傳統大型企業擁有財務實力來搭建和維護這些BI系統。
BI 分析師與數據分析師非常相似,因爲他們都需要對數據進行分析和報告 。
一般來說,他們不做預測建模。
不同之處在於 BI 分析師在結構化環境(使用 BI 系統)中與大型公司合作,而數據分析師可以在任何地方,而且不需要使用現有的BI基礎架構。
而BI工程師/開發人員和 BI 分析師的關係,正如數據工程師與數據科學家的關係一樣,因爲BI工程師構建了 BI 分析師可依賴的報告工具來進行業務所需的分析。
因此,數據工程師可以被視爲 BI 工程師/開發人員角色的最新版本,後者可以很好地適應前者,這要歸功於類似的技能集。
數據/ ML產品經理 如上所述,數據現在無處不在。
難怪現在的產品還依賴於數據科學,特別是機器學習。
對於以機器學習爲中心或嚴重依賴於數據科學的產品,精通數據的產品經理最適合支持它們。
具有 ML 專業知識和產品管理經驗的候選人將在這種類型的角色中佔上風。
理想的能力畫像 我們現在清楚地瞭解數據科學中的主要角色,但每位理想候選人的技能集是什麼樣的?爲了以直觀的方式進行說明,我使用 Matplotlib 創建了蜘蛛圖將這些畫像可視化。
由於這很大程度上是我的直觀看法,我們將在未來的迭代中抓取並分析來自 Indeed 的職位發佈數據,以驗證畫像。
現在你擁有了數據科學角色和相應的能力畫像!基於對不同角色的責任和差異的充分理解,您將能夠確定您熱衷的職業道路;理想的畫像不僅可以用於確定最適合的目標角色,還可以作爲簡歷定製和個人品牌的路線圖,以使您的個人資料與之相關。
祝您職業生涯好運! 2018-12-25 12:06 贊同72