• <sub id="9lvb3"></sub>
      <em id="9lvb3"><source id="9lvb3"></source></em>

      <em id="9lvb3"><span id="9lvb3"></span></em>

            <nav id="9lvb3"><listing id="9lvb3"><meter id="9lvb3"></meter></listing></nav>

              <em id="9lvb3"><source id="9lvb3"></source></em>
              <wbr id="9lvb3"></wbr>
              點擊這里給金令牌獵頭顧問發消息
               金令牌首頁 金令牌獵頭 十佳職業經理人評選 最佳雇主評選 加入俱樂部 《職業經理人周刊》 會員區   薪酬調查報告登錄 簡體 
              Rss訂閱
              《職業經理人周刊》 獵頭公司
              職業經理人俱樂部首頁 >> 經理人資訊 >> 職場觀察 >> 正文

              數據科學家-被哈佛商業評論稱為21世紀最性感的工作


                《職業經理人周刊》   獵頭班長v微博   微信:AirPnP   2021/7/26
              獵頭職位搜索
              獵頭|自助獵頭
              兼職|推薦人才
              1 2 頁 共2頁

              一、數據科學家(Data scientist)

              1.就業市場

              著名獵頭機構推薦金領職位
              金令牌搜索企業 職位 經理人 專訪 社區 會員
              燃氣/文旅/地產投資集團-財務副總裁CFO200-400萬北京 上海 河南
              半導體/芯片行業VIE中概股回歸A股CFO120-200萬上海 北京
              外資文化傳播公司-國際關系智庫高級研究員60-120萬北京 上海
              高端二手車(奧迪、奔馳、寶馬為主)營銷中心總經理100-120萬浙江 北京
              著名合資財險保險公司--總精算師100-140萬北京 河北
              財險公司--企劃財務部副總經理(企劃方向)30-45萬河北 北京 天津 山東
              財險公司---健康險事業部總經理40-60萬北京 河北 天津
              醫療機器-內視鏡-品質ディレクター 醫療器械-內鏡-質量總監40-70萬上海 南京 深圳

              《哈佛商業評論》的一篇文章里將數據科學稱作“21世紀最熱門的職業“。據New Vantage Partners公司對《財富》美國500強公司的調查顯示,85%的500強企業要么已經推出了大數據項目,要么正打算推出。未來幾年他們花在數據分析上的投資將平均上漲40%。

              現在美國市場中有很多data science相關的職位,雇主愿意接受沒有工作經驗的應屆生,并且提供綠卡。這一點對我們國際生非常重要。

              選對行業就是選對前途,根據美國招聘網站 Glassdoor 關于50個最熱門工作崗位的報告,數據科學家毫不意外的連續第二年獲得了首位。每年Glassdoor 會根據所有工作獲得的“ Glassdoor 工作得分”發布此報告。評分取決于三個關鍵因素:市場職位需求,工作滿意度和平均年薪。憑借著工作得分 4.8 分,工作滿意度 4.4 分( 5 分為滿分),平均年薪 11 萬美元,數據科學家名列最熱門工作榜首。

              事實上,在過去的一年中,數據領域相關工作在類似的就業報告也占據著統治地位。CareerCast.com 的一項最新研究顯示,數據科學家工作在未來七年內具有強勁的增長潛力。根據 Computer Science Zone 的統計,估計在未來十年內,計算機相關工作的職位空缺高達1百萬,在 LinkedIn 上搜索數據科學家職位,可以發現有 13700 多個職位需求。另外,根據工作趨勢發布網站 Indeed 的數據,數據科學家的求職人數的遞增沒有絲毫放緩的跡象。

              2.行業介紹

              (1)關于Data scientist

              數據科學家指的是采用科學方法、運用數據挖掘工具、尋找新的數據洞察的工程師。數據科學家集技術專家與數據分析師的角色于一身,與傳統數據分析師相比:后者通常利用企業的內部數據進行分析,以支持領導層的決策;而前者更多的是通過關注面向用戶的數據來創造不同特性的產品和流程,為客戶提供有意義的增值服務。

              這個職位在不同公司傾向性會有所區分。有些偏business,也就是所謂的data analyst, business intelligen;有些偏統計的:比如做實驗設計(ab test),做模型的prototype;有些偏CS的,比如 machine learning in big data framework,現在很火的deep learning。

              (2)Data scientist 職位由來

              在data scientist這個title紅得發紫之前,美國的互聯網公司里有那么幾類角色(或者說職位):

              Research scientist/Researcher:如Yahoo Labs, Google Research, MSR中的大多數人。這些人主要負責為公司提供前沿的研究成果,支撐公司未來1-10年的業務前景。他們的產出或是產品化研究成果,或是發表學術出版物。這樣的職位要求良好的科研能力和前瞻性的視野,職業發展路線有點像學校里的教授,主要通過學術水平和影響力的提升來提升自身的職業路線。

              Business analyst:這個其實很多行業都有,具體的職責依賴于公司的業務很難一概而論,引用一下wikipedia的一段話感受下:“The International Institute of Business Analysis(IIBA) describes the role as "a liaison among stakeholders in order to understand the structure, policies, and operations of an organization, and to recommend solutions that enable the organization to achieve its goals.” 這類職位要求更貼近公司或機構的日常業務,提供決策支持等功能。職業發展路線往往是初級分析師、高級分析師、再往后往往很快變成業務或者部門負責人。

              Statistician:許多互聯網公司和傳統公司都可能出現過這樣title的職位,如Microsoft、Netflix等。這樣的職位往往是學統計出身的最適合。他們的職責更多在對成熟的問題定義上進行有效的統計建模和分析,最后給出actionable information or insights。相比analyst,他們往往在數學上更專業,當然本來這些職位的概念就是互相交織覆蓋的,這里只是說一個大面上的意思。statistician往往還要負責設計實驗,這是他們工作中必須擔起的責任之一。他們的職級系統通常非常扁平。

              Quantitative analyst:Google里的職位:和前面所述的BA和Statistician都有交叉的地方。他們的職級也是junior到principal這種套路。

              在AI,ML,DM,NLP等領域良好理論背景的工程師。他們動手能力強,coding和productization上有很強的優勢。處理數據的能力不在話下,又因為具有良好的理論背景,做起模型來也得心應手,這樣的人也有一部分轉向了data scientist的職位。他們的職級系統和傳統的工程師沒有太大區別。

              (3)data scientist、data analyst data engineer的區別是什么?

              Data Engineer顧名思義,是軟件工程師(software engineer)的一種。這類工程師做的事情其實非常直白,就是把產品本身產生的原始數據記錄進數據庫,然后把在數據庫里把這些原始數據成表格。舉個簡單的例子,微博上每一個用戶的行為,包括搜索話題、評論、點贊,等等,都需要工程師通過寫javascript把這些行為數據存進服務器里,然后存成一個表格記錄下來每一天,每一秒,每一個用戶做了什么動作。Data Enginner 所做的一切都為了Data Management,具體內容包括數據模型、數據架構、數據標準、元數據、主數據、數據治理、數據管控等等,Data Enginner的目標是把數據整好,存儲成本低,查詢效率高,至于怎么使用這些數據不是他們關心的范疇。

              Data Scientist在Google被稱作quantitative analyst,翻譯過來大概類似于量化分析師。這類職位比較特殊,是一種非常technical、對學術能力要求非常高的職位。Data Scientist解決的問題就是,如果我們對搜索的排序做一些改動,如何通過統計學的方法精確測量這個改動對搜索整體帶來的影響。這個影響往往是非常小的(Google 1天平均10億次搜索,這個量級上的任何改動都是至關重要的)。

              Data Analyst在Google被稱作商業分析師(business analyst)或者是產品分析師(product analyst)。這個職位的作用是溝通產品和商業的橋梁,服務對象一般是產品經理以及高層領導。Data Analyst首先會把工程師維護的數據進行ETL(extract, transform, load),也就是傳說中的跑數據(大多用SQL)。隨后Data Analyst會把這些提取出的數據轉化為“生產力“,也就是能夠指導商業或者產品的建議。工作場景:產品經理上線了一款產品,這款產品運行的怎么樣?有多少人訪問?有多少人購買?購買人數始終上不去是什么原因?如何發掘購買人數降低的原理然后針對這些原因進行有目的的處理?這些都是通過分析產品產生的數據得到的。

              二、機器學習(machine learning)

              1.定義

              Machine learning有下面幾種定義:

              定義一

              • 機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能。
              • 機器學習是對能通過經驗自動改進的計算機算法的研究。
              • 機器學習是用數據或以往的經驗,以此優化計算機程序的性能標準。

              定義二

              • Machine Learning即是指能夠幫你從數據中尋找到感興趣的部分而不需要編寫特定的問題解決方案的通用算法的集合。
              • 舉例而言,算法中一個大的分類即分類算法,它可以將數據分類到不同的組合中。而可以用來識別手寫數字的算法自然也能用來識別垃圾郵件,只不過對于數據特征的提取方法不同。相同的算法輸入不同的數據就能夠用來處理不同的分類邏輯。

              2.machine learning不可不知的那些事

              (1)機器學習與人工智能不能簡單混為一談

              機器學習指的是從數據中學習。機器學習能做到的是:通過使用正確的機器學習算法和輸入training data,快速解決不同領域的問題。人工智能包含了機器學習,但同時也包含許多其他領域。這個詞是如此寬泛,以致于它的意思非常模糊,越來越淪為一個流行熱詞。

              當然,如果你覺得用人工智能這個詞來包裝機器學習,能讓你的產品博得更多的眼球,那這么使用也沒什么問題。不過要知道,在學術界外,人工智能只是一個可以被隨意解釋的熱詞而已。

              (2)數據尤為重要

              機器學習離不開數據和算法,而其中數據尤為重要。近幾年來,機器學習,尤其是深度學習方面的算法進步飛快。但即使如此,數據在機器學習中的主導地位還是毋庸置疑的。你不一定需要非常好的算法,但卻需要好的數據。但如果你的數據本身不夠好的話,即使用再高明的算法,也無法挽回結果的偏差。正所謂失之毫厘,謬以千里。

              (3)簡單的模型也是好的

              如果你的數據不是非常多的話,你應該盡量使用相對簡單的模型。

              機器學習的任務就是通過數據中的模式和規律來訓練模型,探索由參數所定義的模型空間。如果參數空間設置的太大,而你沒有足夠的數據去訓練這個模型的話,那就會出現過擬合的問題,使得這個模型無法推而廣之。

              舉個例子:

              假設你要做一個機器學習的模型,希望它判斷一個動物是不是天鵝。你輸入了很多白天鵝的圖片去訓練你的模型。隨后,你使用這個模型去進行檢測,發現你的模型能夠準確的分辨出白天鵝,卻無法辨認黑天鵝。這可能是因為“過擬合”;蛘哒f,你的模型將“羽毛為白色”這個局部特征,作為了一個全局特征進行了解釋。

              這個背后具體的數學原理比較復雜,這里就不贅述了,但是,你可以記住這樣一個原則:在多個模型都能同等地解釋樣本的情況下,我們選最簡單的模型(奧卡姆剃刀原則)。

              (4)數據的優劣決定結果

              機器學習的結果是由訓練數據的優劣來決定的。你有多好的數據,就會有多好的結果。早在機器學習出現之前,便有這樣的諺語:“垃圾進,垃圾出”。這一說法恰當地描述了在機器學習中,數據是機器學習結果的關鍵限制。

              機器學習只能發現在訓練數據中存在的模式,因此,訓練數據對于結果是有決定性影響的。對于監督機器學習中類似“Classification”這樣的任務,訓練數據就更為重要了。只有標識正確、樣本特征豐富、數據量大的training data才能很好的訓練模型。

              (5)數據代表性決定機器學習有效性

              只有在訓練數據具有代表性的情況下,機器學習才是有效的。

              基金公司通常會有這樣的免責聲明:“過去的表現并不能保證未來的結果”。在機器學習中也應該有類似的警示。這是因為,只有在training data和real data不論從特征、還是樣本分布都足夠接近的情況下,機器學習的工作才是有效的。

              因此,要時刻注意訓練數據與應用數據間的不同,并且經常對模型進行再訓練,這樣才能保證他們不過時。

              (6)機器學習大量的工作是無聊的

              機器學習大量的工作是數據轉換。在閱讀一些有關機器學習新技術文章的時候,你可能會覺得機器學習中最主要的是選擇和優化算法。然而現實是,你大部分的時間和精力都會用在清理數據和特征工程上——或者說,是將原始數據的特征轉換成模型所需的對應特征。

              舉個栗子:

              如果想要用機器學習的方法,根據各國的經濟數據,評估未來金融市場的風險。那必須從網上下載不同格式的數萬個圖表,并一個一個的把他們轉化成一個機器學習能夠理解的統一格式。這可能需要兩三個人重復勞動好幾個星期才能完成。

              (7)Deep learning是革命性進步

              深度學習是一種革命性的進步,但它也并非魔法。深度學習近年來越發火熱,是因為它可以在機器學習領域中廣泛應用,并產出比機器學習更好的結果。除此之外,深度學習還自動化了一些傳統上通過特征工程來完成的工作,尤其是圖像和視頻數據的處理。

              但是深度學習也不是萬能藥,在清理數據和轉換上面,你依舊需要投入大量的精力。

              (8)機器學習的問題往往是人禍

              機器學習系統極容易被人為失誤所影響。就如常言所說:“機器學習算法不會殺人,只有人才會殺人!

              通常導致機器學習系統出故障的原因,都是人為引入了錯誤的訓練數據,造成了偏差和系統錯誤。而機器學習算法出錯只占少數。

              所以,永遠保持懷疑,并在學習機器學習的時候,以更高的標準要求自己。

              (9)小心自證預言問題

              機器學習會不經意的創造出一個自證預言。

              自證預言即人們先入為主的判斷,無論正確與否,都將或多或少的影響到人們的行為,以至于這個判斷最后真的實現。

              在許多機器學習的應用中,你今天做出的決定會影響你明天所收集到的訓練數據。

              一旦你的機器學習模型產生了偏見,它就可能繼續產生新的訓練數據來強化這些偏見。而有些偏見有可能會毀了人們的生活。因此要對自己所創造的模型負責,不要創造自證預言。

              3.機器學習常見分類

              • 有監督學習:從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。(使用已知正確答案的示例來訓練網絡)
              • 無監督學習:與監督學習相比,訓練集沒有人為標注的結果。(適用于你具有數據集但無標簽的情況)
              • 半監督學習:介于監督學習與無監督學習之間。(結合了大量未標記的數據和少量標簽數據)
              • 增強學習:通過觀察來學習做成如何的動作。(針對你再次沒有標注數據集的情況而言)

              machine learning更加關注相關性和預測,在金融、生物科技、化學、心理等領域都有著不錯的前景。

              美國經濟學家范里安認為:計算機技術現在已經深入到經濟學研究中。傳統的統計和計量方法,比如回歸分析,當然是不錯的研究方法,但如今數據量越來越大,而正好符合研究要求的數據已然有限,同時大數據量讓變量之間的關系變得更加靈活,傳統計量中的線性以及大多非線性模型可能都無法滿足這一要求,所以經濟學家需要尋找新的研究方法。范里安認為,機器學習理論中的決策樹(decision trees),support vector machines,深度學習(deep lerning)等技術,可以更加有效率的處理復雜的關系。

              三、未來展望

              1.行業優勢

              實力告訴你數據科學家性價比有多高。

              《哈佛商業評論》的一篇文章稱,“數據科學家是21世紀最性感的工作”。有很多方面可以證明這點。從事金融、統計和運營研究的公司比以往任何時候都更加關注數據科學。數據科學正在為企業帶來大量價值,同時數據科學家的需求也在迅速增長。大量的市場需求對于個人職業的發展也是十分有利的。

              過去四十年,決定經濟發展的是摩爾定律,而在未來二十年,真正改變經濟發展的是大數據,因為數據分析,就是傳說中預知未來的超能力,所有的公司未來都會是數據公司。

              云計算+移動互聯網+大數據(現在進行時),機器智能(現在進行時)IT+生物醫療(未來趨勢)已成為世界新技術的三大必然趨勢,專家預測,到2020年將有40千兆字節的數據存在,大數據的時代已經來臨。

              (來源:搜狐)
              1 2 頁 共2頁


              我們尊重原創者版權,除非我們確實無法確認作者以外,我們都會注明作者和來源。在此向原創者表示感謝。本網轉載文章完全是為了內部學習、研究之非商業目的,若是涉及版權等問題,煩請聯系 service@execunet.cn 或致電 010-85885475 刪除,謝謝!

              發表評論:
              主題:
              內容:
              匿名發表 驗證碼: 登錄名: 密碼:   個人 企業
              發帖須知:
              一、請遵守中華人民共和國有關法律法規、《全國人大常委會關于維護互聯網安全的決定》《互聯網新聞信息服務管理規定》。
              二、請注意語言文明,尊重網絡道德,并承擔一切因您的行為而直接或間接引起的法律責任。
              三、管理員有權保留或刪除其管轄留言中的任意內容。
              四、您在本站發表的言論,本站有權在網站內轉載或引用。
              五、發表本評論即表明您已經閱讀并接受上述條款。
              金令牌獵頭
              企業找獵頭   職業經理人找獵頭
              職場觀察相關資訊
              更多>> 
              職場觀察焦點企業對話
              更多>> 
              十大獵頭公司推薦金領職位
              精品人妻少妇一区二区-久热这里只有精品免费视频-国产精品偷伦费观看-国产裸体美女视频全黄桃花视频