摘要: 只有信息技術行業的數據科學家才以開發人員為主,但更注重數據分析而不是技術創新的行業(比如教育/科學和醫療保健)則以研究人員為主,而強調通過創新思維解決問題的行業(比如專業服務和通信)則以創意人士為主。
作者:車品覺
品覺導讀:
- 只有信息技術行業的數據科學家才以開發人員為主,但更注重數據分析而不是技術創新的行業(比如教育/科學和醫療保健)則以研究人員為主,而強調通過創新思維解決問題的行業(比如專業服務和通信)則以創意人士為主。
- 滿意度高的行業(教育/科學:77%的人擁有高級學位)比滿意度低的行業(廣告/媒體/娛樂:71%的人擁有高級學位)擁有更多的高學歷數據科學家。
- 雖然數據科學家從事於各行各業,但他們中的很多人都來自少數幾個行業。行業不同,其數據科學家的類型也不同。雖然每個行業都涵蓋了數據科學家的所有四個類型,但側重點各有不同。
原文翻譯:
一份名為《AnalyticsWeek和BusinessOver Broadway數據科學調查》的報告揭示了數據科學所扮演的角色、數據科學技能的熟練度以及項目結果滿意度在各行各業的差異。信息技術行業擁有最多的數據科學家。在僱傭數據科學家最多的十大行業中,有六個行業的研究型數據科學家數量超過了其他類型的數據科學家。與其他行業的數據科學家相比,專業服務行業的數據科學家在數據科學的三大技能——商業、技術和數學/統計方面,都擁有非常高的熟練度。
各行業的數據科學家佔比
圖1:各行業的數據科學家佔比
在我們對數據科學家的調查中,我們詢問了1000多位數據科學家的個人和工作情況、他們對三項數據科學技能(商業、技術及數學/統計)的熟練程度、他們所扮演的角色(企業管理、開發人員、創意人士和研究人員)以及他們對所從事項目結果的滿意度。
調查顯示(圖1),僱傭數據科學家最多的行業依次是信息技術(26%)、教育/科學(14%)、諮詢(13%)、金融服務(11%)和醫療保健(9%)。
數據科學在各行業所扮演的角色
圖2:數據科學在各行業所扮演的不同角色
接下來,我們看看數據科學家在其公司裡扮演的不同角色。由於樣本容量的限制,我們只列出了十個行業的調查結果(另外14個行業的樣本容量低於20)。
圖2顯示,以研究人員為主的行業包括教育/科學(83%)、廣告/媒體/娛樂(69%)、金融服務(65%)、醫療保健(61%)、諮詢(61%)和政府(59%)。不出所料,開發人員是信息技術行業(57%)裡最常見的數據科學家類型。企業管理人員則是零售/消費產品行業(69%)裡最常見的數據科學家類型。此外,創意人士是專業服務(58%)和通信(57%)行業裡最常見的數據科學家類型。
各行業的數據科學技能熟練度
圖3:各行業的數據科學技能熟練度差異
下面,看看各行業的數據科學技能熟練度(圖3)。總體來看,各行業的技能熟練度特點趨於一致。在十個行業中,有九個行業的數據科學家在商業和數學/統計技能方面的熟練度超過了技術方面(教育/科學行業除外)。
另外,三項數據科學技能的熟練度在不同行業中存在顯著的統計學差異。與其他行業相比,專業服務行業的數據科學家在所有三項數據科學技能方面,都擁有最高的熟練度。
教育/科學行業的數據科學家擁有最高的數學/統計技能熟練度(64),但商業技能的熟練度最低(44)。
教育/科學和醫療保健行業的數據科學家擁有最低的技術技能熟練度。
各行業的數據分析項目結果滿意度
圖4:各行業的數據分析項目結果滿意度
對數據分析項目結果的滿意度存在顯著的統計學差異(圖4)。教育/科學、諮詢和金融服務行業的數據科學家對項目結果的滿意度最高,而政府、廣告/媒體/娛樂和通信行業的數據科學家則對項目結果的滿意度最低。
總結
調查結果顯示,行業之間在以下三個方面存在差異:1. 數據科學家的工作角色;2.數據科學家對數據科學技能的熟練度;3. 對項目結果的滿意度。
調查顯示,近75%的數據科學家來自五個行業:信息技術(26%),教育/科學(14%)、諮詢(13%)、金融服務(11%)和醫療保健(9%)。此外,不同行業在數據科學家類型、技能熟練度以及項目結果滿意度方面,也存在差異。
數據科學在各行業所扮演的角色大為不同。在十個行業中,有六個行業的數據科學家以研究人員為主。在其餘行業中,則以另外三個角色為主。這種差異反映了各個行業所需要數據科學家完成的工作量和工作類型的不同。例如,只有信息技術行業的數據科學家才以開發人員為主,但更注重數據分析而不是技術創新的行業(比如教育/科學和醫療保健)則以研究人員為主,而強調通過創新思維解決問題的行業(比如專業服務和通信)則以創意人士為主。
各行業在數據科學家的技能熟練度方面也存在差異。只有教育/科學和專業服務兩個行業的數據科學家掌握足夠的數學/統計技能熟練度(熟練度不低於60)。而另一方面,只有通信行業的數據科學家擁有足夠的商業技能熟練度。
最後,各行業在數據分析項目結果的滿意度方面同樣存在差異。為了弄清造成這種差異的原因,我們分析了每個行業的數據科學家類型及其教育水平。先前的調查發現,這兩個因素與項目結果的滿意度有關:研究人員對項目結果的滿意度明顯高於開發人員和企業管理人員。目前這次調查顯示,滿意度最高的四個行業是那些至少半數受訪者為研究人員的行業。然而,在滿意度最低的三個行業中,有兩個行業也是研究人員佔比較高的行業。
接下來看看教育水平。我們之前發現,與學歷較低(高中、專科和本科)的數據科學家相比,獲得高級學位(碩士和博士)的數據科學家在很多技能方面都擁有更高的熟練度。然而,我們在分析各行業數據科學家的教育水平時,沒有明確的跡象表明,滿意度高的行業(教育/科學:77%的人擁有高級學位)比滿意度低的行業(廣告/媒體/娛樂:71%的人擁有高級學位)擁有更多的高學歷數據科學家。我們需要進一步的研究才能更好地理解,究竟是什麼導致各行業在項目結果的滿意度方面存在上述差異。
雖然數據科學家從事於各行各業,但他們中的很多人都來自少數幾個行業。行業不同,其數據科學家的類型也不同。雖然每個行業都涵蓋了數據科學家的所有四個類型,但側重點各有不同。調查結果表明,無論身處哪一行業,數據科學家的職責在於優化數據科學的價值。更好地理解數據科學方法、實踐和結果的行業性差異,有助於企業針對各自行業特點選擇最合適的數據科學家,也有助於招聘人員找到最合適的數據科學家。
車品覺簡介
暢銷書《決戰大數據》作者;國信優易數據研究院院長;紅杉資本中國基金專家合夥人;浙江大學管理學院客席教授;全國信標委員;數據標準工作組副組長;美麗心靈基金會桑珠利民基金副主席。
原阿里巴巴集團副總裁,首任阿里數據委員會會長;現擔任中國信息協會大數據分會副會長、中國計算機學會大數據專家委員會副主任、粵港信息化專家委員、中國計算數學學會第九屆理事、清華大學教育指導委員(大數據項目)、浙江大學管理學院客席教授等職。
轉貼自: 36大數據
留下你的回應
以訪客張貼回應