新人入職場(chǎng),會(huì)經(jīng)常聽(tīng)到老員工或者leader說(shuō),“這個(gè)業(yè)務(wù)我們要看XXX數(shù)據(jù)”“這個(gè)需求出個(gè)數(shù)據(jù)”等話題,很多新人初入職場(chǎng)的時(shí)候會(huì)很迷茫——數(shù)據(jù)是什么數(shù)據(jù)?哪些數(shù)據(jù)重要?我要怎么去分析數(shù)據(jù)才是有價(jià)值的?實(shí)際上,隨著大數(shù)據(jù)的發(fā)展,現(xiàn)在似乎越來(lái)越多的業(yè)務(wù)需要“數(shù)據(jù)意識(shí)”“數(shù)據(jù)分析”的能力,特別是大企業(yè)更是如此。簡(jiǎn)單的來(lái)講,就是大企業(yè)的用戶(hù)多,產(chǎn)生的數(shù)據(jù)多,因此除了傳統(tǒng)的問(wèn)卷調(diào)研、訪談等手段,還能通過(guò)大量的數(shù)據(jù)進(jìn)行分析。這樣同樣能夠起到了解用戶(hù)反饋、產(chǎn)品效益的目的,甚至在很多情況下還會(huì)更準(zhǔn)確、更省時(shí)間。
也因此,許多企業(yè)在招聘時(shí)會(huì)偏好有“數(shù)據(jù)分析”能力的候選人;同時(shí)很多打工人也發(fā)現(xiàn),原有的Excel技能很難滿足自己的工作需求,有一定的數(shù)據(jù)能力能夠大大提升自己的辦公效率,開(kāi)始自學(xué)數(shù)據(jù)分析。
今天,小助手就和大家分享下,除了常規(guī)的Excel,還有什么數(shù)據(jù)分析的工具值得用、值得學(xué),主要分了三個(gè)等級(jí)
1.入門(mén)級(jí):非數(shù)分方向的同學(xué),如果僅是有一定的數(shù)據(jù)分析需求的話,學(xué)會(huì)這個(gè)就非常夠用了;
2.進(jìn)階級(jí):非數(shù)分方向的同學(xué),如果對(duì)自己要求較高,又經(jīng)常需要匯報(bào)演講,那這個(gè)就很合適;
3.專(zhuān)業(yè)級(jí):數(shù)分方向的同學(xué)可以研究,非專(zhuān)業(yè)人士沒(méi)什么太大必要。
入門(mén)級(jí):MySQL/ORACLE/POSTGRESQL
SQL基本上是數(shù)據(jù)方向上所有崗位的必備技能,重要程度和Excel不相上下。做數(shù)據(jù)分析專(zhuān)業(yè)的同學(xué)常常會(huì)稱(chēng)自己為SQL民工也是因?yàn)橥瑯拥脑颉?duì)于非數(shù)分崗位的同學(xué),其實(shí)能夠掌握sql就非常足夠了。
SQL入門(mén)比較容易,概括起來(lái)就是在數(shù)據(jù)庫(kù)里搜索調(diào)取想要的數(shù)據(jù),在數(shù)據(jù)庫(kù)里增刪改查新舊數(shù)據(jù)。總而言之,要想入行數(shù)據(jù)分析,SQL是必要技能。
進(jìn)階級(jí):TABLEAU/POWERBI:
作為可視化工具的Tableau和PowerBI在數(shù)據(jù)分析中也是不可或缺的一部分。Tableau的上手非?欤灰献幚磉^(guò)的數(shù)據(jù)后便會(huì)產(chǎn)出很多精美的可視化圖像。
數(shù)據(jù)可視化簡(jiǎn)單明了,用圖表來(lái)識(shí)別問(wèn)題,在做數(shù)據(jù)分析和演講時(shí)都會(huì)讓你在工作上非常加分。適合有數(shù)據(jù)分析需求,又需要做匯報(bào)的同學(xué)。
專(zhuān)業(yè)級(jí):PYTHON:
除了SQL外,如果需要更成熟的數(shù)分技能,Python也一定會(huì)要求(當(dāng)然大多數(shù)非數(shù)分崗的打工人還不需要這么專(zhuān)業(yè))。Python也是一款比較容易上手的數(shù)據(jù)分析軟件。寫(xiě)作語(yǔ)法和英語(yǔ)比較相似,比起Java,C++等SDE必須要會(huì)的軟件更容易上手。
用Python清理數(shù)據(jù)和處理數(shù)據(jù)時(shí)往往比較方便快捷,同時(shí),有很多數(shù)據(jù)科學(xué)家也會(huì)在Python中編寫(xiě)模型。Python可以進(jìn)行爬蟲(chóng),寫(xiě)游戲,可以說(shuō)是數(shù)據(jù)分析師一定要會(huì)的數(shù)據(jù)分析工具了。
專(zhuān)業(yè)級(jí):R Programming:
隨著Python的廣泛應(yīng)用,用R的分析師近幾年好像有所減少,但R多數(shù)被用于統(tǒng)計(jì)計(jì)算和圖形的編程語(yǔ)言的免費(fèi)軟件。
R語(yǔ)言在統(tǒng)計(jì)學(xué)家和數(shù)據(jù)挖掘者中廣泛用于開(kāi)發(fā)統(tǒng)計(jì)軟件和數(shù)據(jù)分析,同時(shí)R語(yǔ)言作為一個(gè)老牌分析軟件,其Library做的非常的完善,如果同學(xué)們?cè)谑褂肦語(yǔ)言時(shí)遇到任何問(wèn)題都基本可以在Library里找到答案。
專(zhuān)業(yè)級(jí):APACHE SPARK
Apache Spark是大數(shù)據(jù)分析軟件,用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一分析引擎。
它提供Java,Scala,Python和R中的高級(jí)API,以及支持常規(guī)執(zhí)行圖的優(yōu)化引擎。 和Hadoop MapReduce一樣,用于在集群上使用并行的分布式算法來(lái)處理和生成大數(shù)據(jù)集。但Spark的執(zhí)行速度比MapReduce快100倍,如果你想要進(jìn)入大數(shù)據(jù)領(lǐng)域的分析師,Spark是一定要會(huì)的技能之一。
專(zhuān)業(yè)級(jí):BIGML:
BigML是另一種廣泛使用工具,它提供了一個(gè)完全可交互的,可用于處理機(jī)器學(xué)習(xí)算法。
BigML提供了使用云計(jì)算滿足行業(yè)需求的標(biāo)準(zhǔn)化軟件。通過(guò)它,公司可以在公司的各個(gè)部門(mén)中使用機(jī)器學(xué)習(xí)算法。
例如,它可以將這一軟件用于銷(xiāo)售預(yù)測(cè),風(fēng)險(xiǎn)分析和產(chǎn)品創(chuàng)新。 BigML專(zhuān)門(mén)從事預(yù)測(cè)建模。它使用各種各樣的機(jī)器學(xué)習(xí)算法,例如聚類(lèi),分類(lèi),時(shí)間序列預(yù)測(cè)等。