正文

數(shù)據(jù)分析預測（數(shù)據(jù)分析師）

發(fā)布時間：2023-03-18 12:50:28 稿源：創(chuàng)意嶺閱讀： 445 問大家

大家好！今天讓創(chuàng)意嶺的小編來大家介紹下關于數(shù)據(jù)分析預測的問題，以下是小編對此問題的歸納整理，讓我們一起來看看吧。

開始之前先推薦一個非常厲害的Ai人工智能工具，一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等

只需要輸入關鍵詞，就能返回你想要的內(nèi)容，越精準，寫出的就越詳細，有微信小程序端、在線網(wǎng)頁版、PC客戶端

官網(wǎng)：https://ai.de1919.com

創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀企業(yè)，服務客戶遍布全國，設計相關業(yè)務請撥打175-8598-2043，或微信：1454722008

本文目錄:

1、大數(shù)據(jù)預測分析方法有哪些
2、五分鐘了解什么是預測數(shù)據(jù)分析
3、如何做數(shù)據(jù)分析
4、數(shù)據(jù)分析包括哪些內(nèi)容?

數(shù)據(jù)分析預測（數(shù)據(jù)分析師）

一、大數(shù)據(jù)預測分析方法有哪些

1、可視化分析

大數(shù)據(jù)分析的使用者有大數(shù)據(jù)分析專家，同時還有普通用戶，但是他們二者對于大數(shù)據(jù)分析最基本的要求就是可視化分析，因為可視化分析能夠直觀的呈現(xiàn)大數(shù)據(jù)特點，同時能夠非常容易被讀者所接受，就如同看圖說話一樣簡單明了。

2、數(shù)據(jù)挖掘算法

大數(shù)據(jù)分析的理論核心就是數(shù)據(jù)挖掘算法，各種數(shù)據(jù)挖掘的算法基于不同的數(shù)據(jù)類型和格式才能更加科學的呈現(xiàn)出數(shù)據(jù)本身具備的特點，也正是因為這些被全世界統(tǒng)計學家所公認的各種統(tǒng)計方法（可以稱之為真理）才能深入數(shù)據(jù)內(nèi)部，挖掘出公認的價值。另外一個方面也是因為有這些數(shù)據(jù)挖掘的算法才能更快速的處理大數(shù)據(jù)，如果一個算法得花上好幾年才能得出結(jié)論，那大數(shù)據(jù)的價值也就無從說起了。

3、預測性分析能力

大數(shù)據(jù)分析最終要的應用領域之一就是預測性分析，從大數(shù)據(jù)中挖掘出特點，通過科學的建立模型，之后便可以通過模型帶入新的數(shù)據(jù)，從而預測未來的數(shù)據(jù)。

4、數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理

大數(shù)據(jù)分析離不開數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理，高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理，無論是在學術研究還是在商業(yè)應用領域，都能夠保證分析結(jié)果的真實和有價值。當然更加深入大數(shù)據(jù)分析的話，還有很多很多更加有特點的、更加深入的、更加專業(yè)的大數(shù)據(jù)分析方法。

這是一條來自#加米谷大數(shù)據(jù)-專注大數(shù)據(jù)人才培養(yǎng)#的小尾巴

二、五分鐘了解什么是預測數(shù)據(jù)分析

數(shù)據(jù)分析比較常用到vlookup函數(shù).當然也有其它的

一、用于求平均值的統(tǒng)計函數(shù)AVERAGE、TRIMMEAN

1、求參數(shù)的算術平均值函數(shù)AVERAGE

語法形式為AVERAGE(number1,number2, ...)

其中Number1, number2, ...為要計算平均值的 1～30 個參數(shù)。這些參數(shù)可以是數(shù)字，或者是涉及數(shù)字的名稱、數(shù)組或引用。如果數(shù)組或單元格引用參數(shù)中有文字、邏輯值或空單元格，則忽略其值。但是，如果單元格包含零值則計算在內(nèi)。

2、求數(shù)據(jù)集的內(nèi)部平均值TRIMMEAN

函數(shù)TRIMMEAN先從數(shù)據(jù)集的頭部和尾部除去一定百分比的數(shù)據(jù)點，然后再求平均值。當希望在分析中剔除一部分數(shù)據(jù)的計算時，可以使用此函數(shù)。比如，我們在計算選手平均分數(shù)中常用去掉一個最高分，去掉一個最低分，XX號選手的最后得分，就可以使用該函數(shù)來計算。

語法形式為TRIMMEAN(array,percent)

其中Array為需要進行篩選并求平均值的數(shù)組或數(shù)據(jù)區(qū)域。Percent為計算時所要除去的數(shù)據(jù)點的比例，例如，如果 percent = 0.2，在 20 個數(shù)據(jù)點的集合中，就要除去 4 個數(shù)據(jù)點（20 x 0.2），頭部除去 2 個，尾部除去 2 個。函數(shù) TRIMMEAN 將除去的數(shù)據(jù)點數(shù)目向下舍為最接近的 2 的倍數(shù)。

3、舉例說明：示例中也列舉了帶A的函數(shù)AVERAGEA的求解方法。

求選手Annie的參賽分數(shù)。在這里，我們先假定已經(jīng)將該選手的分數(shù)進行了從高到底的排序，在后面的介紹中我們將詳細了解排序的方法。

二、用于求單元格個數(shù)的統(tǒng)計函數(shù)COUNT

語法形式為COUNT(value1,value2, ...)

其中Value1, value2, ...為包含或引用各種類型數(shù)據(jù)的參數(shù)（1～30個），但只有數(shù)字類型的數(shù)據(jù)才被計數(shù)。函數(shù) COUNT 在計數(shù)時，將把數(shù)字、空值、邏輯值、日期或以文字代表的數(shù)計算進去；但是錯誤值或其他無法轉(zhuǎn)化成數(shù)字的文字則被忽略。

如果參數(shù)是一個數(shù)組或引用，那么只統(tǒng)計數(shù)組或引用中的數(shù)字；數(shù)組中或引用的空單元格、邏輯值、文字或錯誤值都將忽略。如果要統(tǒng)計邏輯值、文字或錯誤值，應當使用函數(shù) COUNTA。

舉例說明COUNT函數(shù)的用途，示例中也列舉了帶A的函數(shù)COUNTA的用途。仍以上例為例，要計算一共有多少評委參與評分（用函數(shù)COUNTA），以及有幾個評委給出了有效分數(shù)（用函數(shù)COUNT）。

三、求區(qū)域中數(shù)據(jù)的頻率分布FREQUENCY

由于函數(shù) FREQUENCY 返回一個數(shù)組，必須以數(shù)組公式的形式輸入。

語法形式為FREQUENCY(data_array,bins_array)

其中Data_array為一數(shù)組或?qū)σ唤M數(shù)值的引用，用來計算頻率。如果 data_array 中不包含任何數(shù)值，函數(shù) FREQUENCY 返回零數(shù)組。Bins_array為一數(shù)組或?qū)?shù)組區(qū)域的引用，設定對 data_array 進行頻率計算的分段點。如果 bins_array 中不包含任何數(shù)值，函數(shù) FREQUENCY 返回 data_array 元素的數(shù)目。

看起來FREQUENCY的用法蠻復雜的，但其用處很大。比如可以計算不同工資段的人員分布，公司員工的年齡分布，學生成績的分布情況等。這里以具體示例說明其基本的用法。

以計算某公司的員工年齡分布情況為例說明。在工作表里列出了員工的年齡。這些年齡為 28、25、31、21、44、33、22 和 35，并分別輸入到單元格 C4:C11。這一列年齡就是 data_array。Bins_array 是另一列用來對年齡分組的區(qū)間值。在本例中，bins_array 是指 C13:C16 單元格，分別含有值 25、30、35、和 40。以數(shù)組形式輸入函數(shù) FREQUENCY，就可以計算出年齡在 25歲以下、26~30歲、31~35歲、36~40歲和40歲以上各區(qū)間中的數(shù)目。本例中選擇了5個垂直相鄰的單元格后，即以數(shù)組公式輸入下面的公式。返回的數(shù)組中的元素個數(shù)比 bins_array（數(shù)組）中的元素個數(shù)多 1。第五個數(shù)字1表示大于最高間隔 (40) 的數(shù)值（44）的個數(shù)。函數(shù) FREQUENCY 忽略空白單元格和文本值。

{=FREQUENCY(C4:C11,C13:C16)}等于 {2;2;2;1;1}

四、一組用于求數(shù)據(jù)集的滿足不同要求的數(shù)值的函數(shù)

1、求數(shù)據(jù)集的最大值MAX與最小值MIN

這兩個函數(shù)MAX、MIN就是用來求解數(shù)據(jù)集的極值（即最大值、最小值）。函數(shù)的用法非常簡單。語法形式為函數(shù)（number1,number2,...），其中Number1,number2,... 為需要找出最大數(shù)值的 1 到 30 個數(shù)值。如果要計算數(shù)組或引用中的空白單元格、邏輯值或文本將被忽略。因此如果邏輯值和文本不能忽略，請使用帶A的函數(shù)MAXA或者MINA 來代替。

2、求數(shù)據(jù)集中第K個最大值LARGE與第k個最小值SMALL

這兩個函數(shù)LARGE、SMALL與MAX、MIN非常想像，區(qū)別在于它們返回的不是極值，而是第K個值。語法形式為：函數(shù)(array,k)，其中Array為需要找到第 k 個最小值的數(shù)組或數(shù)字型數(shù)據(jù)區(qū)域。K為返回的數(shù)據(jù)在數(shù)組或數(shù)據(jù)區(qū)域里的位置（如果是LARGE為從大到小排，若為SMALL函數(shù)則從小到大排）。

3、求數(shù)據(jù)集中的中位數(shù)MEDIAN

MEDIAN函數(shù)返回給定數(shù)值集合的中位數(shù)。所謂中位數(shù)是指在一組數(shù)據(jù)中居于中間的數(shù)，換句話說，在這組數(shù)據(jù)中，有一半的數(shù)據(jù)比它大，有一半的數(shù)據(jù)比它小。

語法形式為MEDIAN(number1,number2, ...)其中Number1, number2,...是需要找出中位數(shù)的 1 到 30 個數(shù)字參數(shù)。如果數(shù)組或引用參數(shù)中包含有文字、邏輯值或空白單元格，則忽略這些值，但是其值為零的單元格會計算在內(nèi)。

4、求數(shù)據(jù)集中出現(xiàn)頻率最多的數(shù)MODE

MODE函數(shù)用來返回在某一數(shù)組或數(shù)據(jù)區(qū)域中出現(xiàn)頻率最多的數(shù)值。跟 MEDIAN 一樣，MODE 也是一個位置測量函數(shù)。

語法形式為MODE(number1,number2, ...)其中Number1, number2, ... 是用于眾數(shù)（眾數(shù)指在一組數(shù)值中出現(xiàn)頻率最高的數(shù)值）計算的 1 到 30 個參數(shù)，也可以使用單一數(shù)組（即對數(shù)組區(qū)域的引用）來代替由逗號分隔的參數(shù)。

5、以上函數(shù)的示例

以某單位年終獎金分配表為例說明。在示例中，我們將利用這些函數(shù)求解該單位年終獎金分配中的最高金額、最低金額、平均金額、中間金額、眾數(shù)金額以及第二高金額等。

詳細的公式寫法可從圖中清楚的看出，在此不再贅述。

五、用來排位的函數(shù)RANK、PERCENTRANK

1、一個數(shù)值在一組數(shù)值中的排位的函數(shù)RANK

數(shù)值的排位是與數(shù)據(jù)清單中其他數(shù)值的相對大小，當然如果數(shù)據(jù)清單已經(jīng)排過序了，則數(shù)值的排位就是它當前的位置。數(shù)據(jù)清單的排序可以使用Excel提供的排序功能完成。

語法形式為RANK(number,ref,order) 其中Number為需要找到排位的數(shù)字；Ref 為包含一組數(shù)字的數(shù)組或引用。Order為一數(shù)字用來指明排位的方式。

如果 order 為 0 或省略，則Excel 將 ref 當作按降序排列的數(shù)據(jù)清單進行排位。

如果 order 不為零，Microsoft Excel 將 ref 當作按升序排列的數(shù)據(jù)清單進行排位。

需要說明的是，函數(shù) RANK 對重復數(shù)的排位相同。但重復數(shù)的存在將影響后續(xù)數(shù)值的排位。

2、求特定數(shù)值在一個數(shù)據(jù)集中的百分比排位的函數(shù)PERCENTRANK

此PERCENTRANK函數(shù)可用于查看特定數(shù)據(jù)在數(shù)據(jù)集中所處的位置。例如，可以使用函數(shù) PERCENTRANK 計算某個特定的能力測試得分在所有的能力測試得分中的位置。

語法形式為PERCENTRANK(array,x,significance) 其中Array為彼此間相對位置確定的數(shù)字數(shù)組或數(shù)字區(qū)域。X為數(shù)組中需要得到其排位的值。Significance為可選項，表示返回的百分數(shù)值的有效位數(shù)。如果省略，函數(shù) PERCENTRANK 保留 3 位小數(shù)。

3、與排名有關的示例

仍以某單位的年終獎金分配為例說明，這里以員工Annie的排名為例說明公式的寫法。

獎金排名的公式寫法為：

=RANK(C3,$C$3:$C$12)

百分比排名的公式寫法為：

=PERCENTRANK($C$3:$C$12,C3)

以上我們介紹了Excel統(tǒng)計函數(shù)中比較常用的幾種函數(shù)，更多的涉及專業(yè)領域的統(tǒng)計函數(shù)可以參看附表以及各種相關的統(tǒng)計學書籍。

附表：

函數(shù)名稱函數(shù)說明語法形式

AVEDEV 返回一組數(shù)據(jù)與其均值的絕對偏差的平均值，即離散度。 AVEDEV(number1,number2, ...)

AVERAGE 返回參數(shù)算術平均值。 AVERAGE(number1,number2, ...)

AVERAGEA 計算參數(shù)清單中數(shù)值的平均值（算數(shù)平均值）。不僅數(shù)字，而且文本和邏輯值（如TRUE 和 FALSE）也將計算在內(nèi)。 AVERAGEA(value1,value2,...)

BETADIST 返回 Beta 分布累積函數(shù)的函數(shù)值。Beta 分布累積函數(shù)通常用于研究樣本集合中某些事物的發(fā)生和變化情況。 BETADIST(x,alpha,beta,A,B)

BETAINV 返回 beta 分布累積函數(shù)的逆函數(shù)值。即，如果 probability = BETADIST(x,...)，則 BETAINV(probability,...) = x。beta 分布累積函數(shù)可用于項目設計，在給定期望的完成時間和變化參數(shù)后，模擬可能的完成時間。 BETAINV(probability,alpha,beta,A,B)

BINOMDIST 返回一元二項式分布的概率值。 BINOMDIST(number_s,trials,probability_s,cumulative)

CHIDIST 返回 γ2 分布的單尾概率。γ2 分布與 γ2 檢驗相關。使用 γ2 檢驗可以比較觀察值和期望值。 CHIDIST(x,degrees_freedom)

CHIINV 返回 γ2 分布單尾概率的逆函數(shù)。 CHIINV(probability,degrees_freedom)

CHITEST 返回獨立性檢驗值。函數(shù) CHITEST 返回 γ2 分布的統(tǒng)計值及相應的自由度。 CHITEST(actual_range,expected_range)

CONFIDENCE 返回總體平均值的置信區(qū)間。置信區(qū)間是樣本平均值任意一側(cè)的區(qū)域。 CONFIDENCE(alpha,standard_dev,size)

CORREL 返回單元格區(qū)域 array1 和 array2 之間的相關系數(shù)。使用相關系數(shù)可以確定兩種屬性之間的關系。 CORREL(array1,array2)

COUNT 返回參數(shù)的個數(shù)。利用函數(shù) COUNT 可以計算數(shù)組或單元格區(qū)域中數(shù)字項的個數(shù)。 COUNT(value1,value2, ...)

COUNTA 返回參數(shù)組中非空值的數(shù)目。利用函數(shù)COUNTA 可以計算數(shù)組或單元格區(qū)域中數(shù)據(jù)項的個數(shù)。 COUNTA(value1,value2, ...)

COVAR 返回協(xié)方差，即每對數(shù)據(jù)點的偏差乘積的平均數(shù)，利用協(xié)方差可以決定兩個數(shù)據(jù)集之間的關系。 COVAR(array1,array2)

CRITBINOM 返回使累積二項式分布大于等于臨界值的最小值。此函數(shù)可以用于質(zhì)量檢驗。 CRITBINOM(trials,probability_s,alpha)

DEVSQ 返回數(shù)據(jù)點與各自樣本均值偏差的平方和。 DEVSQ(number1,number2,...)

EXPONDIST 返回指數(shù)分布。使用函數(shù) EXPONDIST 可以建立事件之間的時間間隔模型。 EXPONDIST(x,lambda,cumulative)

FDIST 返回 F 概率分布。使用此函數(shù)可以確定兩個數(shù)據(jù)系列是否存在變化程度上的不同。 FDIST(x,degrees_freedom1,degrees_freedom2)

FINV 返回 F 概率分布的逆函數(shù)值。 FINV(probability,degrees_freedom1,degrees_freedom2)

FISHER 返回點 x 的 Fisher 變換。該變換生成一個近似正態(tài)分布而非偏斜的函數(shù)。 FISHER(x)

FISHERINV 返回 Fisher 變換的逆函數(shù)值。使用此變換可以分析數(shù)據(jù)區(qū)域或數(shù)組之間的相關性。 FISHERINV(y)

FORECAST 根據(jù)給定的數(shù)據(jù)計算或預測未來值。 FORECAST(x,known_y's,known_x's)

FREQUENCY 以一列垂直數(shù)組返回某個區(qū)域中數(shù)據(jù)的頻率分布。 FREQUENCY(data_array,bins_array)

FTEST 返回 F 檢驗的結(jié)果。F 檢驗返回的是當數(shù)組 1 和數(shù)組 2 的方差無明顯差異時的單尾概率?？梢允褂么撕瘮?shù)來判斷兩個樣本的方差是否不同。 FTEST(array1,array2)

GAMMADIST 返回伽瑪分布?？梢允褂么撕瘮?shù)來研究具有偏態(tài)分布的變量。伽瑪分布通常用于排隊分析。 GAMMADIST(x,alpha,beta,cumulative)

GAMMAINV 返回伽瑪分布的累積函數(shù)的逆函數(shù)。 GAMMAINV(probability,alpha,beta)

GAMMALN 返回伽瑪函數(shù)的自然對數(shù)，Γ(x)。 GAMMALN(x)

GEOMEAN 返回正數(shù)數(shù)組或數(shù)據(jù)區(qū)域的幾何平均值。 GEOMEAN(number1,number2, ...)

GROWTH 根據(jù)給定的數(shù)據(jù)預測指數(shù)增長值。 GROWTH(known_y's,known_x's,new_x's,const)

HARMEAN 返回數(shù)據(jù)集合的調(diào)和平均值。調(diào)和平均值與倒數(shù)的算術平均值互為倒數(shù)。 HARMEAN(number1,number2, ...)

HYPGEOMDIST 返回超幾何分布。 HYPGEOMDIST(sample_s,number_sample,

population_s,number_population)

INTERCEPT 利用已知的 x 值與 y 值計算直線與 y 軸的截距。 INTERCEPT(known_y's,known_x's)

KURT 返回數(shù)據(jù)集的峰值。 KURT(number1,number2, ...)

LARGE 返回數(shù)據(jù)集里第 k 個最大值。使用此函數(shù)可以根據(jù)相對標準來選擇數(shù)值。 LARGE(array,k)

LINEST 使用最小二乘法計算對已知數(shù)據(jù)進行最佳直線擬合，并返回描述此直線的數(shù)組。 LINEST(known_y's,known_x's,const,stats)

LOGEST 在回歸分析中，計算最符合觀測數(shù)據(jù)組的指數(shù)回歸擬合曲線，并返回描述該曲線的數(shù)組。 LOGEST(known_y's,known_x's,const,stats)

LOGINV 返回 x 的對數(shù)正態(tài)分布累積函數(shù)的逆函數(shù)。 LOGINV(probability,mean,standard_dev)

LOGNORMDIST 返回 x 的對數(shù)正態(tài)分布的累積函數(shù)。 LOGNORMDIST(x,mean,standard_dev)

MAX 返回數(shù)據(jù)集中的最大數(shù)值。 MAX(number1,number2,...)

MAXA 返回參數(shù)清單中的最大數(shù)值。 MAXA(value1,value2,...)

MEDIAN 返回給定數(shù)值集合的中位數(shù)。中位數(shù)是在一組數(shù)據(jù)中居于中間的數(shù)。 MEDIAN(number1,number2, ...)

MIN 返回給定參數(shù)表中的最小值。 MIN(number1,number2, ...)

MINA 返回參數(shù)清單中的最小數(shù)值。 MINA(value1,value2,...)

MODE 返回在某一數(shù)組或數(shù)據(jù)區(qū)域中出現(xiàn)頻率最多的數(shù)值。 MODE(number1,number2, ...)

NEGBINOMDIST 返回負二項式分布。 NEGBINOMDIST(number_f,number_s,probability_s)

NORMDIST 返回給定平均值和標準偏差的正態(tài)分布的累積函數(shù)。 NORMDIST(x,mean,standard_dev,cumulative)

NORMINV 返回給定平均值和標準偏差的正態(tài)分布的累積函數(shù)的逆函數(shù)。 NORMINV(probability,mean,standard_dev)

NORMSDIST 返回標準正態(tài)分布的累積函數(shù)，該分布的平均值為 0，標準偏差為 1。 NORMSDIST(z)

NORMSINV 返回標準正態(tài)分布累積函數(shù)的逆函數(shù)。該分布的平均值為 0，標準偏差為 1。 NORMSINV(probability)

PEARSON 返回 Pearson（皮爾生）乘積矩相關系數(shù)，r，這是一個范圍在 -1.0 到 1.0 之間（包括 -1.0 和 1.0 在內(nèi)）的無量綱指數(shù)，反映了兩個數(shù)據(jù)集合之間的線性相關程度。 PEARSON(array1,array2)

PERCENTILE 返回數(shù)值區(qū)域的 K 百分比數(shù)值點。可以使用此函數(shù)來建立接受閥值。例如，可以確定得分排名在 90 個百分點以上的檢測侯選人。 PERCENTILE(array,k)

PERCENTRANK 返回特定數(shù)值在一個數(shù)據(jù)集中的百分比排位。此函數(shù)可用于查看特定數(shù)據(jù)在數(shù)據(jù)集中所處的位置。例如，可以使用函數(shù) PERCENTRANK 計算某個特定的能力測試得分在所有的能力測試得分中的位置。 PERCENTRANK(array,x,significance)

PERMUT 返回從給定數(shù)目的對象集合中選取的若干對象的排列數(shù)。排列可以為有內(nèi)部順序的對象或為事件的任意集合或子集。排列與組合不同，組合的內(nèi)部順序無意義。此函數(shù)可用于彩票計算中的概率。 PERMUT(number,number_chosen)

POISSON 返回泊松分布。泊松分布通常用于預測一段時間內(nèi)事件發(fā)生的次數(shù)，比如一分鐘內(nèi)通過收費站的轎車的數(shù)量。 POISSON(x,mean,cumulative)

PROB 返回一概率事件組中落在指定區(qū)域內(nèi)的事件所對應的概率之和。如果沒有給出 upper_limit，則返回 x _range 內(nèi)值等于 lower_limit 的概率。 PROB(x_range,prob_range,lower_limit,upper_limit)

QUARTILE 返回數(shù)據(jù)集的四分位數(shù)。四分位數(shù)通常用于在銷售額和測量值數(shù)據(jù)集中對總體進行分組。例如，可以使用函數(shù) QUARTILE 求得總體中前 25% 的收入值。 QUARTILE(array,quart)

RANK 返回一個數(shù)值在一組數(shù)值中的排位。數(shù)值的排位是與數(shù)據(jù)清單中其他數(shù)值的相對大?。ㄈ绻麛?shù)據(jù)清單已經(jīng)排過序了，則數(shù)值的排位就是它當前的位置）。 RANK(number,ref,order)

RSQ 返回根據(jù) known_y's 和 known_x's 中數(shù)據(jù)點計算得出的 Pearson 乘積矩相關系數(shù)的平方。有關詳細信息，請參閱函數(shù) REARSON。R 平方值可以解釋為 y 方差與 x 方差的比例。 RSQ(known_y's,known_x's)

SKEW 返回分布的偏斜度。偏斜度反映以平均值為中心的分布的不對稱程度。正偏斜度表示不對稱邊的分布更趨向正值。負偏斜度表示不對稱邊的分布更趨向負值。 SKEW(number1,number2,...)

SLOPE 返回根據(jù) known_y's 和 known_x's 中的數(shù)據(jù)點擬合的線性回歸直線的斜率。斜率為直線上任意兩點的重直距離與水平距離的比值，也就是回歸直線的變化率。 SLOPE(known_y's,known_x's)

SMALL 返回數(shù)據(jù)集中第 k 個最小值。使用此函數(shù)可以返回數(shù)據(jù)集中特定位置上的數(shù)值。 SMALL(array,k)

STANDARDIZE 返回以 mean 為平均值，以 standard-dev 為標準偏差的分布的正態(tài)化數(shù)值。 STANDARDIZE(x,mean,standard_dev)

STDEV 估算樣本的標準偏差。標準偏差反映相對于平均值（mean）的離散程度。 STDEV(number1,number2,...)

STDEVA 估算基于給定樣本的標準偏差。標準偏差反映數(shù)值相對于平均值（mean）的離散程度。文本值和邏輯值（如 TRUE 或 FALSE）也將計算在內(nèi)。 STDEVA(value1,value2,...)

STDEVP 返回以參數(shù)形式給出的整個樣本總體的標準偏差。標準偏差反映相對于平均值（mean）的離散程度。 STDEVP(number1,number2,...)

STDEVPA 計算樣本總體的標準偏差。標準偏差反映數(shù)值相對于平均值（mean）的離散程度。 STDEVPA(value1,value2,...)

STEYX 返回通過線性回歸法計算 y 預測值時所產(chǎn)生的標準誤差。標準誤差用來度量根據(jù)單個 x 變量計算出的 y 預測值的誤差量。 STEYX(known_y's,known_x's)

TDIST 返回學生 t- 分布的百分點（概率），t 分布中數(shù)值 (x) 是 t 的計算值（將計算其百分點）。t 分布用于小樣本數(shù)據(jù)集合的假設檢驗。使用此函數(shù)可以代替 t 分布的臨界值表。 TDIST(x,degrees_freedom,tails)

TINV 返回作為概率和自由度函數(shù)的學生 t 分布的 t 值。 TINV(probability,degrees_freedom)

TREND 返回一條線性回歸擬合線的一組縱坐標值（y 值）。即找到適合給定的數(shù)組 known_y's 和 known_x's 的直線（用最小二乘法），并返回指定數(shù)組 new_x's 值在直線上對應的 y 值。 TREND(known_y's,known_x's,new_x's,const)

TRIMMEAN 返回數(shù)據(jù)集的內(nèi)部平均值。函數(shù) TRIMMEAN 先從數(shù)據(jù)集的頭部和尾部除去一定百分比的數(shù)據(jù)點，然后再求平均值。當希望在分析中剔除一部分數(shù)據(jù)的計算時，可以使用此函數(shù)。 TRIMMEAN(array,percent)

TTEST 返回與學生氏- t 檢驗相關的概率。可以使用函數(shù) TTEST 判斷兩個樣本是否可能來自兩個具有相同均值的總體。 TTEST(array1,array2,tails,type)

VAR 估算樣本方差。 VAR(number1,number2,...)

VARA 估算基于給定樣本的方差。不僅數(shù)字，文本值和邏輯值（如 TRUE 和 FALSE）也將計算在內(nèi)。 VARA(value1,value2,...)

VARP 計算樣本總體的方差。 VARP(number1,number2,...)

VARPA 計算樣本總體的方差。不僅數(shù)字，文本值和邏輯值（如 TRUE 和 FALSE）也將計算在內(nèi)。 VARPA(value1,value2,...)

WEIBULL 返回韋伯分布。使用此函數(shù)可以進行可靠性分析，比如計算設備的平均故障時間。 WEIBULL(x,alpha,beta,cumulative)

ZTEST 返回 z 檢驗的雙尾 P 值。Z 檢驗根據(jù)數(shù)據(jù)集或數(shù)組生成 x 的標準得分，并返回正態(tài)分布的雙尾概率?？梢允褂么撕瘮?shù)返回從某總體中抽取特定觀測值的似然估計。

三、如何做數(shù)據(jù)分析

數(shù)據(jù)分析有：分類分析，矩陣分析，漏斗分析，相關分析，邏輯樹分析，趨勢分析，行為軌跡分析，等等。我用HR的工作來舉例，說明上面這些分析要怎么做，才能得出洞見。

01）分類分析

比如分成不同部門、不同崗位層級、不同年齡段，來分析人才流失率。比如發(fā)現(xiàn)某個部門流失率特別高，那么就可以去分析。

02）矩陣分析

比如公司有價值觀和能力的考核，那么可以把考核結(jié)果做出矩陣圖，能力強價值匹配的員工、能力強價值不匹配的員工、能力弱價值匹配的員工、能力弱價值不匹配的員工各占多少比例，從而發(fā)現(xiàn)公司的人才健康度。

03）漏斗分析

比如記錄招聘數(shù)據(jù)，投遞簡歷、通過初篩、通過一面、通過二面、通過終面、接下Offer、成功入職、通過試用期，這就是一個完整的招聘漏斗，從數(shù)據(jù)中，可以看到哪個環(huán)節(jié)還可以優(yōu)化。

04）相關分析

比如公司各個分店的人才流失率差異較大，那么可以把各個分店的員工流失率，跟分店的一些特性（地理位置、薪酬水平、福利水平、員工年齡、管理人員年齡等）要素進行相關性分析，找到最能夠挽留員工的關鍵因素。

05）邏輯樹分析

比如近期發(fā)現(xiàn)員工的滿意度有所降低，那么就進行拆解，滿意度跟薪酬、福利、職業(yè)發(fā)展、工作氛圍有關，然后薪酬分為基本薪資和獎金，這樣層層拆解，找出滿意度各個影響因素里面的變化因素，從而得出洞見。

06）趨勢分析

比如人才流失率過去12個月的變化趨勢。

07）行為軌跡分析

比如跟蹤一個銷售人員的行為軌跡，從入職、到開始產(chǎn)生業(yè)績、到業(yè)績快速增長、到疲憊期、到逐漸穩(wěn)定。

通過面向企業(yè)業(yè)務場景提供一站式大數(shù)據(jù)分析解決方案，能夠為企業(yè)在增收益、降成本、提效率、控成本等四個角度帶來價值貢獻。

1、增收益

最直觀的應用，即利用數(shù)據(jù)分析實現(xiàn)數(shù)字化精準營銷。通過深度分析用戶購買行為、消費習慣等，刻畫用戶畫像，將數(shù)據(jù)分析結(jié)果轉(zhuǎn)化為可操作執(zhí)行的客戶管理策略，以最佳的方式觸及更多的客戶，以實現(xiàn)銷售收入的增長。

下圖為推廣收支測算分析，為廣告投放提供決策依據(jù)。

下圖為渠道銷量分析，為渠道支持提供數(shù)據(jù)支撐。

2、降成本

例如通過數(shù)據(jù)分析實現(xiàn)對財務和人力的管理，從而控制各項成本、費用的支出，實現(xiàn)降低成本的作用。

下圖為生產(chǎn)成本分析，了解成本構成情況。

下圖為期間費用預實對比分析，把控費用情況。

3、提效率

每個企業(yè)都會出具相關報表，利用數(shù)據(jù)分析工具，不懂技術的業(yè)務人員也能夠通過簡單的拖拉拽實現(xiàn)敏捷自助分析，無需業(yè)務人員提需求、IT人員做報表，大大提高報表的及時性，提高了報表的使用效率。

通過數(shù)據(jù)分析工具，能夠在PC端展示，也支持移動看板，隨時隨地透視經(jīng)營，提高決策效率。

4、控風險

預算是否超支？債務是否逾期？是否缺貨了、斷貨了？客戶的回款率怎么樣？設備的運行是否正常？哪種產(chǎn)品是否需要加速生產(chǎn)以實現(xiàn)產(chǎn)銷平衡？...其實，幾乎每個企業(yè)都會遇到各種各樣的風險問題。通過數(shù)據(jù)分析，能夠幫助企業(yè)進行實時監(jiān)測，對偏離了預算的部分、對偏離了正常范圍的數(shù)值能夠進行主動預警，降低企業(yè)風險。

下圖為稅負率指標，當綜合稅負率過高，可以實現(xiàn)提示和預警。

下圖為重要指標預警，重點監(jiān)控項目的毛利率。

四、數(shù)據(jù)分析包括哪些內(nèi)容?

1.數(shù)據(jù)獲取

數(shù)據(jù)獲取看似簡單，但是需要把握對問題的商業(yè)理解，轉(zhuǎn)化成數(shù)據(jù)問題來解決，直白點講就是需要哪些數(shù)據(jù)，從哪些角度來分析，界定問題后，再進行數(shù)據(jù)采集。此環(huán)節(jié)，需要數(shù)據(jù)分析師具備結(jié)構化的邏輯思維。

2.數(shù)據(jù)處理

數(shù)據(jù)的處理需要掌握有效率的工具：Excel基礎、常用函數(shù)和公式、數(shù)據(jù)透視表、VBA程序開發(fā)等式必備的;其次是Oracle和SQL sever，這是企業(yè)大數(shù)據(jù)分析不可缺少的技能;還有Hadoop之類的分布式數(shù)據(jù)庫，也要掌握。

3.分析數(shù)據(jù)

分析數(shù)據(jù)往往需要各類統(tǒng)計分析模型，如關聯(lián)規(guī)則、聚類、分類、預測模型等等。SPSS、SAS、Python、R等工具，多多益善。

4.數(shù)據(jù)呈現(xiàn)

可視化工具，有開源的Tableau可用，也有一些商業(yè)BI軟件，根據(jù)實際情況掌握即可。

以上就是關于數(shù)據(jù)分析預測相關問題的回答。希望能幫到你，如有更多相關問題，您也可以聯(lián)系我們的客服進行咨詢，客服也會為您講解更多精彩的知識和內(nèi)容。