當前位置：首頁 > 科技 > 正文

Excel數據分析篇：如何用Excel做一次完整的數據分析

啟示号
科技
2年前
282

今天這篇講實操，教大家用Excel做一次簡單的分析。一是讓大家了解資料分析是一個怎樣的流程；其次熟練Excel的操作(學的知識要利用起來)，包括公式，數據透視表等。

這裡我用Python在智聯招聘上爬取了約1800條的BI工程師的職位信息，并且将崗位名稱、公司名稱、薪水、所在城市、所屬行業、學曆要求、工作年限這些關鍵信息用CSV文件保存下來。

操作版本：Excel 2016 ，WIN 10

一個完整的數據分析都需要經曆這樣幾個步驟：

§ 數據采集 — — 這裡我已經用Python爬好了；

§ 明确分析目的 — — 你拿這數據要得到什麼信息，解決什麼問題；

§ 觀察資料 — — 各個數據字段的含義，中英文釋義；

§ 數據清洗 — — 無效值、缺失值、重複值處理，數據結構是否一緻等；

§ 分析過程 — — 圍繞目的展開分析；

§ 制作可視化 — — 做圖表做可視化報告。

一、明确目的

數據分析的大忌是不知道分析的方向和目的，拿着一堆數據不知所措。數據用來解決什麼問題？

是進行彙總統計制作成報表？

是進行數據可視化，作為一張信息圖？

是驗證某一類業務假設？

是希望提高某一個指标的KPI？

要知道一切數據分析都是以業務為核心目的，所以要找到業務問題的思考點。關于找到問題的切入點，之前資料分析思維篇講過。永遠不要妄圖在一堆數據中找結論，目标在前，數據在後，哪怕是把數據做個平均值比較，也比沒有方向好。每一步嘗試都會引發進一步思考，比如為什麼這個值這麼低，原因在哪裡，這個差異波動有何規律……

所以，分析前不妨先來看一下我們爬的數據：

Excel數據分析篇：如何用Excel做一次完整的數據分析

假設我是一個BI工程師，我想知道：

目前BI工程師的平均薪資水平如何，薪資的區間分布如何

各地區對BI工程師的需求量是多少，哪些地區設崗最多。

不同年限的BI工程師薪資差異如何，3年後我差不多是什麼樣的價位？

薪水較高的公司有哪些？

帶着這樣的問題，那我們的分析就有了方向，後續則是将目标拆解為實際分析展示的過程。

二、了解資料概況

Excel數據分析篇：如何用Excel做一次完整的數據分析

拿到數據肯定是要先看一下的，你想要的數據全不全，拿到的數據有哪些可分析之處。主要就是看數據字段，要了解數據字段的含義：

JobName — — 崗位名稱

Company — — 公司名

Salary — — 薪水

City — — 城市

Jobtype — — 崗位領域

Edulevel — — 學曆要求

WorkingExp — — 工作年限要求

三、數據清洗

接下來進行數據清洗。數據清洗一般包括無效值、缺失值、重複值處理；資料是否有亂碼，錯位現象；資料口徑問題，兩張表的關聯ID名是否一緻；還有是否有統一的标準或命名，如公司名全寫或縮寫的區分。數據轉換則是将數據規整為統一格式處理。因為這是隻是Excel級别的數據分析，且就一張簡單的數據表，不會有太多複雜的操作。這裡簡單總結下。

1、有無缺失值

數據的缺失會很大程度影響分析結果。資料缺失的原因很多，比如數據采集的時候，因為技術的原因，爬蟲沒有完全抓去。但工作上更多的原因是資料入庫的時候就沒有收集全，有沒填有遺漏，這又是數據規範數據治理的話題了。一般來說，如果某一字段數據缺失超過40%~50%，就沒有分析意義了，考慮删除或作其他措施。

看數據有沒有缺失，隻要在Excel中選中該列看計數。

這裡，eduLevel有缺失（1759/1800）但不多，不影響實際分析。

2、髒數據處理

發現jobName列裡面有一些類似BIM工程師的崗位信息，這些應該都是土木行業的工程師，爬去時沒做過濾，還有包含“bim”“BIOS””BIW”等字段。

因為包含多重過濾，這裡我建立輔助列，設立判斷條件，然後進行篩選過濾。

Excel數據分析篇：如何用Excel做一次完整的數據分析

=IF(OR(COUNTIF(A5,”*”&{“bim”,”BIM”,”BIOS”,”BIW”}&”*”)),1,”0")

公式的意思是，如果含有這些字段中的任何一個則為1，否則為0。這裡我們需要篩選出結果為0的數據，總計篩選下來600多條，數據還是很髒的。

多重篩選，還可以用數據選項卡裡的高級篩選功能，就不掩飾了。

3、重複數據

重複數據一般對唯一标識字段來處理，比如用戶ID，訂單ID，公司ID這些，這些字段都代表這一行數據是唯一存在的。嚴格來講，這裡的表應該存在公司ID這一字段，爬取數據的問題，我這就懶得再重爬了，就對Company字段做重複值處理。

這裡有一個快速竅門，使用Excel的删除重複項功能，快速定位是否有重複數據。對company列進行重複項删除操作：

Excel數據分析篇：如何用Excel做一次完整的數據分析

隻剩下562個值了。到此，一些髒數據基本清理的差不多了。

最後，salary有一些數據是“薪資面議”，“校招”的，這裡也一并過濾掉。Jobtype過濾掉汽車、電子等行業，隻留包含IT互聯網行業，最後剩下不到500條數據。

4、數據再加工

一者是salary薪水用了幾K表示，這是文本，不能直接用于計算。而且還是一個範圍，後續得按照最高薪水和最低薪水拆成兩列。

二者由于城市字段存儲有的數據為“城市-區域”格式，例如“上海-徐彙區”，為了方便分析每個城市的數據，最後新增列“城市”，截取“-”前面的真實城市數據。

為了方便整理，和原數據區分，也防止原數據丢失，這裡把之前處理的數據複制粘貼到另一張表裡。

① 薪水處理

将salary拆成最高薪水和最低薪水有三種辦法。

一是直接分列，以”-”為拆分符，得到兩列數據，然後利用替換功能删除 k這個字符串。得到結果。

二是自動填充功能，填寫已填寫的内容自動計算填充所有列。

三是利用文本查找，重點講一下這個。

寫公式的思路是，先查找第一個K出現的位置，然後再-1，去除掉K。所以公式是：

=LEFT(C2,FIND(“K”,C2,1)-1)

Excel數據分析篇：如何用Excel做一次完整的數據分析

同樣的思路，最高薪水需要利用find查找”-”位置,然後截取從”-” 到最後第二個位置的字符串。

=MID(C2,FIND(“-”,C2,1)+1,LEN(C2)-FIND(“-”,C2,1)-1)

這裡，在新增數據列，平均薪水，來近似代表實際的準确薪資。平均薪水=(薪水下限+薪水上限)/2，即可得到每個崗位的平均薪水。

Excel數據分析篇：如何用Excel做一次完整的數據分析

②真實城市截取

由于城市字段存儲有的數據為“城市-區域”格式，例如“上海-徐彙區”，為了方便分析每個城市的數據，最後新增列“城市”，截取“-”前面的真實城市數據。

=IF(COUNTIF(G2,”*-*”)=0,G2,LEFT(G2,FIND(“-”,G2,1)-1))

至此，所有數據清洗加工完畢，食材已經全部準備好，下面可以正式開始數據可視化的美食下鍋烹饪了。

四、分析過程

分析過程有很多玩法，因為這裡主要數據均是文本格式，資料又很簡單，所以偏向彙總統計的計算。如果數值型的資料比較多，就會涉及到統計、比例等概念。如果有時間類數據，那麼還會有趨勢、變化的概念。

整體分析使用數據透視表完成，先利用數據透視表獲得彙總型統計。

1、BI工程師需求概況分析

Excel數據分析篇：如何用Excel做一次完整的數據分析

這裡我簡單加了一下增材區分，增加數據大小的辨識度。（條件格式 — — 色階）

看來北上廣深的BI工程師崗位遠多于其他城市，成都杭州武漢梯隊次之。1~3年以及3~5年經驗的缺口相當。

2、BI工程薪資情況分析

Excel數據分析篇：如何用Excel做一次完整的數據分析

各經驗年齡的平均薪資狀況，差距梯度還是很明顯的。

Excel數據分析篇：如何用Excel做一次完整的數據分析

目前市面上BI工程的薪資主要分許在7~17K左右區間。23~26K，應該是5~10年左右經驗的崗位也相當。

3、薪資變化随着經驗的增長，學曆影響力的大小

Excel數據分析篇：如何用Excel做一次完整的數據分析

整體來說，BI工程師大專和本科的薪資差異并不是很大，3~5年經驗，本科稍占優勢。到5~10年，基本拉平，也就是說學曆因素影響比重更弱，這時候更看重經驗。

其他的分析過程就不多做贅述了，主要是使用數據透視表和數據透視圖進行多維度（城市，學曆，工作經驗）的分析，沒有其他複雜的技巧。

關于資料透視圖和數據透視表。選中所要分析的數據列，2013版以上的Excel基本上都很智能的幫你推薦圖标，生成透視接口，隻要分清楚拖拽的字段事到列，到值還是到行即可。然後視情況多數據做一定篩選，因為數據清洗得不一定很徹底，我在制作的過程中就忽略了一些字段的空缺值，又回過頭做了過濾。

Excel數據分析篇：如何用Excel做一次完整的數據分析

最後

到此，一個簡單的數據分析基本結束了。因為資料簡單，并沒有涉及過多的資料整合，表合并，專業資料統計回歸等操作。

整個數據分析過程最費時間的數據清理，大約占據70%，隻要明确了目的，可視化分析師很簡單的。

其次，也可以看到，用Excel做分析，更多的優勢是數據的簡單處理。随便過濾、查詢、定位救你呢了解數據的概況。但在可視化方面比較雞肋，行列值選擇，以及複雜的圖表制作都有一些難度，一句話總結Excel可視化要想做的好看還是要費點時間的。

所以我在分析的時候，基本上就是用Excel看看數據全貌，簡單處理下。分析、可視化什麼的還是會交給BI。後面，我會再出一篇用BI制作的教程。

你可能想看：

Excel數據分析篇：數據分析必備的43個Excel函式

函式HLOOKUP和VLOOKUP都是用來在表格中查找數據。用于查找首列滿足條件的元素，并在表格或數組中指定的欄的同一lan中返回一個值，=VLOOKUP（要查找的值：HLOOKUP返回的值與需要查找...

Excel數據透視表，解決了90%的excel數據分析處理--初學篇

30天讓你從不會到熟練使用Excel數據透視表！Excel數據透視表的各項功能和使用方法，我們将按照的先後順序以創建、設置、使用數據透視表的整體流程來進行安排，包括數據透視表的定義、使用數據透視表的原...

Excel數據分析篇：通過數據模型創建數據透視表并分析數據

創建數據透視表可以高效地為數據分析和處理服務，下面我們一起來了解一下通過數據模型創建數據透視表并應用它來做一些數據的分析。需要使用數據模型中的數據創建一個透視表，可參考文章（Excel使用Power ...

Excel數據分析篇：數據透視表的操作及使用技巧

數據透視表在Excel中可以說是分析數據的神器，下面帶大家認識了解數據透視表的使用方法。1、插入數據透視表，選擇需要的數據表，點擊插入-表格-數據透視表，确定就可以在單元格中建立數據透視表，2、數據透...

Excel數據分析篇：使用Power Query對數據進行逆透視

我們可以對一份原始數據通過數據透視表進行深入的分析處理，從而生成所需的數據報告，我們通過Power Query編輯器對數據進行了一系列的轉換，在Excel中得到如下的數據表格，不過此數據表格的最後5列...

Excel VBA 7.19 Excel跨工作薄多工作表數據合并之Excel表格多行表頭

所以我們今天針對多行表頭的數據彙總來分析下方法場景模拟假設我們要統計的Excel中每個表格都有表頭，1) End If Next sth End If ActiveWorkbook.Close Fal...

用Excel做“流程圖”竟然這麼方便，光速提高效率，用起來太爽了

Excel該怎麼制作流程圖”一、彙總流程安排“首先我們将提前準備好的【流程安排】輸入到Excel表格中，再根據流程順序彙總【層級次序】，并整理成為一個表格（如下圖所示）。02、将【流程安排】轉為圖片”...

Excel教程：快速填充技巧和excel數據提取公式分享

使用函數公式和快速填充兩種方法完成哦，快速填充方法使用Ctrl+E快速填充。可以實現中文和字母提取，B2單元格輸入，選擇C2單元格輸入英文，C3、C4單元格也做同樣的操作，為什麼C列要連續輸入前面3個...

Excel教程：Excel數據提取工作實戰案例：提取數字、字母、中文

Excel數據提取是我們在做數據整理的時候，在高版本的Excel有快速填充進行數據提取，下面的Excel銀行明細流水表，記錄了賬戶交易明細數據，現在需要将B列的日期和收支來源分别提取出來，請在C2和D...

終于，Excel數據處理的方式來到了一個十字路口：Excel中的函數式編程簡介

是繼續沿用的方式還是使用函數式編程的思路。今天我們簡單介紹一下Excel中的函數式編程。因為它全部是使用Excel的函數創建公式而已。你需要做的是調整在Excel中使用函數處理數據的思路。Excel與...

Excel技巧應用篇：【上班族必看】Excel 基礎技巧輕松學，善用 Excel 提升工作效率

利用折線圖繪制實際成績／預測圖表，利用時間軸呈現值的趨勢的「折線圖」，折線圖能清楚呈現「數據的變化」。折線圖是依照「數年、數月、數日這種時間軸來觀察值的變化」的圖表。是無法繪制出具有意義的折線圖。此為...

excel篩選條件怎麼設置 excel怎麼篩選出自己想要的數據

excel篩選條件怎麼設置?Excel能夠幫助我們進行複雜的數據處理，有時我們想在表格中找到特定的數據，此時就可以使用excel的篩選功能，來篩選出我們需要的數據，今天小編就來告訴大家excel篩選條...

我積攢10年的數據，用Excel制作了一個“層巒疊嶂”圖表！

數據、excel、圖表：今天來用一份10年的明細數據”我們可以從浩如煙海的數據中讀到很多——數據想告訴我們的故事。它是對數據整體時間趨勢分布的一種很直觀的圖表類型“用EXCEL在百萬大山中看天氣數據，...

如何用Excel2分鐘制作一個自動抽獎小程序？

另一個當然是Excel教程---教你兩分鐘用Excel做出一個超有趣的抽獎小程序。有Excel函數公式視頻，用Excel做一個簡單的抽獎小程序，教你2分鐘用Excel制作出自動抽獎小程序，先來認識幾個...

詳細講解如何用EXCEL制作登錄界面

1.2 鼠标右鍵點擊空白處依次選擇插入—用戶窗體，1.4 選中窗體後點擊屬性（如下圖所示）”打開窗體的屬性窗口“1.5 打開屬性窗口後按下圖方式依次點擊”在彈出的窗口中選擇要插入的圖片，1.7 在屬性...

如何用Excel快速制作組織架構圖？

你做組織結構圖是像下面這樣一個個複制粘貼嗎，有專門做組織結構的模塊——SmartArt，2.如何快速創建一個組織結構圖，【SmartArt基礎操作】，1.當我們點擊SmartArt後。這裡為我們創建了...

如何用excel自制股票實時行情詳解（power query）

上次講了用的方法獲得網絡數據，從而實現實時股票數據的**。query的方法**批量的數據。query獲取批量的股票信息剛才我們是輸入了一個網址，對應了一個股票的信息，那麼，如果我們的股票列表是成百上千...

Excel技巧應用篇：Excel 同時使用兩種圖表類型與兩個坐标軸，呈現差異極大的數值

這裡介紹如何在 Excel 中同時使用兩種圖表類型與兩個坐标軸，将 Excel 表格中的數據繪制成圖形時，以下我們将以實際的例子來示範如何将兩種不同類型的數據畫在同一張圖形上，以下是調整數據系列格式。...

excel數據處理技巧：快速引用數據，制作自動更新的通報表格

如果每次都要重新輸入日期、手動整理計算數據，今天苗老師要和大家分享一張全自動的Excel業績通報表，我再看看你的取值表，先說表格部分，關于表格中的日期問題。數據會随着日期每天變化”接着我們可以為這張通...

Excel教程：excel對比兩列數據技巧

下面的Excel表格，在F列輸入公式完成金額核對，F2單元格公式為：一下VLOOKUP函數的用法。VLOOKUP函數是在表格的首列查找指定的值：并由此返回表格當前行中其他列的值,VLOOKUP函數的常...

數據資料 BI 分析字段

上一篇
人生4大天規、7大天律、3大平衡，越早知道越受益無窮！

下一篇
沈騰馬麗擔任主角，《獨行月球》背後的中國式浪漫

Excel數據分析篇：如何用Excel做一次完整的數據分析

一、明确目的

二、了解資料概況

三、數據清洗

四、分析過程

最後

有話要說...取消回複

最新文章

太師修行問答48：人生隻是演戲瑜伽也能修禅，能達到幾禅

[書法]閑暇草書彙03

3D技巧：兩碼和差選号法

“落日無情最有情，遍催萬樹暮蟬鳴”楊萬裡詩五首，風格清新自然

《玄理賦》五行生克的太過不及等

《老山1984-1989，中越老山之戰實錄》連載之二：118團8連收敲掉54

攝影：故鄉的秋色（2）

論入宅歸火擇吉（續）第二，坐向要吉坐向要吉，主要是指所選日課

熱門文章

非常醍醐灌頂的一段話：“你活着的時候，沒有幾個人在觀看，你死

敲詐勒索罪的界定 - 已解決 - 搜搜問問

漢書·卷二十四下·食貨志（華夏文明公元前206-公元前23年）

《西洋古代軍事戰略》中世紀晚期特别篇收複失地運動 & 格...

圍棋之死活乾坤（二十七）

五子衍宗丸搭一物，作用翻倍！1、五子衍宗丸六君子丸精能化氣、氣

女朋友經驗男實戰案例——戀愛經典聊法，用心學10天帶女友回家

黃元禦學術思想及用藥總結