本文是Excel氣泡圖應用的實踐案例,通過氣泡圖對房地產數據分析的應用,讓大家瞭解氣泡圖的適用場景,以及發現一些數據的特徵。
收集鏈家二手房數據
利用gooseeker的在線快捷爬數據應用——數據DIY,抓取鏈家上武漢的二手房列表數據,一共爬到300條數據,把它作為樣本,簡單分析一下房產價格的影響因素。
數據DIY地址:
https://www.gooseeker.com/res/datadiy.html?category=%E6%88%BF%E5%9C%B0%E4%BA%A7&web=%E9%93%BE%E5%AE%B6&rule=%E9%93%BE%E5%AE%B6%E4%BA%8C%E6%89%8B%E6%88%BF%E5%9C%A8%E5%94%AE%E6%88%BF%E6%BA%90%E5%88%97%E8%A1%A8
數據處理
對房屋信息一列用Excel的分列功能,清洗出戶型、面積、朝向、裝修、電梯情況這4類信息。
對位置信息這列用分列功能,把建築年代單獨作為一列,再用mid函數提取出年代數值,最後用減法算出樓齡。
最後要把文本格式的數據轉為數值格式,後面畫圖需要用到。
關於氣泡圖
Excel的圖表中大部分都只能展示兩組變量之間的關係,即(x,y)數據點的分佈,而氣泡圖則可以呈現三組變量之間的相互關係,即除了橫座標和縱座標上的兩個變量外,還可以通過氣泡的大小變化來表達第三個變量的變化情況。在《爬取鏈家數據,用散點圖分析武漢市二手房價格》一文中已經介紹了散點圖的作用及製作方法,其實可以把氣泡圖歸納為散點圖中的一種,只是氣泡圖比散點圖多展示了一組數據間的關係,所以製作氣泡圖需要在散點圖的基礎上多準備一組數據用來表示氣泡的大小。氣泡圖的每個氣泡都包含三個值:x,y,z,其中 x 和 y 用於定位,z 表示計算氣泡的大小。 下面來介紹一下氣泡圖的製作方法,大致與散點圖製作方法一致。
用Excel製作氣泡圖
製作氣泡圖需要三個數據項,X軸數據,Y軸數據,代表氣泡大小的數據。根據上面整理出來的房地產數據,用X軸表示面積,Y軸表示樓齡,用價格來表示氣泡大小,藉此來觀察三者關係。
數據準備好後我們開始製作氣泡圖,在Excel2016版本的插入圖表中,氣泡圖已經放到了散點圖的類別裡,我們只需選中準備好的數據,分別點擊:插入-查看所有圖表-XY散點圖-三維氣泡圖進行插入即可。
生成的三維氣泡圖效果如下
由於數據量比較多,所以生成的氣泡都密密麻麻的擠在一起了,可以通過調節氣泡的大小來讓氣泡散開。右鍵繪圖區的氣泡,選擇設置數據系列格式,在右邊彈出的設置欄中來調節氣泡的大小
調整到能大致觀察到每個氣泡點的大小,這裡選擇用氣泡寬度表示氣泡大小,縮放氣泡大小調整為90
調整之後的效果如下
數據分析
從圖上氣泡的分佈情況來看,可以很明顯的觀察到,面積、樓齡和價格的關聯性:
在樓齡為2-17年區間,相等樓齡下,可以明顯的發現氣泡的大小隨著面積的增大而增大,這說明同等樓齡下,面積越大的房源,價格越高。
在面積為100-250區間,相等面積下,可以明顯發現氣泡的大小隨著樓齡的增大而減小,這說明同等面積下,樓齡越大的房源,價格越低。
閱讀更多 語義網絡爬蟲 的文章