想通過這篇分享, 總結(jié)下用過的一些數(shù)據(jù)可視化方式, 主要是想分享下圖表的一些使用心得. 數(shù)據(jù)可視化其實是一門挺有深度的學(xué)問, 也看過一些書. 這里的內(nèi)容還是從基本的圖表解釋, 從簡單開始, ?how to see everything is very important for our BUSSINESS.
先介紹幾個基本視圖的使用及應(yīng)用場景, 部分信息和圖表參考于Data Visualization with JS
柱狀圖: ?二維數(shù)據(jù)集, 適用于只需要比較其中一維, 利用柱子的高度表現(xiàn)差異, 不過只適用于小規(guī)模的數(shù)據(jù)集. 通常X軸是時間軸, 如果X軸不是時間維, 建議用顏色區(qū)分柱子, 改變用戶對時間趨勢的關(guān)注.

折線圖:二維大數(shù)據(jù)集, 尤其是在表現(xiàn)和強調(diào)數(shù)據(jù)趨勢時適用, 可以讓用戶忽略單個的數(shù)據(jù)點. 而且折線圖比較適合多個相關(guān)的二維數(shù)據(jù)的比較.

餅圖: ?通常用于二維, 適用于反映部分與整體的關(guān)系, 餅圖并不適合比較元素間的度量關(guān)系, 因為人對面積的感覺并不靈敏, 所以餅圖更適合表現(xiàn)部分與整體的占比情況,?

散點圖: ? 適用于三維數(shù)據(jù)集,但只比較其中兩維,可通過顏色區(qū)分第三維. 比如比較某個國家的醫(yī)療支出和預(yù)期壽命, 地區(qū)靠顏色區(qū)分, 只有后兩個維度需要比較

氣泡圖: ?三維或四維 ? 散點圖的變體,通過氣泡大小區(qū)分第三維,通過顏色或標簽區(qū)分第四維. 因為用戶對面積大小敏感度低, 所以適用于不要求精確辨識第三維的場景. 其實我們可以注意到, 下面我做的這張圖表現(xiàn)的維度雖然也只是四維, 不過通過餅圖做到了對比各個地區(qū)業(yè)務(wù)分配比例的效果.

雷達圖:
? 四維以上, 并且每個維度可以度量并排序, 雷達圖對數(shù)據(jù)特征有幾個要求或者說喜好: 1 數(shù)據(jù)點要少, 一般不超過六個; 2 數(shù)據(jù)有多個維度, 一般四個以上, 可以通過顏色增加一個維度的信息, 但不參與分析. 3 維度可度量和排序.

上圖取自參考文檔截圖, 是熱火首發(fā)五人的技術(shù)指標分析, 根據(jù)定義, 面積越大越重要, 所以James確實很重要:)
此外, 還有一些有意思的, 也比較有意義的展示方式, 也簡單列舉幾個:
漏斗圖:漏斗圖適用于業(yè)務(wù)流程比較規(guī)范, 周期長, 環(huán)節(jié)多的流程分析, 通過漏斗各環(huán)節(jié)業(yè)務(wù)數(shù)據(jù)的比較, 能夠直觀地發(fā)現(xiàn)和說明問題所在. 通常用來運營分析改進產(chǎn)品設(shè)計流程, 分析商機轉(zhuǎn)化等.

(矩形) 樹圖:一種有效的實現(xiàn)層次結(jié)構(gòu)可視化的圖表結(jié)構(gòu), 適用于表示類似文件目錄結(jié)構(gòu)的數(shù)據(jù)集.

熱力圖:以特殊高亮的形式顯示訪客熱衷的頁面區(qū)域和訪客所在的地理區(qū)域的圖示,它基于GIS坐標,用于顯示對象的相對密度, 下圖是我們的呼叫熱力圖.

詞云:各種關(guān)鍵詞的集合,往往以字體的大小或顏色代表對應(yīng)詞的頻次. 是一種比較有意思的展現(xiàn)形式, 不過我覺得有意思的成分大于其實際意義. 有一定的視覺沖擊力, 做宣傳封面或者海報時見得比較多.?
推薦一個在線制作詞云, 很漂亮的工具,?https://wordart.com/create, 下圖是我用時間簡史的內(nèi)容做的詞云, 還是很有感染力的

盒須圖:
也叫箱形圖, 盒式圖或者箱線圖. 主要用于對數(shù)據(jù)分布的顯示, 如下圖所示, 主要包含六個數(shù)據(jù)節(jié)點, 將一組數(shù)據(jù)從大到小排列, 分別計算出他的上邊緣, 上四分位數(shù)Q3, 中位數(shù), 下四分位數(shù)Q1, 下邊緣, 還有一個異常值. 大家可以自己對應(yīng)下.

關(guān)系圖: 表現(xiàn)的是數(shù)據(jù)對象間的關(guān)系, 是聚類常用的一種方法, 建議了解下基于圖論的聚類算法, 了解下什么是DAG等等, 圖論也是一個特別有意思的所在.?圖論分裂聚類算法的主要思想是: 構(gòu)造一棵關(guān)于數(shù)據(jù)的最小生成樹(minimal spanning tree,簡稱MST), 通過刪除最小生成樹的最長邊來形成類.?
如下圖所示,?當初為了基于關(guān)系對設(shè)備進行聚類和分析, 還專門做了一個軟件包.

好了, 先簡單羅列這么多, 希望多開幾個頭, 以后有時間慢慢的展開討論.