此原創(chuàng)文章已獲得大數(shù)據(jù)文摘(微信公眾號(hào))采用,并于2017年4月29日發(fā)布(閱讀量近5K):前沿 | 國(guó)際可視化盛會(huì)PacificVis2017的十個(gè)精彩案例
上次翻譯的文章2016年10個(gè)重要的可視化發(fā)展中提到的可視化作品多數(shù)是新聞媒體領(lǐng)域的,這次筆者則將分享可視化學(xué)術(shù)界的一些前沿研究——來(lái)自剛結(jié)束的國(guó)際可視化盛會(huì)之一的IEEE PacificVis 2017的十個(gè)演講,涵蓋了城市數(shù)據(jù)可視化、科學(xué)可視化、圖可視化、高維數(shù)據(jù)可視化、人機(jī)交互(HCI)、AR/VR、數(shù)據(jù)敘事、可視分析等多個(gè)方面。
溫馨提示:文中提到的大量文章及案例,筆者都幫你整理好了,請(qǐng)移步文末附錄的傳送門~
以下排名不分先后:
1. 可視分析中的新方向
馬匡六教授,美國(guó)加利福尼亞大學(xué)戴維斯分校

馬教授是國(guó)際可視化與可視分析研究領(lǐng)域的著名學(xué)術(shù)帶頭人之一,作為本次大會(huì)中Pacific VAST研討會(huì)的第一位演講嘉賓,主要從極大規(guī)模(Extreme Scale)數(shù)據(jù)的數(shù)據(jù)分析、事件序列數(shù)據(jù)分析這兩個(gè)方面介紹了可視分析的研究新動(dòng)向。第一個(gè)部分主要關(guān)注超大規(guī)模模擬所產(chǎn)生數(shù)據(jù)的可視分析,馬教授指出使用原位可視化(In Situ Visualization)是大勢(shì)所趨,應(yīng)用場(chǎng)景包括科學(xué)可視化、在線數(shù)據(jù)或流數(shù)據(jù)可視化等等。其中,數(shù)據(jù)聚集操作是一類重要的方法。通過(guò)對(duì)粒子或者場(chǎng)數(shù)據(jù)進(jìn)行概率分布函數(shù)(Probability Distribution Functions)計(jì)算并離散化為一維或二維直方圖,模擬數(shù)據(jù)的信息能夠得到很大程度的保留,并且能支持縮放、修改劃分、修改直方圖槽數(shù)量、以及利用直方圖進(jìn)行查詢和選擇等多種操作;把二維直方圖按時(shí)間順序堆疊起來(lái)還可生成3D體可視化進(jìn)行時(shí)變屬性分析。
第二部分主要介紹了事件序列數(shù)據(jù)可視化的幾個(gè)案例,包括高性能計(jì)算中的性能、日志數(shù)據(jù)的可視化,如使用Behavioral Lines的云計(jì)算性能的可視分析,以及醫(yī)院燒傷病人日志數(shù)據(jù)的可視分析等等。馬教授還簡(jiǎn)短地提到一個(gè)新的研究方向是保留隱私的可視化,具體可參考論文Privacy Preserving Visualization for Social Network Data with Ontology Information。
2. 城市數(shù)據(jù)的可視分析
巫英才教授,浙江大學(xué)

巫英才教授首先介紹了城市數(shù)據(jù)分析面臨的挑戰(zhàn),主要存在三個(gè)方面:(1)如何視覺(jué)提煉海量數(shù)據(jù);(2)如何將專家知識(shí)融入分析中并獲得見(jiàn)解;(3)如何將挖掘的知識(shí)有效的傳遞給用戶?;谶@些挑戰(zhàn),可視分析是非常重要的。相應(yīng)地,巫教授設(shè)立了多層次可視化、富交互多角度探索,以及通過(guò)故事敘事的形式表現(xiàn)分析結(jié)果這三個(gè)可視分析目標(biāo)。
隨后他介紹了在城市可視分析方面的兩個(gè)工作:SmartAdP 是一個(gè)利用出租車軌跡數(shù)據(jù),綜合車流量(車流量越大,越可能看到),車速(越慢越好),OD區(qū)域(潛在用戶的途徑路線),環(huán)境等多個(gè)因素,自動(dòng)產(chǎn)生廣告牌的擺放的解決方案,并提供可視分析界面支持用戶進(jìn)行探索和決策的工具,具體介紹可參考同名論文或北大的博文:用海量出租車軌跡數(shù)據(jù)選取廣告牌放置位置;Route-Zooming 則是一種通過(guò)道路變形將道路信息嵌入到地圖中的技術(shù),實(shí)現(xiàn)盡可能少變形的前提下,對(duì)地圖上的道路進(jìn)行拓寬,然后將時(shí)空數(shù)據(jù)圖表內(nèi)嵌入道路中。
3. 眼動(dòng)追蹤與可視分析
Daniel Weiskopf,德國(guó)斯圖加特大學(xué)

近年來(lái),硬件技術(shù)的進(jìn)步和眼動(dòng)追蹤裝置成本的降低使得這種分析技術(shù)可以被大量的研究人員使用。Weiskopf 教授一方面指出了眼動(dòng)追蹤技術(shù)在用戶研究中的作用,即幫助研究用戶是如何使用可視分析界面的。與傳統(tǒng)的計(jì)算準(zhǔn)確度和問(wèn)卷調(diào)查等形式不同,該技術(shù)能有效捕捉用戶注意力的分布情況。另一方面,則介紹了如何通過(guò)可視分析技術(shù)來(lái)輔助對(duì)(大量)眼動(dòng)追蹤數(shù)據(jù)的解讀。其中,常用的兩種分析方法包括Space-time cube軌跡顯示法以及Map display軌跡顯示法;而針對(duì)不同類型的眼動(dòng)追蹤數(shù)據(jù),如關(guān)注區(qū)(AOI)、瀏覽軌跡(Scan Path)和聚焦點(diǎn)(Fixation)等,Weiskopf 教授也分別介紹了其分析方法。更多詳情請(qǐng)參考其論文:Visual Analytics Methodology for Eye Movement Studies。
最后,Weiskopf 教授總結(jié)道,以上兩種眼動(dòng)追蹤可視分析結(jié)合起來(lái),可以稱作是一種“Vis4Vis”方法——即“用于分析可視化作品的可視化(Visualization for visualization)”。這種可視化類別目前未得到明確定義和劃分,因此他希望學(xué)術(shù)界能夠更多地關(guān)注該方向的研究。
4. 用可視化進(jìn)行數(shù)據(jù)敘事
Bongshin Lee,微軟

來(lái)自微軟研究所的Bongshin Lee博士由漢斯·羅斯林教授經(jīng)典的全球人口變化介紹等可視化案例引入,介紹了她在故事敘事(storytelling)方面自2012年以來(lái)的理論研究。在她的文章More than telling a story中,給出了對(duì)視覺(jué)數(shù)據(jù)故事(visual data story)的定義,概括出三大要素:數(shù)據(jù)驅(qū)動(dòng)、視覺(jué)展示,以及故事片段之間的邏輯關(guān)系;而故事敘事的過(guò)程則由探索數(shù)據(jù),制造故事,和敘述故事這三個(gè)階段有機(jī)地組成。
另一方面,Lee博士具體介紹了其團(tuán)隊(duì)開(kāi)發(fā)的,幾款幫助故事敘事的創(chuàng)作工具:SketchStory 受白板動(dòng)畫(huà)(Whiteboard Animation)展示方式的啟發(fā),提出一種使用觸控筆在電子板上描繪圖表的故事敘述方式,幫助提升聽(tīng)眾的參與感;DataClips 是為非專業(yè)人士設(shè)計(jì)的數(shù)據(jù)視頻創(chuàng)作工具,通過(guò)對(duì)紐約時(shí)報(bào)等74個(gè)數(shù)據(jù)新聞視頻進(jìn)行分析,建立數(shù)據(jù)新聞材料庫(kù),相比傳統(tǒng)視頻制作軟件更易于上手,且能更靈活地修改數(shù)據(jù);Timeline Storyteller 是使用時(shí)間線為順序的敘事工具,利用了對(duì)200余款同類可視化的總結(jié)及從中提取的設(shè)計(jì)模式,可以在線嘗試。最后展望了未來(lái)的storytelling方向和挑戰(zhàn):包括如何融合故事的探索到展現(xiàn)的過(guò)程;如何評(píng)估數(shù)據(jù)驅(qū)動(dòng)的故事和工具;數(shù)據(jù)故事的可讀性;新穎的、浸入式的交互體驗(yàn)在storytelling的應(yīng)用。
5. 虛擬牽引器(Virtual Retractor)
Cheng Li,俄亥俄州立大學(xué)

來(lái)自俄亥俄州立大學(xué)的可視化小組提出了Virtual Retractor這種創(chuàng)新的交互式數(shù)據(jù)探索系統(tǒng), 在保證數(shù)據(jù)特征的基礎(chǔ)上對(duì)于可視化進(jìn)行變形,從而解決科學(xué)可視化的3D空間中存在著遮擋的問(wèn)題。該系統(tǒng)采用Retractor的隱喻,允許用戶像切割和分割實(shí)際物體一樣,直接操縱和探索數(shù)據(jù)。這個(gè)過(guò)程通過(guò)使帶有空隙的四面體網(wǎng)格(tetrahedral mesh)變形來(lái)模擬由切割產(chǎn)生的切口來(lái)進(jìn)行。分割操作擴(kuò)大了空隙,允許用戶觀察原來(lái)被遮擋的內(nèi)部結(jié)構(gòu)。其中,網(wǎng)格(mesh)的構(gòu)造考慮了局部數(shù)據(jù)屬性,如局部數(shù)據(jù)密度或梯度。因此,變形將受到所選數(shù)據(jù)屬性的影響。具有高數(shù)據(jù)屬性值的區(qū)域更加堅(jiān)固,難以變形,而屬性值較低的區(qū)域?qū)?huì)變形。從而,變形可以保持?jǐn)?shù)據(jù)中被感興趣的特征。
6. 可視分析改變世界
David Ebert,美國(guó)普渡大學(xué)

David Ebert教授是可視分析領(lǐng)域的專家,在包括安全、國(guó)防、社交媒體等等領(lǐng)域都有相關(guān)的可視分析工作。本次演講中,他首先總結(jié)了我們目前面臨的解全球性難題,如能源、可持續(xù)發(fā)展、潔凈水、人口資源等問(wèn)題,并鼓勵(lì)學(xué)者進(jìn)行基于應(yīng)用驅(qū)動(dòng)的研究(Application-driven research),這樣能有效推動(dòng)科學(xué)發(fā)現(xiàn)和改善世界,而且也有助于獲得研究資金和更多優(yōu)質(zhì)合作機(jī)遇。
在對(duì)可視分析進(jìn)行釋義之后,他介紹了人機(jī)合作設(shè)計(jì)Human Computer Collaborated Design (HCCD),這種可以結(jié)合人類與計(jì)算機(jī)各自的優(yōu)勢(shì)、方便溝通,并有效地實(shí)現(xiàn)問(wèn)題決策的方法;并舉了一系列關(guān)于利用社交媒體、安全、資源分布等等方面的例子(可參見(jiàn)他早前的報(bào)告)。他強(qiáng)調(diào),可視分析是輔助人、提升人的能力,而不是替代人的工作。最后,他還對(duì)最近興起的深度學(xué)習(xí)、風(fēng)險(xiǎn)可視分析(Risk Visual Analytics)、因果可視分析(Causality Visual Analytics)以及VR/VA結(jié)合可視化等熱點(diǎn)話題進(jìn)行了討論;并表示他對(duì)VR/VA在科學(xué)發(fā)現(xiàn)和決策分析領(lǐng)域的作用持觀望態(tài)度,但基于人們對(duì)這類技術(shù)的熱衷程度,他亦對(duì)此抱有期待。
7. 圖可視化的新評(píng)估方法
Seok-Hee Hong,悉尼大學(xué)

圖可視化主題在今年所接受論文、海報(bào)張貼中都有著很大的比例,而Hong教授在演講中介紹的忠實(shí)性(Faithfulness)指標(biāo)在此次大會(huì)中多次被其他演講者引用,可謂熱中之熱?,F(xiàn)有的圖布局評(píng)估方法,如基于邊交叉的方法,主要關(guān)注圖的可讀性;但隨著大數(shù)據(jù)時(shí)代的來(lái)臨,原有的評(píng)估方法是不夠的,因?yàn)榘罅繑?shù)據(jù)的圖通常過(guò)于復(fù)雜,導(dǎo)致用戶難以直接通過(guò)感知邊的交叉來(lái)評(píng)估圖布局的優(yōu)劣。
于是,他們針對(duì)大圖提出了忠實(shí)性(Faithfulness)指標(biāo),它包括三大部分,Information faithfulness (圖布局對(duì)信息表現(xiàn)的忠實(shí)性), Task faithfulness (圖布局對(duì)任務(wù)的支持度)和Change faithfulness(圖布局對(duì)數(shù)據(jù)微變化的敏感度);同時(shí)提出了基于形狀的度量方法(Shape-based Metric)來(lái)計(jì)算Task faithfulness,且通過(guò)實(shí)驗(yàn)證明了這種方法的有效性。有關(guān)對(duì)力導(dǎo)向圖和邊捆綁技術(shù)等現(xiàn)有可視化方法的忠實(shí)性(Faithfulness)評(píng)估,以及忠實(shí)性與可讀性的比較,請(qǐng)參考其論文:Towards Faithful Graph Visualizations。
8. Interaction+:“讓可視化動(dòng)起來(lái)”
陸旻,北京大學(xué)

這個(gè)富有創(chuàng)意的工具早在2016年ChinaVis作為海報(bào)展出時(shí)就十分吸引人眼球,無(wú)需編程就能將網(wǎng)絡(luò)上現(xiàn)有的可視化作品變成動(dòng)態(tài)可交互的,這對(duì)可視化設(shè)計(jì)師甚至工程師都是提高工作效率的福音。如今,這個(gè)工具不僅能自動(dòng)識(shí)別已有的網(wǎng)頁(yè)可視化作品中的視覺(jué)圖元及屬性信息,然后對(duì)原可視化內(nèi)容進(jìn)行過(guò)濾、聚集和重排,還能讓用戶能在原可視化的基礎(chǔ)上用輔助面板進(jìn)行查詢、比較、打標(biāo)簽等交互。
其實(shí)現(xiàn)原理是通過(guò)解析網(wǎng)頁(yè)HTML文件物件模型 (DOM),并對(duì)SVG元素進(jìn)行提取和操作,因此該工具適用于任何網(wǎng)頁(yè)上的SVG可視化作品,可以是程序員編寫(xiě)的程序也可以是藝術(shù)家制作的信息圖。作者以紐約時(shí)報(bào)上的幾個(gè)可視化作品為例,對(duì)工具進(jìn)行了精彩的演示,視頻詳見(jiàn)北大公眾號(hào)相關(guān)文章:“讓可視化動(dòng)起來(lái)”的網(wǎng)頁(yè)交互工具Interaction+。
9. 基于Spark的大規(guī)模高維數(shù)據(jù)可視化
Jaemin Jo,首爾國(guó)立大學(xué)

來(lái)自首爾國(guó)立大學(xué)的Jaemin Jo首先分析了針對(duì)大規(guī)模數(shù)據(jù)的交互式探索的相關(guān)研究(見(jiàn)附錄)。常見(jiàn)的方法是使用數(shù)據(jù)立方體(data cube)等預(yù)處理數(shù)據(jù)結(jié)構(gòu),來(lái)總結(jié)數(shù)據(jù)并提供低延遲響應(yīng)。然而,由于查詢中涉及很多維度,這種方案會(huì)占用大量的內(nèi)存,且在查詢前必須由數(shù)據(jù)構(gòu)建特定數(shù)據(jù)結(jié)構(gòu)。他所在的團(tuán)隊(duì)則利用亞馬遜EC2集群,并且基于Spark的流式處理方式,開(kāi)發(fā)了適用于大規(guī)模高維數(shù)據(jù)可視分析的系統(tǒng)SwiftTuna。為了支持響應(yīng)查詢,SwiftTuna利用增量處理方法,立即提供低保真響應(yīng)(即快速響應(yīng))以及延遲的高保真響應(yīng)(即增量響應(yīng))。該系統(tǒng)支持對(duì)高達(dá)含有40億條記錄和40個(gè)維度的真實(shí)數(shù)據(jù)集的實(shí)時(shí)探索,且增量響應(yīng)的延時(shí)僅為幾秒鐘。具體實(shí)現(xiàn)詳見(jiàn)論文:SwiftTuna: Responsive and Incremental Visual Exploration of Large-scale Multidimensional Data。
10. 增強(qiáng)現(xiàn)實(shí)(AR)可視化
Gerard Jounghyun Kim,韓國(guó)高麗大學(xué)

隨著AR技術(shù)的興起,AR與可視化的結(jié)合也成為了可視化領(lǐng)域的新熱點(diǎn)。Gerard Jounghyun Kim教授主要從AR領(lǐng)域研究者的角度,分享了他對(duì)AR可視化的看法。Kim教授認(rèn)為AR可以被視為一種特殊的數(shù)據(jù)可視化,其數(shù)據(jù)不僅有現(xiàn)實(shí)數(shù)據(jù),還包括了增強(qiáng)物數(shù)據(jù);由于AR的特殊屬性,在實(shí)現(xiàn)有效的可視化時(shí)會(huì)面臨一些獨(dú)特的問(wèn)題,對(duì)此Kim教授總結(jié)和提出了AR可視化的三個(gè)主要要求,即(1)自然度 - Naturalness,(2)可見(jiàn)度 - Visibility,(3)持久性/穩(wěn)定性 - persistance/stability。
自然度指的是增強(qiáng)物需要與用戶對(duì)真實(shí)世界的認(rèn)知模型保持一致,如正確的深度信息、相似的光照效果、合理的空間關(guān)系等等??梢?jiàn)度是指最大化信息的可見(jiàn)度,例如增強(qiáng)目標(biāo)物體的顯示、利用過(guò)濾法消除信息遮擋、平衡真實(shí)環(huán)境和增強(qiáng)物的關(guān)系等等。持久性和穩(wěn)定性是指增強(qiáng)物應(yīng)保持穩(wěn)定,且易于查看與交互。Kim教授以鋼琴樂(lè)譜增強(qiáng)現(xiàn)實(shí)可視化為例,指出用戶在演奏的時(shí)候同時(shí)關(guān)注鍵盤與樂(lè)譜,需要經(jīng)常轉(zhuǎn)移視線,容易造成疲倦。
最后,Kim教授談?wù)摿薃R可視化中一些待解決的問(wèn)題以及相應(yīng)的發(fā)展方向,包括增強(qiáng)物的放置(如去除遮擋、決定尺寸位置)、三類要求衡量標(biāo)準(zhǔn)的制定,以及平衡增強(qiáng)物的自然性和可見(jiàn)性等等。
后記
以上內(nèi)容是對(duì)筆者在參加會(huì)議期間個(gè)人比較感興趣,或是比較新穎的一些主題的整理,限于篇幅還有很多精彩的演講沒(méi)有列舉,如果感興趣可以參考完整的會(huì)議項(xiàng)目。更多詳情也可參考北京大學(xué)可視分析公眾號(hào)的系列文章(詳見(jiàn)附錄:參考文獻(xiàn)),本文中一些對(duì)專有名詞及技術(shù)描述的翻譯參考了該系列文章,特此聲明和感謝。
由于會(huì)議內(nèi)容均以英文呈現(xiàn),且有許多筆者不太熟悉的領(lǐng)域和名詞,盡管筆者在寫(xiě)作過(guò)程中參考了大量資料,仍可能存在疏漏或不準(zhǔn)確的地方,請(qǐng)多包涵,也歡迎批評(píng)指正。謝謝!
附贈(zèng)實(shí)用鏈接
數(shù)據(jù)敘事實(shí)例及工具:
機(jī)器學(xué)習(xí)的視覺(jué)化介紹 | Kantar信息之美2015年獲獎(jiǎng)作品,以懂得區(qū)別舊金山和紐約市房屋的模型為例,在網(wǎng)頁(yè)中將機(jī)器學(xué)習(xí)的基本過(guò)程一步步地用動(dòng)態(tài)圖展現(xiàn),有(繁體)中文版。
統(tǒng)計(jì)的樂(lè)趣 | 漢斯·羅斯林 (Hans Rosling) 最出名的一次演講,在 4 分鐘內(nèi),用 12 萬(wàn)個(gè)數(shù)據(jù)解釋 200 個(gè)國(guó)家 200 年的發(fā)展,有中英字幕。
新興的故事敘事技術(shù) | 頗值得一讀的綜述性英文論文,題目為 Emerging and Recurring Data-Driven Storytelling Techniques: Analysis of a Curated Collection of Recent Stories.
SketchInsight 和 SketchStory | 這個(gè)視頻展現(xiàn)了數(shù)據(jù)敘事中,兩種白板動(dòng)畫(huà)型創(chuàng)作工具的結(jié)合使用:前者用于創(chuàng)作故事,后者用于展示故事。
以周計(jì)算的你的一生 (互動(dòng)版), 阿拉伯之春時(shí)間線 | 兩個(gè)時(shí)間線可視化的實(shí)例,分別采用了分段布局和曲線布局。


時(shí)間線的重新審視 | 總結(jié)了263種時(shí)間線數(shù)據(jù)可視化,提出了有效進(jìn)行時(shí)間線敘事的設(shè)計(jì)空間,包括來(lái)自表達(dá),規(guī)模和布局這三個(gè)類別的14種設(shè)計(jì)方案,以及方案的20種組合方式。
大規(guī)模高維數(shù)據(jù)可視化:
imMens (2013) | 來(lái)自斯坦福大學(xué),針對(duì)大規(guī)模數(shù)據(jù)的實(shí)時(shí)可視化探索工具。開(kāi)源[Github],具體實(shí)現(xiàn)參見(jiàn)論文[PDF]。
Nanocubes (2013) | 一個(gè)獲獎(jiǎng)眾多,基于數(shù)據(jù)立方體(data cube),支持多維度、多粒度時(shí)空數(shù)據(jù)的實(shí)時(shí)聚合分析工具。開(kāi)源[Github],提供API,具體實(shí)現(xiàn)參見(jiàn)論文[PDF]或北大相關(guān)博文。
Hashedcubes (2016) | 提出了比現(xiàn)有大規(guī)模數(shù)據(jù)實(shí)時(shí)視覺(jué)探索技術(shù)更高效、簡(jiǎn)單的方法,開(kāi)源[Github],左側(cè)鏈接為論文PDF。
Gaussian Cubes (2016) | 跟Hashedcubes一樣是來(lái)自亞利桑那大學(xué)的成果,在現(xiàn)有技術(shù)的基礎(chǔ)上增加了最小二乘法和主成分分析等模型的支持,左側(cè)鏈接為論文PDF。
原位可視化(In Situ Visualization):
大規(guī)模數(shù)據(jù)可視化 | 來(lái)自北京大學(xué)可視化與可視分析博客的主題介紹文章。
高性能計(jì)算與原位可視化 | 李思昆教授于2016年中國(guó)可視化大會(huì)上,對(duì)原位可視化(In Situ Visualization)技術(shù)及國(guó)內(nèi)高性能計(jì)算研究現(xiàn)狀的介紹。
參考文獻(xiàn)
- 北京大學(xué)可視分析公眾號(hào)系列文章:直擊 IEEE Pacific Visualization 2017 -
Day0, Day1, Day2, Day3. - Lu, Min, et al. "Interaction+: Interaction Enhancement for Web-based Visualizations." [PDF]
- Lee, Bongshin, Rubaiat Habib Kazi, and Greg Smith. "SketchStory: Telling more engaging stories with data through freeform sketching." IEEE Transactions on Visualization and Computer Graphics 19.12 (2013): 2416-2425.
- Lee, Bongshin, et al. "More than telling a story: Transforming data into visually shared stories." IEEE computer graphics and applications 35.5 (2015): 84-90.
- 胡華全, et al. "時(shí)變網(wǎng)絡(luò)可視化研究綜述." 系統(tǒng)仿真學(xué)報(bào) 25.9 (2013): 1975-1980.
- Zhang, Jiawei, et al. "A visual analytics framework for microblog data analysis at multiple scales of aggregation." Computer Graphics Forum. Vol. 35. No. 3. 2016.