JUST技術(shù):當(dāng)我停留時(shí)我在干什么

? ? ? ?隨著定位技術(shù)的不斷普及,嵌入在手機(jī)和PDA設(shè)備內(nèi)的GPS、北斗等位置傳感器周期性地記錄移動(dòng)對(duì)象的位置,從而產(chǎn)生了海量的軌跡數(shù)據(jù)。用戶為分享行程可能主動(dòng)記錄自己的軌跡,物流派送車、出租車、共享私家車等由于運(yùn)營(yíng)監(jiān)管的需要可能被動(dòng)地記錄軌跡位置信息。

這些軌跡數(shù)據(jù)背后的想象空間極大。利用軌跡數(shù)據(jù),我們可以用來估計(jì)全城的車流量、通行時(shí)間、補(bǔ)全現(xiàn)有地圖等等。而為實(shí)現(xiàn)這些應(yīng)用,我們通常會(huì)對(duì)軌跡數(shù)據(jù)進(jìn)行預(yù)處理,剔除掉一些時(shí)間連續(xù)且空間上非常臨近的點(diǎn)(下文簡(jiǎn)稱駐留點(diǎn)),因?yàn)轳v留點(diǎn)會(huì)影響上述應(yīng)用的精確度。

然而,這些被丟掉的駐留點(diǎn)也隱含了豐富的信息。利用檢測(cè)得到的駐留點(diǎn),如圖1所示,我們可以進(jìn)行事件分析、地點(diǎn)發(fā)現(xiàn)、序列挖掘等等。本文,我們將帶大家探索駐留點(diǎn)背后的故事,以及介紹一些經(jīng)典的駐留點(diǎn)檢測(cè)算法。

圖1 軌跡駐留點(diǎn)的檢測(cè)及應(yīng)用


一、?駐留點(diǎn)應(yīng)用

1.事件分析

移動(dòng)對(duì)象往往會(huì)因?yàn)槟承┦录A?,比如車輛會(huì)因?yàn)榧佑投A?、快遞員因?yàn)榕渌投A舻鹊?。通過分析移動(dòng)對(duì)象在特定POI(興趣點(diǎn))駐留的時(shí)長(zhǎng)和時(shí)間,我們可以分析POI的特性,助力決策。

在[1-2]中,作者將出租車軌跡中的駐留點(diǎn)(圖2)與加油站POI進(jìn)行關(guān)聯(lián),利用提出的方法,能夠估計(jì)每個(gè)加油站每個(gè)時(shí)間片的平均加油等待時(shí)間,用于推薦加油地點(diǎn),以及推測(cè)每個(gè)加油站每個(gè)時(shí)間片的訪問車輛數(shù),從而推測(cè)出全城實(shí)時(shí)的油耗。

圖2?汽車加油事件 [1-2].

在[3]中,作者將配送員軌跡中的駐留點(diǎn)與客戶的妥投地點(diǎn)做關(guān)聯(lián)(圖3),利用提出的方法能夠自動(dòng)推測(cè)出每個(gè)運(yùn)單的妥投時(shí)間。該種方法不僅減輕了配送員的負(fù)擔(dān),而且結(jié)果比手工記錄更為可靠。準(zhǔn)確的妥投時(shí)間能夠用于挖掘用戶可收貨的時(shí)間窗口,提高妥投成功率等等。

圖3?配送員軌跡數(shù)據(jù)及運(yùn)單收貨地址?[3].

2.?地點(diǎn)發(fā)現(xiàn)

駐留點(diǎn)在空間上反映為一個(gè)GPS點(diǎn)密度較高的區(qū)域,這些區(qū)域可能是一些POI數(shù)據(jù)庫(kù)中沒有記錄的但是又非常有意義的地點(diǎn)。我們可以通過DBSCAN、OPTICS等聚類算法對(duì)檢測(cè)得到的駐留點(diǎn)進(jìn)行聚類,生成一系列地點(diǎn),再通過其與多源數(shù)據(jù)關(guān)聯(lián),篩選得到真正感興趣的地點(diǎn)。

在[4-5]中,作者基于行人的出行軌跡數(shù)據(jù),發(fā)現(xiàn)了城市內(nèi)一些興趣地點(diǎn)(圖4),可以推薦給外地游客游玩。

圖4 興趣地點(diǎn) [4-5].

在[6-7]中,作者從出租車軌跡中檢測(cè)得到駐留點(diǎn),將其聚類后得到一系列可以停車接客的地點(diǎn)。這些地點(diǎn)后續(xù)可被推薦給空車司機(jī),讓其前往接客,也可以推薦給用戶,使其更容易打到車。

在[8]中,數(shù)據(jù)挖掘人員基于?;愤\(yùn)輸車輛軌跡中的駐留地點(diǎn)以及周圍路網(wǎng)、POI特征,尋找異常地點(diǎn),工作人員到現(xiàn)場(chǎng)核查發(fā)現(xiàn)多起非法生產(chǎn)、存儲(chǔ)等現(xiàn)象。

在[9]中,數(shù)據(jù)挖掘人員基于貨車軌跡中的駐留點(diǎn)及衛(wèi)星圖像等信息,發(fā)現(xiàn)未記錄在案的倉(cāng)庫(kù)。這些本地倉(cāng)庫(kù)通常由當(dāng)?shù)厝舜罱ㄓ糜谂R時(shí)存儲(chǔ)貨物。知曉這些倉(cāng)庫(kù)的存在,對(duì)于后續(xù)物流地產(chǎn)的選址,具有指導(dǎo)意義。?

3.序列挖掘

通過分析駐留點(diǎn)與駐留點(diǎn)之間的轉(zhuǎn)移關(guān)系,我們可以得到移動(dòng)對(duì)象的位置訪問序列。通過累計(jì)歷史上的訪問序列數(shù)據(jù),我們可以得到一系列頻繁序列。這些序列隱藏著人們關(guān)于出行的知識(shí)。

在[10]中,作者挖掘了個(gè)人的序列生活模式,用于做好友推薦。

在[4-5]中,作者通過挖掘行人的駐留點(diǎn)訪問序列,得到了一個(gè)指定地理范圍內(nèi)多條典型的出行序列,使我們對(duì)周圍環(huán)境有了更好的了解。這些訪問序列還能夠賦能出行推薦。

圖5.?經(jīng)典訪問序列?[4-5]

二、?常用駐留點(diǎn)檢測(cè)算法

通過了解上面這些應(yīng)用,我們知道駐留點(diǎn)是軌跡中的一類重要知識(shí),但是從軌跡中檢測(cè)出駐留點(diǎn)其實(shí)并不困難。在對(duì)軌跡進(jìn)行初步的去噪后,我們就可以進(jìn)行駐留點(diǎn)檢測(cè)了。下面我們將介紹一種簡(jiǎn)單易實(shí)現(xiàn)的駐留點(diǎn)檢測(cè)算法[11]。這種駐留點(diǎn)檢測(cè)算法首先檢查一個(gè)錨點(diǎn)以及它后繼軌跡點(diǎn)的距離是否大于一個(gè)給定的距離閾值以圖6為例,當(dāng)前的錨點(diǎn)是p3,p4到p6是在Dmax以內(nèi)的后續(xù)軌跡點(diǎn)。然后,檢測(cè)算法計(jì)算錨點(diǎn)p2到Dmax以內(nèi)最后一個(gè)后繼軌跡點(diǎn)p6之間的時(shí)間跨度。如果時(shí)間跨度大于一個(gè)指定的時(shí)間閾值Tmin,我們即檢測(cè)得到一個(gè)駐留點(diǎn)(p3到p6),然后錨點(diǎn)移動(dòng)到當(dāng)前駐留點(diǎn)后的下一個(gè)點(diǎn),即p7。否則,錨點(diǎn)向前移動(dòng)一步p4。這個(gè)過程不斷重復(fù),直到錨點(diǎn)移動(dòng)到軌跡序列末尾,我們即檢測(cè)得到整條軌跡中的所有駐留點(diǎn)。

圖6?駐留點(diǎn)檢測(cè)示意圖

目前,這種簡(jiǎn)單有效的駐留點(diǎn)檢測(cè)算法已經(jīng)集成在京東時(shí)空數(shù)據(jù)引擎JUST [12]中,封裝成DAL的形式,用戶只需要編寫簡(jiǎn)單類SQL語句,如圖7所示,就可以從軌跡數(shù)據(jù)集中方便高效地檢測(cè)得到駐留點(diǎn)。

圖7.?駐留點(diǎn)檢測(cè)類SQL語句

????在一些研究[1-3][6-7]中,為了保證檢測(cè)結(jié)果(加油事件、停車等客事件、妥投事件)的質(zhì)量,基于監(jiān)督學(xué)習(xí)的模型可以被進(jìn)一步使用在檢測(cè)得到的駐留點(diǎn)上。通過提取駐留點(diǎn)中的一些特征,可以過濾得到只屬于某一類特定事件的駐留點(diǎn),讓后續(xù)分析變得更為準(zhǔn)確。

三、?總結(jié)

以上就是本次駐留點(diǎn)應(yīng)用及經(jīng)典算法的分享。通過本文,我們了解了駐留點(diǎn)的一些重要應(yīng)用。通過其與路網(wǎng)、POI、衛(wèi)星圖像等的關(guān)聯(lián)分析,我們可以發(fā)現(xiàn)很多有趣的知識(shí)。未來,JUST將集成更多關(guān)聯(lián)篩選的功能,快速?gòu)臄?shù)據(jù)中得到洞察。


參考文獻(xiàn):

[1]?Zhang, Fuzheng, et al. "Sensing the pulse of urban refueling behavior."?Proceedings of the 2013 ACM international joint conference on Pervasive and ubiquitous computing. 2013.

[2] Zhang, Fuzheng, et al. "Sensing the pulse of urban refueling behavior: A perspective from taxi mobility."?ACM Transactions on Intelligent Systems and Technology (TIST)?6.3 (2015): 1-23.

[3] Ruan, Sijie, et al. "Doing in One Go: Delivery Time Inference Based on Couriers' Trajectories."?Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2020.

[4] Zheng, Yu, et al. "Mining interesting locations and travel sequences from GPS trajectories."?Proceedings of the 18th international conference on World wide web. 2009.

[5] Zheng, Yu, and Xing Xie. "Learning travel recommendations from user-generated GPS traces."?ACM Transactions on Intelligent Systems and Technology (TIST)?2.1 (2011): 1-29.

[6] Yuan, Jing, et al. "Where to find my next passenger." Proceedings of the 13th international conference on Ubiquitous computing.?2011.

[7] Yuan, Jing, et al. "T-finder: A recommender system for finding passengers and vacant taxis." IEEE Transactions on knowledge and data engineering 25.10 (2012): 2390-2403.

[8] “京東城市”微信公眾號(hào). “一屏聯(lián)動(dòng)64個(gè)部門,京東城市助力南通建成全國(guó)首個(gè)市域治理現(xiàn)代化指揮中心”, 2020.

[9] 麻志鵬,等. “查找倉(cāng)庫(kù)的方法和裝置” 中國(guó)專利(已授權(quán)),?2019.

[10] Ye, Yang, et al. "Mining individual life pattern based on location history."?2009 tenth international conference on mobile data management: Systems, services and middleware. IEEE, 2009.

[11] Zheng, Yu. "Trajectory data mining: an overview." ACM Transactions on Intelligent Systems and Technology (TIST)?6.3 (2015): 1-41.

[12] https://just.urban-computing.cn/

相關(guān)文章:

JUST技術(shù):分布式時(shí)序相似查詢初探

JUST技術(shù):基于深度學(xué)習(xí)Seq2Seq框架的技術(shù)總結(jié)

JUST技術(shù):JUST高效時(shí)空索引揭秘及使用指南

JUST技術(shù):基于軌跡數(shù)據(jù)的人口流向分析技術(shù)

JUST技術(shù):基于軌跡的新冠易感人群查詢方案

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容