ArticlePDF Available
Journal of Korean Society of Transportation Vol.37 No.5 October 2019
422
ARTICLE
딥러닝기반의도시지역차량궤적예측알고리즘
개발연구
최성진
1
김지원
2
유화평
1
가동호
1
여화수
3*
1한국과학기술원 건설 및 환경공학과 박사과정, 2퀸즈랜드대학교 토목공학과 교수,
3한국과학기술원 건설 및 환경공학과 교수
Deep-learning Based Urban Vehicle Trajectory
Prediction
CHOI, Seongjin1KIM, Jiwon2YU, Hwapyeong1KA, Dongho1YEO, Hwasoo3*
1Ph.D Course, Department of Civil and Environmental Engineering, KAIST, Daejeon 34141, Korea
2Professor, School of Civil Engineering, The University of Queensland, St. Lucia 4072, Australia
3Professor, Department of Civil and Environmental Engineering, KAIST, Daejeon 34141, Korea
*Corresponding author: hwasoo@kaist.ac.kr
Abstract
Recently, as a variety of position sensors are developed, a large amount of urban
p
osition
data is collected in the urban traffic networks. Based on the data collected through such locatio
n
sensors, high-resolution urban mobility data of individual users using urban road networks is
generated and collected in the transportation systems. Urban mobility data generated by
t
hese
sensors provide a novel spatio-temporal insights into the mobility patterns of traffic
n
etwork
users and can be used to develop models and strategies to predict traffic flows in urban areas
and improve traffic efficiency. This study proposes an algorithm for predicting urban
m
obility
patterns. Deep learning based algorithm is used to train mobility patterns in urban areas and
predict mobility. The proposed algorithm is trained and tested using Bluetooth data collected i
n
Brisbane for one year. As a result of evaluating the performance of the algorithm with the
t
est
dataset, the proposed algorithm shows an average prediction accuracy of 70% or more.
Keywords: artificial neural network, deep learning, urban mobility prediction, vehicle trajetory
초록
최근 다한 위치추적서를 통하여 수집된 데이터를 기반으로 교통 분야에서는 도시 도로
망을 이용하는 개별 사용자의 고해상도 이동성 데이터가 생성 수집되고 있다. 해당 서에서
생성 된 도시 지 이동성 데이터는 교통 네트워크 이용자들의 이동 턴에 대한 시공간적인
로운 통찰력을 제하며, 이는 도시 지 교통 흐름예측하고 교통 효을 향상시는 모
을 개발하는데 사용 될 수 있다. 따라서 이 연구는 도시 지 이동성 턴을 예측하고
도시 지 차량 적을 예측하는 알고리을 제안한다. 도시 지을 구으로 나어 거시적 이
동성 턴을 분석한 선행 연구와는 달리, 본 연구에서는 교차로 단위의 차량 적 데이터를 생
성하여 보다 시적인 이동성 턴을 분석하려고 한다, 본 연구에서는 기반의 모
용하여 차량 적을 예측하였다. 한 차량서 진행한 교차로 시퀀를 입력하여 다에 이
차량이 진행할 교차로를 예측한다. 제안된 알고리에서 1년 수집된
ARTICLE HISTORY
Received: 28 June 2019
Revised: 30 July 2019
Accepted: 3 September 2019
Copyright
Korean Society of Transportation
This is an Open-Acce ss art icle distri buted under
the terms of the Creative Commons Attribut ion
Non-Commercial License
(http: //creat ivecommons.org/l icenses/by -nc/3.0)
which permits unrestricted non-commercial use,
distri bution, and reproduct ion i n any medium,
provided t he original work i s properly ci ted.
J. Korean Soc. Transp.
Vol.37, No.5, pp.422-429, October 2019
https :// doi. org/10. 7470/j kst.2019.37. 5.422
pISSN : 1229-1366
eISSN : 2234-4217
대한교통학회지
,
제
37
권제
5
, 2019
년
10
423
CHOI, Seongjin
KIM, Jiwon
YU, Hwapyeong
KA, Dongho
YEO, Hwasoo Articl e
이터를 이용하여 학습하고 시험한다. 시험 데이터 세로 알고리의 성능을 평가한 결과 제안된 알고리이 평
70% 이상의 예측 정확도를 보였다.
주요어:
도시 지 이동성 턴, , 데이터, 차량
서론
최근 다한 위치 추적 서와 통이 발달함에 따라 도시 공간에서 다체의 대량의 위치 데이터를 수
집하고 있다. 이러한 위치추적서를 통하여 수집된 데이터를 기반으로 교통 분야에서는 도시 도로망을 이용하는
개별 사용자의 고해상도 Urban Mobility 데이터가 생성 수집되고 있다. 개별 사용자의 Urban Mobility 데이터
를 수집하는 방법은 크게 가지로 분류할 수 있다. 첫 째 방법은 이 GPS (Global Positioning
System)가 장된 위치 인 장치를 사용하는 것이다. 이러한 위치 인 장치들은 사용자의 위치를 계속해서 추적하
여 기한다. 째 방법은 도로 치된 서를 이용하는 방법이다. 를 들어, 도로 치된
근 제어 캐너(Bluetooth Media Access Control Scanner, BMS)와 서를 통해서 해당 서 주을 지
나가는 Bluetooth 장치들의 호인 MAC ID (Media Access Control)와 통과 시을 기한다. 이게 수집된
데이터 중 은 이용자 ID MAC ID를 가진 데이터들의 위치와 시 을 연결함으로서 도시 교통 네트워크에
서의 개별 차량 적 데이터를 생성할 수 있다.
각각의 개별 차량 적 데이터는 개별 차량의 기 점, 출 그리고 경로 선 정보를 함한다. 이
도 각 지점을 통과한 시이 기되기 때문에 통행시과 평 통행 속도 등의 정보도 도출할 수 있다. 이와 은 정
보는 도시 교통 네트워크의 이동성 분석을 위한 다한 정보를 함하고 있다. 더욱이 일정 기 동안 해당 도시 교
네트워크에서 수집된 개별 차량 적 데이터를 분석할 하나의 데이터 세로 결합한다면, 이 데이터 세
O-D, 경로 선 턴, 지 교통류 턴과 은 해당 도시 교통 네트워크 전반의 이동성 턴을 나타
있다(Kim and Mahmassani, 2015).
차량 적을 통하여 도시 교통 네트워크의 이동성 턴을 분석하는 다한 방법들이 제시되고 있다(Mazimpaka
and Timpf, 2016). 도시 교통 네트워크에서 이동하는 차량의 방대한 적 데이터를 분석하여 개별 차량의 다
치(Noulas et al., 2012; Gambs et al., 2012; Mathew et al., 2012), 목적지(Krumm and Horvitz, 2006; Ziebart et
al., 2008; Horvitz and Krumm, 2012; Xue et al., 2015), 그리고 교통체증 사고와 은 교통 사건 사고 발생 여
부를(Wang and Kim, 2016) 예측한다. 그 중, 이 연구에서 초점을 둘 방법은 차량 적을 기반으로 개별차량의 다
이동 위치를 예측하는 다위치 예측문제(next location prediction problem) 이다.
선행 연구(Choi et al., 2018)에서 기반의 다위치 예측문제 방법이 제시되다. 이 선행 연구에서는 호
시의 도시 교통 네트워크를 일정한 반경(300m, 500m, 1,000m)을 기반으로 구을 분할고, 차량
적데이터를 구퀀(cell sequence, region sequence) 데이터로 방법의 일인 회귀신경망
(Recurrent Neural Network)을 기반으로 한 모을 이용하여 차량 적을 예측하였다. 원시 차량 적데이터를 구
퀀 데이터로 환하여 원시 차량 적 데이터에 재할 수 있는 시적 소(microscopic noise)의 부정적
효과를 제거하고 기반의 모로 구 O-D 정보와 거시적 교통 흐름함한 구 단위의 거시적
을 분석하였다.
본 연구에서는 선행 연구와는 달리 시적 을 분석하고자 한다. 선행 연구에서는 도시 네트워크를 구
로 나 단위의 차량 적을 예측하였는데, 이를 통해서 데이터 기반으로 거시적 교통 흐름을 분석할 수 있
다. 본 연구에서는 선행 연구와는 다르게 도시 네트워크의 교차로 단위의 차량 적을 예측하는 알고리을 개발하
고자 한다. 이를 통해서 교차로 단위의 교통 수요 이동 경로를 예측할 수 있고, 각 교차로에서의 개별 차량의 회전
의도(turning intention)를 예측할 수 있다. 또한 교차로에 있는 차량들의 회전 의도 예측값합하여 각 교차로에
Journal of Korean Society of Transportation Vol.37 No.5 October 2019
424
Articl eDeep-learning Based Urban Vehicle Trajectory Prediction
서의 실시 회전 비(split ratio)을 추정할 수 있다.
적으로, 본 연구에서는 도시 네트워크의 교차로 수준의 시적인 이동성 턴을 포착하기 위해 차량
을 개발하고자 한다. 기 연구(Choi et al., 2018)에서와 이 도시 교통 네트워크를 구으로 분할하여 차
적을 구퀀로 나타는 대, 본 연구에서는 각 교차로를 심지점(POI, Point of Interest)으로 정하여
차량 적을 POI 시퀀로 표현하여 기반의 알고리을 이용하여 주어진 POI 시퀀를 기반으로 다 POI
예측하는 알고리을 개발한다.
연구방법
1.
도시 지역 차량 궤적 데이터
본 연구에서 사용한 도시 지 이동성 데이터는 호주 시의 교차로에 치되어 있는 MAC
캐너(Bluetooth Media Access Control Scanner)를 기반으로 수집된 데이터이다. 이 데이터는 퀸즈랜 교통부
(Queesland Transport and Main Roads, TMR)와 시의회(Brisbane City Council, BCC)에서 제하고,
의 주요 교차로에 치된 MAC 캐너를 통하여 데이터가 수집된다. 각각의
MAC 캐너 10-15초 격으로 위 안에 있는 기기를 감지하고 이를 기한다(Bhaskar and
Edward, 2013). 이와 이 기된 데이터 중 MAC ID를 가진 데이터를 시 서대로 연결하면 해당
장치가 장된 개별 차량의 이동 적을 구성할 수 있다. 이와 이 수집된 개별 차량의 이동 적 데이터는 해당
차량이 실제로 이동한 정확한 기점과 점은 알 수 지만, MAC 캐너치되어 있는 주요 교차로 단
위의 기 점은 알 수 있다. 이러한 제를 보하기 위하여 본 연구에서는 비교적 다른 지보다 MAC
캐너치되어 있는 도심지을 연구 대상지로 정하였다.
Figure 1은 호주 시의 MAC 캐너공간적 분를 보여준다. 도심 주의 149개
의 주요 교차로를 심 지(Point of Interest, POI)으로 정하여 POI 시퀀 데이터를 생성다. 이 데이터는
Figure 1.
Spatial distribution of Bluetooth MAC sensors in Brisbane city
대한교통학회지
,
제
37
권제
5
, 2019
년
10
425
CHOI, Seongjin
KIM, Jiwon
YU, Hwapyeong
KA, Dongho
YEO, Hwasoo Articl e
2015년 7월부터 2016년 6월까지 수집되다. 데이터 수집 과정에서 함된 데이터 를 제거하기 위하여 전처
리 과정을 거다. 를 들어, 차량 적 상에서 차량의 속도가 무 높게 책정되는 비현실적인 이동경로나 차량이
이동 중 일부 서에 감지되지 않아 데이터 된 경우 데이터 세에서 제하여, 6만개의 차량
데이터를 사용하였다.
2.
딥러닝 기반 차량 궤적 예측 알고리즘
본 연구에서는 차량 적데이터를 기반으로 생성된 POI 시퀀예측함으로서 도시 지 차량 적을 예측한다.
POI 시퀀예측하는 모은 차량 적의 기점(origin), 경로(route), 그리고 점(destination) 모예측할 수
있는 기능을 가지고 있다.
Figure 2는 기반 차량 예측 알고리의 구조를 보여준다. 본 연구에서는 중 하나인 피
포워드 경망(Feed-Forward Neural Networks)을 기반으로 하는 차예측 알고리을 사용하였다. 먼저
이 알고리의 입력에서는 최대 입력 시퀀 이를(l) 초수(hyperparameter)로 정하여 개의 POI가
예측 알고리으로 입력될 것인지를 결정한다. Figure 2의 경우에는 l 이 3인 경우이다. Figure 2에서 대상 차량이 A,
B, C 으로 이동하였다고 . 각각의 POI는 one-hot vector의 형로 차량 예측 알고리에 입력된다.
이 one-hot vector는 POI (POI embedding layer)를 통하여 특성 터(feature vector)로 환된다. 이 특
터는 각 POI의 위치적 특성들이 반되어 있다. 이환된 특성 터들은 피드포워드 경망 으로 입력
되어 계산된다. 피드포워드 경망 은 은개수(h)를 초수로 가지고 있다. 피드포워드 경망
3개의 으로 이루어 있으며, 각각의 의 계산이 끝날 마다 Relu라는 활성화함수를 통하여 계산 결과가
활성화된다. 마지으로 출력의 결과은 다중 분류 제에서 이 사용되는 소프트(softmax)라는 활성화함
수를 통하여 활성화되고 이 은 전체 POI 중 다에 해당 차량이 각각의 POI를 지나을 나타다. 이 중 실
제 지나 POI를 예측할 확예측 정확도(

)로 정의하였다.
Figure 2.
Structure of deep-learning based urban mobility prediction model
기반 차량 예측 알고리에서 도출한 POI확과 실제 결과을 비교하여 (loss)을 계산하고,
이것을 기반으로 알고리(back propagation algorithm)을 사용하여 각 재하는 수들을
(parameter) 학습한다. 본 연구에서는 실 함수로는 크로스엔트로피 함수(cross-entropy loss function)를 사
용하고, 산정Equation 1과 다.
Journal of Korean Society of Transportation Vol.37 No.5 October 2019
426
Articl eDeep-learning Based Urban Vehicle Trajectory Prediction

log
log

(1)
알고리학습에 필요한 초튜닝 기능을 이 수행해주는 Adam optimizer (Kingma
and Ba, 2014)를 사용하여 수들을 학습한다.
딥러닝 기반 차량궤적 예측 알고리즘 성능 평가
기반 차량 예측 알고리의 성능을 평가하기에 기반 차량 예측 알고리에 들어가
는 초수를 결정해야한다. 알고리의 초수는 데이터와 대상지에 따라 달라지기 때문에 다른데이터와
다른 대상지에 대해서 은 알고리을 사용한다면 초수를 결정하는 과정을 다시 거야 한다. 초수를
결정하기 위하여 본 연구에서는 각 초수의 후보을 만들어고 모든 조합을 전부 실험해보는 탐색
(exhaustive search)을 사용하였다. 이 알고리에 들어가는 초수는 최대 입력 시퀀 이(l)와 은
개수(h)가 있는데, 최대 입력 시퀀 이는 1부터 6지로 정하였고, 은 개수는 1부터 1024
2의 거수들로( 11개) 구성하였다. 초수의 조합은 66가지가 나오고 각 초수의 조합을 서로
다른 난수생성 시를 사용하여 100 시험하였다.
Figure 3은 다한 초수 조합에 대한 결과를 나타다. Figure 3의 x축은 은 개수(h)이고 y축
왼쪽래프의 경우 (loss;
), 그리고 오른래프의 경우 예측정확도(accuracy)를 나타다. 각
각의 그래프는 최대 입력 시퀀 이(l)에 따라 6개의 그래프로 나 있다. 그래프 상의 각 점들은 각 초
수 조합에 대한 100의 시험 결과의 평균값을 나타다.
Figure 3.
Result of the model performance evaluation. Average loss and average accuracy calculated with training and validation
dataset
개수(h)가 증가함에 따라 어들고 예측정확도는 증가하는 추세가 있 하지만 일정 은
개수 이상에서는 증가량이 크지 않고 수한 것으로 보인다. 또한, 은 개수가 증가할수
학습해야 될 수의 개수가 아지고 그에 따라 계산 속도도 려진다. 따라서 이 경우에는 은 개수
가 64개 이상일 큰 증가추세가 때문에 계산 속도를 고려하여 적정 h 을 64로 정하였다.
Table 1은 은 개수를 64로 최대 입력 시퀀 이에 따른 예측 정확도의 결과를 보여준
다. 평 예측 정확도를 보면 최대 입력 시퀀 이가 2 이상이면 비한 수준의 성능을 보여준다. 하지만 예측
대한교통학회지
,
제
37
권제
5
, 2019
년
10
427
CHOI, Seongjin
KIM, Jiwon
YU, Hwapyeong
KA, Dongho
YEO, Hwasoo Articl e
확도의 표준차를 보면 최대 입력 시퀀 이가 2일 보다 그 이후가 은 것으로 나타난다. 따라서 본 연구에서
예측 정확도의 표준 차를 이기 위하여 적정 최대 입력 시퀀 이를 3으로 정하였다.
Table 1.
Result of the model performance evaluation. Average and standard deviation calculated with validation dataset when
h=64
Max. length of input sequence Average of accuracy (%) Standard deviation of accuracy (%)
1 68.225 0.149
276.397 0.244
3 76.756 0.209
476.772 0.205
5 76.872 0.191
676.809 0.195
Figure 4는 시험 데이터세를 이용하여 정된 예측 정확도의 히스토과 경험적 적 분 함수를 보여준다.
알고리의 평 예측 정확도는 70.69%이다. Figure 4에서 예측 정확도의 분를 보면 예측 정확도가 50% 이상인
는 전체의 75% 정도이고, 예측 정확도가 75% 이상인 는 전체의 50% 이다.
(a) Histogram (b) Empirical cumulative density function
Figure 4.
Prediction result based on test dataset
결론
본 연구는 도시 지의 이동성 턴을 분석하여 개별 차량의 이동 적을 예측하는 것을 목표로 하고 있다. 해당
목표를 이루고자 MAC 캐너로 수집된 도시 지 차량 적데이터를 분석하고
기반의 차량 예측 알고리을 제안한다. 본 연구에서 제안된 알고리 데이터를 기반으로
성능이 평가되고 평 70.69%의 예측 정확도를 보여주다. 본 연구에서는 차량이 이동한 경로 데이터를 기반으
로만 다 POI를 예측하려고 하였지만 차량의 이동 경로에 향을 주는 요인은 다른 것들이 있을 수 있다. 따라서 추
후 연구에는 이러한 요인들도 반하여 예측하는 알고리을 개발하여야 한다.
본 연구에서 제안된 알고리은 다한 분야에 적용 가능하다. 를 들어, 크 단위의 차량경로 선예측하거
나 운전자의 회전 의도를 예측하는데 적용될 수 있다. 교차로에 근하는 운전자의 회전 의도를 예측하는 것은 교차
로 주에서 차량 충 회피 시스템이나 차량 충 경보 시스템 등을 함한 교차로 지원 시스템(Intersection
Journal of Korean Society of Transportation Vol.37 No.5 October 2019
428
Articl eDeep-learning Based Urban Vehicle Trajectory Prediction
Assistance System, IAS)의 필수적인 요소이다. 본 연구에서 제안된 알고리을 사용하면 어 차량이 이전 교차로
를 통과하는 시점에 다 교차로에서 어 을 보일지 예측할 수 있다. 운전자 회전 의도를 예측하는 기 연구
들은(Rodemerk et al., 2015; Phillips et al., 2017; Zyner, 2018) 회전 의도의 예측 시점이 다. 를 들면
Zyner의 논문에서는 회전의도를 2초전에, Rodemark의 논문에서는 회전의도를 10m전에 예측하는데 본 연구의 방
을 사용하면 이전 교차로를 지났을 예측이 가능하다. 그때문에 기 연구들의 회전의도 예측 시점이
다라는 한계점을 해결할 수 있다.
Funding
This research was supported by the Ministry of Land, Infrastructure, and Transport (MOLIT, KOREA) Project ID:
19TLRP-B146733-02, Project Name: Connected and Automated Public Transport Innovation (National R&D Project).
ORCID
CHOI, Seongjin http://orcid.org/0000-0001-7140-537X
KIM, Jiwon http://orcid.org/0000-0001-6380-3001
YU, Hwapyeong http://orcid.org/0000-0002-7007-4887
KA, Dongho http://orcid.org/0000-0001-9963-1416
YEO, Hwasoo http://orcid.org/0000-0002-2684-0978
References
Bhaskar A., Edward C. (2013) Fundamental understanding on the use of Bluetooth scanner as a complementary transport
data, Transportation Research Part C, Emerging Technologies 37, 42-72.
Choi S., Yeo H., Kim J. (2018) Network-Wide Vehicle Trajectory Prediction in Urban Traffic Networks using Deep
Learning, Transportation Research Record, 2672, 173-184.
Gambs M., Killijian O., del Prado Cortez M. N. (2012), Next place prediction using mobility markov chains, in
Proceedings of the First Workshop on Measurement, Privacy, and Mobility, ACM, 3.
Horvitz E., Krumm J. (2012), Some Help on the Way: Opportunistic routing under uncertainty, In Proceedings of the
2012 ACM conference on Ubiquitous Computing (371-380), ACM.
Kim J., Mahmassani H. S. (2015), Spatial and temporal characterization of travel patterns in a traffic network using
vehicle trajectories, Transportation Research Procedia, 9, 164-184.
Kingma D. P., Ba J. (2014), Adam: A method for stochastic optimization, arXiv preprint arXiv:1412.6980.
Krumm J., Horvitz E. (2006), Predestination: Inferring destinations from partial trajectories, In International Conference
on Ubiquitous Computing (243-260), Springer, Berlin, Heidelberg.
Mathew W., Raposo R., Martins B. (2012), Predicting future locations with hidden Markov models, In Proceedings of
the 2012 ACM conference on ubiquitous computing (911-918), ACM.
Mazimpaka J. D., Timpf S. (2016), Trajectory data mining: A review of methods and applications, Journal of Spatial
Information Science, 2016(13), 61-99.
Noulas A., Scellato S., Lathia N., Mascolo C. (2012), Mining user mobility features for next place prediction in
대한교통학회지
,
제
37
권제
5
, 2019
년
10
429
CHOI, Seongjin
KIM, Jiwon
YU, Hwapyeong
KA, Dongho
YEO, Hwasoo Articl e
location-based services, In 2012 IEEE 12th international conference on data mining (1038-1043), IEEE.
Phillips D. J., Wheeler T. A., Kochenderfer M. J. (2017), Generalizable intention prediction of human drivers at
intersections, In 2017 IEEE Intelligent Vehicles Symposium (IV)(1665-1670), IEEE.
Rodemerk C., Winner H., Kastner R. (2015), Predicting the driver's turn intentions at urban intersections using
context-based indicators, In 2015 IEEE Intelligent Vehicles Symposium (IV) (964-969), IEEE.
Wang, G., Kim, J. (2016), The prediction of traffic congestion and incident on urban road networks using naive bayes
classifier, In Australasian transport research forum 2016 proceedings, Melbourne, Australia.
Xue A. Y., Qi J., Xie X., Zhang R., Huang J., Li Y. (2015), Solving the data sparsity problem in destination
prediction, The VLDB Journal
The International Journal on Very Large Data Bases, 24(2), 219-243.
Ziebart B. D., Maas A. L., Dey A. K., Bagnell J. A. (2008), Navigate like a cabbie: Probabilistic reasoning from observed
context-aware behavior, In Proceedings of the 10th international conference on Ubiquitous computing (322-331),
ACM.
Zyner A. G. (2018), Naturalistic Driver Intention and Path Prediction using Machine Learning.
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
This paper proposes a deep learning approach to learning and predicting network-wide vehicle movement patterns in urban networks. Inspired by recent success in predicting sequence data using recurrent neural networks (RNN), specifically in language modeling that predicts the next words in a sentence given previous words, this research aims to apply RNN to predict the next locations in a vehicle’s trajectory, given previous locations, by viewing a vehicle trajectory as a sentence and a set of locations in a network as vocabulary in human language. To extract a finite set of “locations,” this study partitions the network into “cells,” which represent subregions, and expresses each vehicle trajectory as a sequence of cells. Using large amounts of Bluetooth vehicle trajectory data collected in Brisbane, Australia, this study trains an RNN model to predict cell sequences. It tests the model’s performance by computing the probability of correctly predicting the next k consecutive cells. Compared with a base-case model that relies on a simple transition matrix, the proposed RNN model shows substantially better prediction results. Network-level aggregate measures such as total cell visit count and intercell flow are also tested, and the RNN model is observed to be capable of replicating real-world traffic patterns.
Article
Full-text available
The increasing use of location-aware devices has led to an increasing availability of trajectory data. As a result, researchers devoted their efforts to developing analysis methods including different data mining methods for trajectories. However, the research in this direction has so far produced mostly isolated studies and we still lack an integrated view of problems in applications of trajectory mining that were solved, the methods used to solve them, and applications using the obtained solutions. In this paper, we first discuss generic methods of trajectory mining and the relationships between them. Then, we discuss and classify application problems that were solved using trajectory data and relate them to the generic mining methods that were used and real world applications based on them. We classify trajectory-mining application problems under major problem groups based on how they are related. This classification of problems can guide researchers in identifying new application problems. The relationships between the methods together with the association between the application problems and mining methods can help researchers in identifying gaps between methods and inspire them to develop new methods. This paper can also guide analysts in choosing a suitable method for a specific problem. The main contribution of this paper is to provide an integrated view relating applications of mining trajectory data and the methods used.
Article
Full-text available
This paper presents a trajectory clustering method to discover spatial and temporal travel patterns in a traffic network. The study focuses on identifying spatially distinct traffic flow groups using trajectory clustering and investigating temporal traffic patterns of each spatial group. The main contribution of this paper is the development of a systematic framework for clustering and classifying vehicle trajectory data, which does not require a pre-processing step known as map-matching and directly applies to trajectory data without requiring the information on the underlying road network. The framework consists of four steps: similarity measurement, trajectory clustering, generation of cluster representative subsequences, and trajectory classification. First, we propose the use of the Longest Common Subsequence (LCS) between two vehicle trajectories as their similarity measure, assuming that the extent to which vehicles’ routes overlap indicates the level of closeness and relatedness as well as potential interactions between these vehicles. We then extend a density-based clustering algorithm, DBSCAN, to incorporate the LCS-based distance in our trajectory clustering problem. The output of the proposed clustering approach is a few spatially distinct traffic stream clusters, which together provide an informative and succinct representation of major network traffic streams. Next, we introduce the notion of cluster representative subsequence (CRS), which reflects dense road segments shared by trajectories belonging to a given traffic stream cluster, and present the procedure of generating a set of CRSs by merging the pairwise LCSs via hierarchical agglomerative clustering. The CRSs are then used in the trajectory classification step to measure the similarity between a new trajectory and a cluster. The proposed framework is demonstrated using actual vehicle trajectory data collected from New York City, USA. A simple experiment was performed to illustrate the use of the proposed spatial traffic stream clustering in application areas such as network-level traffic flow pattern analysis and travel time reliability analysis.
Article
Full-text available
Literature is limited in its knowledge of the Bluetooth protocol based data acquisition process and in the accuracy and reliability of the analysis performed using the data. This paper extends the body of knowledge surrounding the use of data from the Bluetooth Media Access Control Scanner (BMS) as a complementary traffic data source. A multi-layer simulation model named Traffic and Communication Simulation (TCS) is developed. TCS is utilised to model the theoretical properties of the BMS data and analyse the accuracy and reliability of travel time estimation using the BMS data.
Conference Paper
Many improvements have been made in the area of vehicle safety and pedestrian protection; however, urban intersections are still black spots for Advanced Driver Assistance Systems (ADAS). One of the main reasons is the uncertainty of the future driving direction at intersections. Due to that uncertainty, the early activation of an intersection ADAS will lead to high false positive rates, while, in contrast, a late activation of an intersection ADAS will lead to a low accident-reduction potential. This tradeoff is described as warning dilemma. In order to solve the warning dilemma, an approach to predicting the driver’s turn intention at urban intersections is introduced. The novelty of the approach is its context-based prediction of the future driving maneuver several seconds before the driving trajectory changes. To predict maneuvers, indicators are used to encode the context information together with vehicle data. A system setup including prediction results of the system is described.
Article
Destination prediction is an essential task for many emerging location-based applications such as recommending sightseeing places and targeted advertising according to destinations. A common approach to destination prediction is to derive the probability of a location being the destination based on historical trajectories. However, almost all the existing techniques use various kinds of extra information such as road network, proprietary travel planner, statistics requested from government, and personal driving habits. Such extra information, in most circumstances, is unavailable or very costly to obtain. Thereby we approach the task of destination prediction by using only historical trajectory dataset. However, this approach encounters the “data sparsity problem”, i.e., the available historical trajectories are far from enough to cover all possible query trajectories, which considerably limits the number of query trajectories that can obtain predicted destinations. We propose a novel method named Sub-Trajectory Synthesis (SubSyn) to address the data sparsity problem. SubSyn first decomposes historical trajectories into sub-trajectories comprising two adjacent locations, and then connects the sub-trajectories into “synthesised” trajectories. This process effectively expands the historical trajectory dataset to contain much more trajectories. Experiments based on real datasets show that SubSyn can predict destinations for up to ten times more query trajectories than a baseline prediction algorithm. Furthermore, the running time of the SubSyn-training algorithm is almost negligible for a large set of 1.9 million trajectories, and the SubSyn-prediction algorithm runs over two orders of magnitude faster than the baseline prediction algorithm constantly.
Conference Paper
The analysis of human location histories is currently getting an increasing attention, due to the widespread usage of geopositioning technologies such as the GPS, and also of online location-based services that allow users to share this information. Tasks such as the prediction of human movement can be addressed through the usage of these data, in turn offering support for more advanced applications, such as adaptive mobile services with proactive context-based functions. This paper presents an hybrid method for predicting human mobility on the basis of Hidden Markov Models (HMMs). The proposed approach clusters location histories according to their characteristics, and latter trains an HMM for each cluster. The usage of HMMs allows us to account with location characteristics as unobservable parameters, and also to account with the effects of each individual's previous actions. We report on a series of experiments with a real-world location history dataset from the GeoLife project, showing that a prediction accuracy of 13.85% can be achieved when considering regions of roughly 1280 squared meters.
Conference Paper
We investigate opportunistic routing, centering on the recommendation of ideal diversions on trips to a primary destination when an unplanned waypoint, such as a rest stop or a refueling station, is desired. In the general case, an automated routing assistant may not know the driver's final destination and may need to consider probabilities over destinations in identifying the ideal waypoint along with the revised route that includes the waypoint. We consider general principles of opportunistic routing and present the results of several studies with a corpus of real-world trips. Then, we describe how we can compute the expected value of asking a user about the primary destination so as to remove uncertainly about the goal and show how this measure can guide an automated system's engagements with users when making recommendations for navigation and analogous settings in ubiquitous computing.