공간 임베딩
Spatial embedding| 다음에 대한 시리즈 일부 |
| 머신러닝 및 데이터 마이닝 |
|---|
공간 임베딩은 점, 선, 다각형 또는 기타 공간 데이터 유형이 있는 공간 분석에 사용되는 특성 학습 기법 중 하나이다.[1]지리적 위치를 나타내는 것은 실제 숫자의 벡터에 매핑된다.개념적으로 그것은 지리적 객체당 많은 차원을 가진 공간으로부터 훨씬 더 낮은 차원을 가진 연속 벡터 공간까지 수학적으로 내장하는 것을 포함한다.
이러한 임베딩 방식은 신경망에서 복잡한 공간정보를 활용할 수 있도록 하며 공간분석 과제의 성능을[2][3] 향상시키는 것으로 나타났다.
내장형 데이터 유형
지리 데이터는 텍스트,[4][5][6] 이미지,[7][8] 그래프,[9][10] 궤적,[11][12][13] 다각형 등 다양한 형태를 취할 수 있다.[14]과제에 따라 다른 소스의 다중모달 데이터를 결합해야 할 필요가 있을 수 있다.[2][15]다음 절에서는 다양한 유형의 데이터 및 데이터 사용에 대한 예를 설명한다.
텍스트
소셜 미디어에 지리적으로 배치된 게시물은 나중에 단어 내장 기술을 사용하여 내장 벡터로 변환될 수 있는 지정된 장소에 바인딩된 문서 라이브러리를 획득하는 데 사용될 수 있다.[4]
이미지
인공위성과 항공기는 기계학습에 사용될 수 있는 원격 감지 이미지로부터 획득한 디지털 공간 데이터를 수집한다.그것들은 때때로 기본적인 영상 분석 방법을 사용하여 분석하기 어렵고, 주어진 지리적 물체나 지역에 묶인 영상들의 임베딩을 얻기 위해 경련 신경망을 사용할 수 있다.[7]
포인트
단일 관심 지점(POI)은 기계 학습에 사용할 수 있는 여러 기능을 할당할 수 있다.예를 들어 인구통계학적, 교통적, 기상학적 또는 경제적 데이터가 될 수 있다.단일 지점을 포함시킬 때 사용 가능한 지점의 전체 집합을 그래프에 노드로 간주하는 것이 일반적이다.[10]
선/다행
그 중에서도 운동 궤도는 선(다중선)으로 표현된다.이동 시간, 거리 및 도중에 방문한 지점의 특징을 고려하여 개별 궤적이 내장되어 있다.궤적을 내장하면 클러스터링과 분류와 같은 과제의 성과를 향상시킬 수 있다.[13]
폴리곤
예를 들어 기계학습에서 분석되는 지리적 영역은 행정적 경계와 하향식 구획으로 정의된다.두 유형 모두 다각형으로 표현되며, 포인트와 마찬가지로 다른 인구통계학적, 교통적 또는 경제적 특징을 할당할 수 있다.폴리곤은 또한 그것이 나타내는 면적이나 모양과 관련된 특징을 가질 수 있다.
샌프란시스코 행정 구역 지도. |
그래프
그래프 표현이 사용되는 예로는 도시의 도로 배치로, 꼭지점이 교차점이 될 수 있고 가장자리가 도로가 될 수 있다.정점은 또한 대중교통 정류장이나 도시의 중요한 지점과 같은 목적지 지점이 될 수 있으며, 가장자리는 그들 사이의 흐름을 나타낸다.그래프나 단일 정점을 내장하면 처리된 지리적 영역을 네트워크로 나타낼 수 있는 분석 방법의 정확도를 향상시킬 수 있다.[9]
사용법
- POI 권장[15][16] 사항 - 사용자 선호도에 따라 개인화된 관심 지점 권장 사항 생성
- 다음/미래 위치 예측[10][17] - 역사적 궤적을 바탕으로 사람이 갈 다음 위치 예측.
- 구역 기능 분류[13] - 사람들의 다른 이동성 또는 POI 분포에 기초하여 도시 내 특정 지역의 기능을 예측할 수 있다.
- 범죄 예측[18] - 한 도시의 여러 지역에서의 범죄율 추정.
- 국지적 사건 감지[6] - 임베딩의 주피오-임시적 변화를 연구하면 특정 위치에서 발생하는 국지적 사건을 탐지하는 데 귀중한 정보를 제공할 수 있다.
- 지역 이동성 인기 예측[11] - 이동성의 분석은 도시 내 여러 지역의 인기 패턴을 보여줄 수 있다.
- 모양 일치[14] - 주어진 폴리곤과 유사한 모양 찾기(예: 입력 건물과 같은 모양의 건물 찾기)
- 이동 시간 추정[19][20][21] - 현재 교통 상황 및 특수 발생 사건에 대한 예상 이동 시간 예측.
- 주문형 식품 배송에[22] 대한 시간 추정 - 웹사이트를 통한 주문 시 배송 시간의 추정.
시간적 측면
분석된 데이터 중 일부는 이와 연관된 타임스탬프를 가지고 있다.데이터 분석의 어떤 경우에는 이 정보가 생략되고 다른 경우에는 집합을 그룹으로 나누는 데 사용된다.가장 흔한 구분은 평일을 주말이나 시간에서 분리하는 것이다.이는 특히 이동성 데이터의 분석에서 중요한데, 주 중 이동성의 특성과 하루 중 다른 시간이 서로 매우 다르기 때문이다.[3][23][24]예를 들어, 개별 월들로 시간 구분을 할 수 있는 또 다른 영역은 특정 지역의 관광 분석에 있다.[16]그러한 분할을 고려하기 위해, 내장 방법은 분석된 집합의 서로 다른 하위그룹에 대해 타임 스탬프를 특별히 다루거나 별도의 버전의 모델을 개발한다.
참조
- ^ Schneider, Markus (2009), "Spatial Data Types", in LIU, LING; ÖZSU, M. TAMER (eds.), Encyclopedia of Database Systems, Boston, MA: Springer US, pp. 2698–2702, doi:10.1007/978-0-387-39940-9_354, ISBN 978-0-387-39940-9, retrieved 2021-01-19
- ^ a b Li, Youru; Zhu, Zhenfeng; Kong, Deqiang; Xu, Meixiang; Zhao, Yao (2019-07-17). "Learning Heterogeneous Spatial-Temporal Representation for Bike-Sharing Demand Prediction". Proceedings of the AAAI Conference on Artificial Intelligence. 33: 1004–1011. doi:10.1609/aaai.v33i01.33011004. ISSN 2374-3468.
- ^ a b Cao, Hancheng; Xu, Fengli; Sankaranarayanan, Jagan; Li, Yong; Samet, Hanan (2020-05-01). "Habit2vec: Trajectory Semantic Embedding for Living Pattern Recognition in Population". IEEE Transactions on Mobile Computing. 19 (5): 1096–1108. doi:10.1109/TMC.2019.2902403. ISSN 1536-1233. S2CID 86694179.
- ^ a b Dassereto, Federico; Di Rocco, Laura; Guerrini, Giovanna; Bertolotto, Michela (2020), Kyriakidis, Phaedon; Hadjimitsis, Diofantos; Skarlatos, Dimitrios; Mansourian, Ali (eds.), "Evaluating the Effectiveness of Embeddings in Representing the Structure of Geospatial Ontologies", Geospatial Technologies for Local and Regional Development, Cham: Springer International Publishing, pp. 41–57, doi:10.1007/978-3-030-14745-7_3, ISBN 978-3-030-14744-0, retrieved 2021-01-19
- ^ Jin, Jiaqi; Xiao, Zhuojian; Qiu, Qiang; Fang, Jinyun (July 2019). "A Geohash Based Place2vec Model". IGARSS 2019 - 2019 IEEE International Geoscience and Remote Sensing Symposium. Yokohama, Japan: IEEE: 3344–3347. doi:10.1109/IGARSS.2019.8898375. ISBN 978-1-5386-9154-0. S2CID 208033962.
- ^ a b Silva, Amila; Karunasekera, Shanika; Leckie, Christopher; Luo, Ling (December 2019). "USTAR: Online Multimodal Embedding for Modeling User-Guided Spatiotemporal Activity". 2019 IEEE International Conference on Big Data (Big Data). Los Angeles, CA, USA: IEEE: 1211–1217. arXiv:1910.10335. doi:10.1109/BigData47090.2019.9005461. ISBN 978-1-7281-0858-2. S2CID 204838325.
- ^ a b Zhang, Sen; Li, Shaobo; Li, Xiang; Yao, Yong (2020-04-02). "Representation of Traffic Congestion Data for Urban Road Traffic Networks Based on Pooling Operations". Algorithms. 13 (4): 84. doi:10.3390/a13040084. ISSN 1999-4893.
- ^ Dao, Minh-Son; Zettsu, Koji (September 2018). "A Raster-Image-Based Approach for Understanding Associations of Urban Sensing Data". 2018 IEEE First International Conference on Artificial Intelligence and Knowledge Engineering (AIKE). Laguna Hills, CA: IEEE: 134–137. doi:10.1109/AIKE.2018.00029. ISBN 978-1-5386-9555-5. S2CID 53279500.
- ^ a b Wu, Ning; Zhao, Xin Wayne; Wang, Jingyuan; Pan, Dayan (2020-08-23). "Learning Effective Road Network Representation with Hierarchical Graph Neural Networks". Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. KDD '20. Virtual Event CA USA: ACM: 6–14. doi:10.1145/3394486.3403043. ISBN 978-1-4503-7998-4. S2CID 221191109.
- ^ a b c Xu, Shuai; Cao, Jiuxin; Legg, Phil; Liu, Bo; Li, Shancang (June 2020). "Venue2Vec: An Efficient Embedding Model for Fine-Grained User Location Prediction in Geo-Social Networks". IEEE Systems Journal. 14 (2): 1740–1751. Bibcode:2020ISysJ..14.1740X. doi:10.1109/JSYST.2019.2913080. ISSN 1932-8184. S2CID 181989049.
- ^ a b Fu, Yanjie; Wang, Pengyang; Du, Jiadi; Wu, Le; Li, Xiaolin (2019-07-17). "Efficient Region Embedding with Multi-View Spatial Networks: A Perspective of Locality-Constrained Spatial Autocorrelations". Proceedings of the AAAI Conference on Artificial Intelligence. 33 (1): 906–913. doi:10.1609/aaai.v33i01.3301906. ISSN 2374-3468.
- ^ Ouyang, Kun; Shokri, Reza; Rosenblum, David S.; Yang, Wenzhuo (July 2018). "A Non-Parametric Generative Model for Human Trajectories". Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence. Stockholm, Sweden: International Joint Conferences on Artificial Intelligence Organization: 3812–3817. doi:10.24963/ijcai.2018/530. ISBN 978-0-9992411-2-7.
- ^ a b c Yao, Zijun; Fu, Yanjie; Liu, Bin; Hu, Wangsu; Xiong, Hui (July 2018). "Representing Urban Functions through Zone Embedding with Human Mobility Patterns". Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence. Stockholm, Sweden: International Joint Conferences on Artificial Intelligence Organization: 3919–3925. doi:10.24963/ijcai.2018/545. ISBN 978-0-9992411-2-7.
- ^ a b Yan, Xiongfeng; Ai, Tinghua; Yang, Min; Tong, Xiaohua (2020-05-25). "Graph convolutional autoencoder model for the shape coding and cognition of buildings in maps". International Journal of Geographical Information Science. 35 (3): 490–512. doi:10.1080/13658816.2020.1768260. ISSN 1365-8816. S2CID 219469997.
- ^ a b Chang, Buru; Park, Yonggyu; Park, Donghyeon; Kim, Seongsoon; Kang, Jaewoo (July 2018). "Content-Aware Hierarchical Point-of-Interest Embedding Model for Successive POI Recommendation". Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence. Stockholm, Sweden: International Joint Conferences on Artificial Intelligence Organization: 3301–3307. doi:10.24963/ijcai.2018/458. ISBN 978-0-9992411-2-7.
- ^ a b Bin, Chenzhong; Gu, Tianlong; Jia, Zhonghao; Zhu, Guimin; Xiao, Cihan (June 2020). "A neural multi-context modeling framework for personalized attraction recommendation". Multimedia Tools and Applications. 79 (21–22): 14951–14979. doi:10.1007/s11042-019-08554-5. ISSN 1380-7501. S2CID 209540693.
- ^ "Next Location Prediction with a Graph Convolutional Network Based on a Seq2seq Framework". KSII Transactions on Internet and Information Systems. 14 (5). 2020-05-31. doi:10.3837/tiis.2020.05.003.
- ^ Qian, Yiting; Pan, Li; Wu, Peng; Xia, Zhengmin (July 2020). "GeST: A Grid Embedding based Spatio-Temporal Correlation Model for Crime Prediction". 2020 IEEE Fifth International Conference on Data Science in Cyberspace (DSC). Hong Kong, Hong Kong: IEEE: 1–7. doi:10.1109/DSC50466.2020.00009. ISBN 978-1-7281-9558-2. S2CID 221281815.
- ^ Wang, Meng-xiang; Lee, Wang-Chien; Fu, Tao-yang; Yu, Ge (2019-11-05). "Learning Embeddings of Intersections on Road Networks". Proceedings of the 27th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems. Chicago IL USA: ACM: 309–318. doi:10.1145/3347146.3359075. ISBN 978-1-4503-6909-1. S2CID 208016230.
- ^ Xu, Saijun; Xu, Jiajie; Zhou, Rui; Liu, Chengfei; Li, Zhixu; Liu, An (2020), Nah, Yunmook; Cui, Bin; Lee, Sang-Won; Yu, Jeffrey Xu (eds.), "TADNM: A Transportation-Mode Aware Deep Neural Model for Travel Time Estimation", Database Systems for Advanced Applications, Cham: Springer International Publishing, vol. 12112, pp. 468–484, doi:10.1007/978-3-030-59410-7_32, ISBN 978-3-030-59409-1, S2CID 221840073, retrieved 2021-01-19
- ^ Xu, Saijun; Zhang, Ruoqian; Cheng, Wanjun; Xu, Jiajie (2020-08-15). "MTLM: a multi-task learning model for travel time estimation". GeoInformatica. doi:10.1007/s10707-020-00422-x. ISSN 1384-6175. S2CID 221128832.
- ^ Zhu, Lin; Yu, Wei; Zhou, Kairong; Wang, Xing; Feng, Wenxing; Wang, Pengyu; Chen, Ning; Lee, Pei (2020-08-23). "Order Fulfillment Cycle Time Estimation for On-Demand Food Delivery". Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. KDD '20. Virtual Event CA USA: ACM: 2571–2580. doi:10.1145/3394486.3403307. ISBN 978-1-4503-7998-4. S2CID 221191619.
- ^ Du, Bowen; Peng, Hao; Wang, Senzhang; Bhuiyan, Md Zakirul Alam; Wang, Lihong; Gong, Qiran; Liu, Lin; Li, Jing (March 2020). "Deep Irregular Convolutional Residual LSTM for Urban Traffic Passenger Flows Prediction". IEEE Transactions on Intelligent Transportation Systems. 21 (3): 972–985. doi:10.1109/TITS.2019.2900481. ISSN 1524-9050. S2CID 116832221.
- ^ Hong, Huiting; Lin, Yucheng; Yang, Xiaoqing; Li, Zang; Fu, Kung; Wang, Zheng; Qie, Xiaohu; Ye, Jieping (2020-08-23). "HetETA: Heterogeneous Information Network Embedding for Estimating Time of Arrival". Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. KDD '20. Virtual Event CA USA: ACM: 2444–2454. doi:10.1145/3394486.3403294. ISBN 978-1-4503-7998-4. S2CID 221191112.