Trayectorias de agrupamiento (datos GPS de (x, y) puntos) y minar los datos

14

Tengo2preguntassobreelanálisisdeunconjuntodedatosGPS.

1)ExtraertrayectoriasTengounagranbasededatosdecoordenadasGPSgrabadasdelaforma(latitude,longitude,date-time).Deacuerdoconlosvaloresdefechayhoradelosregistrosconsecutivos,estoyintentandoextraertodaslastrayectorias/caminosseguidosporlapersona.Porejemplo;Porejemplo,apartirdeltiempoM,lospares(x,y)cambiancontinuamentehastaeltiempoN.DespuésdeN,elcambioen(x,y)paresdisminuye,momentoenelqueconcluyoquelatrayectoriatomadadesdeeltiempoMaNsepuedellamarunatrayectoria.¿Esunenfoquedecenteaseguircuandoseextraentrayectorias?¿Existenenfoques/métodos/algoritmosconocidosquepuedasugerir?¿Hayalgunaestructuraoformatodedatosquemegustaríasugerirparamanteneresospuntosdemaneraeficiente?Quizás,paracadatrayectoria,¿seríaútilcalcularlavelocidadylaaceleración?

2)MinandolastrayectoriasUnavezquehayaseguidotodaslastrayectorias/caminostomados,¿cómopuedocompararlos/agruparlos?Megustaríasabersilospuntosdeinicioofinalsonsimilares,entonces,¿cómosecomparanlasrutasintermedias?

¿Cómocomparolas2rutas/rutasyconcluyosisonsimilaresono?Además;¿Cómoagruporutassimilares?

Leagradeceríamuchoquemeindicaraunainvestigaciónoalgosimilarsobreestetema.

EldesarrolloestaráenPython,perotodotipodesugerenciasdebibliotecassonbienvenidas.

Estoyabriendoexactamentelamismapregunta enlace en StackOverflow. Pensé que tendría más respuestas aquí ...

    
pregunta Murat 07.02.2011 - 14:57

5 respuestas

2

Dos artículos que probablemente te interesen, ya que tienen motivaciones similares a las tuyas:

Límites de previsibilidad en la movilidad humana por: Chaoming Song, Zehui Qu, Nicholas Blumm, Albert-László Barabási. Ciencia , vol. 327, No. 5968. (19 de febrero de 2010), págs. 1018-1021.

Comprensión de los patrones individuales de movilidad humana Por: Marta C. González, Cesar A. Hidalgo, Albert-Laszlo Barabasi. Naturaleza , vol. 453, No. 7196. (5 de junio de 2008), págs. 779-782.

Tenga en cuenta que los dos estudios utilizan los mismos datos, que son similares a los suyos, pero no en el nivel de precisión en el espacio o el tiempo. No creo que describa lo que quieres encontrar como una trayectoria, pero tampoco estoy seguro de cómo lo llamaría. ¿Por qué exactamente desea agrupar los nodos de inicio / final de sus "trayectorias"?

    
respondido por el Andy W 09.02.2011 - 06:04
2

PySAL: la biblioteca de análisis espacial de Python puede ser un buen comienzo - enlace

Particularmente la sección de autocorrelación:

  

Autocorrelación espacial pertenece a   el patrón de atributo no aleatorio   Valores sobre un conjunto de unidades espaciales.   Esto puede tomar dos formas generales:   autocorrelación positiva que   refleja la similitud de valores en el espacio,   y autocorrelación o valor negativo   disimilitud en el espacio. En cualquier caso   la autocorrelación surge cuando el   patrón espacial observado es diferente   de lo que se esperaría bajo una   Proceso aleatorio que opera en el espacio.

enlace

También puede considerar el uso de bibliotecas R enlace para Análisis de patrones de puntos .

Otros paquetes R:

  

Funciones para acceder y   Manipulación de datos espaciales para animales.   rastreo. Filtrar por velocidad y crear.   Tiempo dedicado a las parcelas de pista animal.   datos.

También puede simplificar el análisis si ajusta los puntos a las redes de transporte lineales existentes (carreteras / ferrocarril) disponibles en OSM. Entonces puede simbolizar en función de estas líneas y la cantidad de personas que las usan en momentos específicos del día.

    
respondido por el geographika 08.02.2011 - 17:32
2

Aunque no puedo comentar mucho sobre las trayectorias o los caminos de tu gente, creo que estás en el camino correcto con el enfoque de clúster y tiempo.

El año pasado armé una demostración para Esri UC mientras trabajaba con algunas personas en Snow Leopard Conservancy, disponible en: enlace

Se ve en los "sitios de alimentación" (grupos) de Snow Leopards según los criterios dados:

  • cómo se agruparon esos puntos (distancia entre sí)
  • un umbral mínimo de puntos (mi análisis requirió más de 4 puntos ya que se tomaron lecturas cada 12 horas)
  • los puntos deben ser secuenciales (parte fácil del análisis, ya que deben recopilarse en un orden lineal)

Si bien usa las herramientas de Esri para realizar el análisis de distancia, el script de Python que está dentro puede ayudarlo con la idea de agrupamiento una vez que sepa qué puntos están cerca uno del otro. (utiliza la teoría de gráficos: enlace )

Como se mencionó en las otras respuestas, hay documentos para determinar los atributos que necesitarías para tomar las decisiones.

El análisis se basó libremente en los conceptos de: Knopff, K.H., A. R. A. Knopff, M. B. Warren y M. S. Boyce. 2009. Evaluación de las técnicas de telemetría del Sistema de posicionamiento global para estimar los parámetros de depredación de pumas. Journal of Wildlife Management73: 586-597.

    
respondido por el KHibma 09.02.2011 - 22:53
2

Para ejecutar cualquier tipo de agrupación en su conjunto de trayectorias, debe tener una forma de calcular la similitud o la distancia de los pares de trayectorias. Hay varios métodos existentes para esto, y se están desarrollando otros nuevos para casos especiales o para solucionar un defecto de los tradicionales (personalmente estoy trabajando en uno nuevo para mi tesis doctoral). Los algoritmos conocidos son los siguientes:

  • Distancia del par más cercano: simplemente defina la distancia de 2 trayectorias por la distancia del par de puntos más cercano entre sí. Las trayectorias deben consistir en el mismo número de puntos.
  • Distancia de la suma de los pares: Calcule las distancias para cada par de puntos y súmelos. También funciona solo si las trayectorias son de la misma longitud
  • Distancia Dynamic Time Warping (DTW): este algoritmo fue desarrollado para manejar trayectorias de diferentes cantidades de puntos medidos. Funciona en pares de puntos y permite que un punto de una trayectoria se use varias veces en los cálculos de distancia de pares, si el otro se está moviendo "demasiado rápido". (Imagende Wikipedia )
  • Subsecuencia Común Más Larga: como su nombre lo indica, define la similitud de dos trayectorias por la longitud de la sub-trayectoria más larga donde las rutas originales viajan cerca unas de otras.
  • La Distancia de edición en secuencia real (EDR) y la Distancia de edición con penalización real (ERP) definen la similitud por el número de operaciones de edición (agregar, eliminar o reemplazar) que se necesitan para transformar una de las trayectorias en la otra.

Si te gusta este campo, recomiendo el libro "Computing with Spatial Trajectories" de varios reserachers de Microsoft Asia.

    
respondido por el sw0rdf1sh 20.11.2016 - 14:44
0

Esto también puede ser de ayuda para usted:

Orellana D, Wachowicz M. Explorando patrones de movimiento de suspensión en Movilidad peatonal. Geogr anal. 2011; 43 (3): 241-60. PubMed PMID: 22073410.

También echa un vistazo a este blog:

ideasonmovement.wordpress.com/

    
respondido por el David 11.02.2013 - 23:34

Lea otras preguntas en las etiquetas