Número mínimo de muestras para la interpolación de kriging

17

Obtengo algunos datos con el número de muestras con una solicitud para interpolarlo usando el método kriging.
Después de algunas investigaciones, parece que los resultados de kriging (realizados en ArcGIS Geostatistical Analyst con parámetros predeterminados) no son satisfactorios. Los valores interpolados son muy diferentes de las mediciones (especialmente las más altas) y la superficie no parece confiable. Aquí está la foto:
Supongo que el problema principal es la cantidad insuficiente de muestras.

¿Cuántos puntos debemos usar para obtener resultados confiables?
¿O tal vez el método de kriging no sea apropiado para valores tan diversos?

    
pregunta Marcin 11.02.2013 - 15:06

2 respuestas

26

Cuando usa "valores predeterminados", en realidad no está haciendo kriging, simplemente está aplicando el algoritmo de kriging, que, como ha descubierto, es deficiente cuando se usa con estos datos.

(Voy a subir a una caja de jabón para una breve perorata: en mi opinión, la manera más rápida de obtener malos resultados con un programa de computadora es aceptar sus parámetros predeterminados. ArcGIS es uno de los entornos más ricos y poderosos para obtener malos resultados de esta manera. La moraleja es que no use el software para un trabajo importante hasta que entienda cómo controlarlo. Desde la caja de jabón ahora ...)

Para que kriging funcione, debe realizar un análisis estadístico preliminar intensivo de los datos conocidos como "variografía". El rendimiento de este último depende de los datos y de sus habilidades geoestadísticas. (Se han escrito libros completos sobre variografía, incluido el seminal Geoestadística de minería por Journel & amp ; Huijbregts y Variowin por Yvan Pannatier.) Aunque las personas han logrado un éxito tan bajo como siete puntos de datos (en una monografía de Robert Jernigan publicada por la EPA de los EE. UU. a fines de la década de 1980), y en principio puede realizar krige utilizando solo dos o tres puntos (tengo lo hice para demostrar el algoritmo ), las reglas básicas en la literatura van desde un mínimo de 20 puntos a 100 puntos y el consenso parece ser alrededor de 30 puntos.

En su caso, aunque no describe los datos, tiene algunos problemas claros, que incluyen una distribución muy sesgada y una clara falta de evidencia de estacionariedad. Estos requieren un tratamiento estadístico especial o formas especializadas de kriging (como un modelo lineal espacial generalizado). No obtendrá buenos resultados cuando grabe dichos datos hasta que tenga una gran cantidad de datos.

La leyenda sugiere que podría estar intentando crear una cuadrícula de densidad en lugar de interpolar datos en realidad: aunque los resultados de los dos procedimientos pueden parecer iguales, hacen cosas muy diferentes y tienen interpretaciones claramente diferentes. . Usted interpola cuando los datos se consideran muestras de alguna superficie continua hipotética. La interpolación predice los valores sin muestrear. Los ejemplos estándar incluyen mediciones de elevación (que muestrean la superficie de la tierra) y mediciones de temperatura (que muestrean un "campo de temperatura"). Calcula una densidad cuando tiene completa información sobre la cantidad de algo y desea representar una versión suavizada de esa cantidad por unidad de área. (En contraste con la interpolación, no existen valores sin muestrear para predecir). El ejemplo estándar es una densidad de población: los datos son recuentos de todos individuos dentro de un área; la salida es un mapa de densidad de población.

    
respondido por el whuber 11.02.2013 - 18:33
1

Hay dos preguntas separadas: primero, la cantidad de ubicaciones de datos que se deben usar para estimar / modelar el variograma y, en segundo lugar, la cantidad de ubicaciones de datos que se deben usar en las ecuaciones de kriging para interpolar el valor en una ubicación sin datos (o para estimar el valor promedio sobre una región). Suponiendo que está utilizando un vecindario de búsqueda en movimiento, es probable que más de 15-20 ubicaciones de datos en el vecindario degraden los resultados porque (1) solo las ubicaciones de datos más cercanas en el vecindario de búsqueda tendrán ponderaciones distintas de cero, (2) con más datos El tamaño de la matriz a invertir es mayor y la posibilidad de un aumento de la matriz mal condicionada. El número total de ubicaciones de datos necesarias para kriging depende de la cantidad de ubicaciones a interpolar y los patrones espaciales de esos puntos y también de las ubicaciones de datos. En resumen, no hay una respuesta simple a tu pregunta.

Con respecto a la estimación / modelado del variograma, es un problema muy diferente, vea por ejemplo

1991, Myers, D.E., En Estimación de Variogramas en Procedimientos del Primer Inter. Conf. Stat. Comp., Cesme, Turquía,

30 de marzo a 2 de abril de 1987, Vol. II, American Sciences Press, 261-281

1987, A. Warrick y D.E. Myers, Optimización de ubicaciones de muestreo para cálculos de variogramas Investigación de recursos hídricos 23, 496-500

Se pueden descargar en www.u.arizona.edu/~donaldm

    
respondido por el Donald Myers 25.12.2015 - 19:18

Lea otras preguntas en las etiquetas