
La disponibilidad e importancia del análisis de datos georreferenciados es más relevante que nunca. Por ejemplo, en epidemiología, los análisis espaciales son empleados para modelar riesgos y tasas asociados con enfermedades y su mortalidad, considerando información agregada a algún nivel geográfico, por ejemplo, por localidad. A través de análisis espaciales podemos identificar espacialmente ubicaciones en las que estas medidas son mayores o menores, estimar las medidas en ubicaciones en las que no hay información disponible, o identificar variables que están significativamente asociadas con las medidas, considerando para esto las relaciones de acuerdo con la posición geográfica y espacial que existen entre las observaciones.
El propósito de este curso es motivar a los estudiantes a utilizar análisis espaciales, permitiéndoles identificar algunos ejemplos de técnicas disponibles.
Primero presentamos ideas generales sobre la información espacial y su importancia. Después de eso, presentamos algunos análisis descriptivos espaciales y ejemplos de medidas utilizadas para identificar y medir la asociación espacial, así como la agrupación espacial tanto global como local. Luego, presentamos técnicas utilizadas para interpolar información espacial para unidades espaciales en las que la información no está disponible. Posteriormente, presentamos algunos modelos lineales que consideran la naturaleza espacial de la información permitiendo obtener inferencias correctas, estos son parte de los análisis usados en econometría espacial. Finalmente, hablamos de algunos modelos en los cuales la información se sigue tanto de forma espacial como temporal, esto es, cuando tenemos variables que para una misma unidad geográfica se siguen a través de varios años.
Al final de este curso serás capaz de:
- Entender la diferencia entre distintos tipos de datos georreferenciados y manejar archivos .shp. Hacer análisis descriptivos básicos (GeoDa) a través de mapas, e.g. mapas de los cuartiles asociados a una variable con distintos colores.
- Obtener distintos tipos de matriz de vecindad entre unidades espaciales de un territorio (R y GeoDa), tanto basadas en distancias como en la contigüidad.
- Calcular una medida de correlación para una sola variable o entre pares de variables en información georreferenciada usando matrices de pesos espaciales construidas a partir de las matrices de vecindad. Obtener mapas de calor que permitan determinar asociación significativa entre las mediciones de una región con las de regiones próximas (R y Python); e.g. conglomerados de regiones con alta pobreza rodeadas significativamente de regiones con alta pobreza.
- Obtener un diagrama de la correlación de una variable con ella misma de acuerdo con la distancia entre dos regiones (variograma). Estimar modelos para esa correlación, los cuales son utilizados en otros modelos.
- Interpolar los valores de una variable sobre una región diferente a aquellas en las que se tienen mediciones.
- Ajustar modelos lineales de distintos tipos que consideren la relación espacial, ya sea usando un variograma o matrices de pesos espaciales.
- Ajustar regresiones que consideren la posibilidad de efectos diferenciales de cada input sobre el output de acuerdo con la región (regresiones geográficamente ponderadas). Esto efectos pueden mapearse; e.g. en el norte del país la asociación de un índice de marginación con la tasa de defunción por una enfermedad es mayor que en el sur.
- Aplicar análisis descriptivos en datos que no solo involucran el aspecto espacial sino también temporal. Ajustar algunos modelos lineales para esta clase de datos; e.g. aspectos climáticos que se miden por localidad y se siguen por varios años, de los cuales se quiere ver cómo afectan la producción de maíz.
INFORMES: lumialearning@gmail.com