Inducción de una alta correlación espacial con gráficos de vecindad ponderados aleatoriamente por aristas Grant

abstract

  • Los modelos tradicionales para datos de área asumen una estructura jerárquica donde uno de los componentes son los efectos aleatorios que correlacionan espacialmente las áreas. El modelo condicional autorregresivo (CAR) es la distribución más popular para modelar conjuntamente la incertidumbre previa sobre estos efectos aleatorios espaciales. Una limitación de la distribución CAR es la incapacidad de producir altas correlaciones entre áreas vecinas. Proponemos un modelo robusto para datos de área que alivia este problema. Representamos el mapa mediante un gráfico no dirigido donde los nodos son las áreas y los bordes ponderados aleatoriamente conectan los nodos que son vecinos. El modelo se basa en una distribución t de Student multivariada, estructurada espacialmente, en la que la matriz de precisión se construye indirectamente asumiendo una distribución multivariada para las aristas aleatorias. La distribución conjunta de los pesos es una t de Student multivariante espacial que induce otra distribución t para los efectos espaciales de las áreas que heredan su capacidad para acomodar valores atípicos y comportamiento de cola pesada. Lo que es más importante, puede producir una correlación marginal más alta entre los efectos espaciales que el modelo CAR, superando una de las principales limitaciones de este modelo. Ajustamos el modelo propuesto para analizar mapas de cáncer reales y comparamos su rendimiento con varios competidores de última generación. Nuestro modelo propuesto proporciona un mejor ajuste en casi todos los casos.
  • Traditional models for area data assume a hierarchical structure where one of the components is the random effects that spatially correlate the areas. The conditional autoregressive model (CAR) is the most popular distribution for jointly modeling prior uncertainty over these spatial random effects. A limitation of the CAR distribution is the inability to produce high correlations between neighboring areas. We propose a robust model for area data that alleviates this problem. We represent the map by an undirected graph where the nodes are the areas and randomly weighted edges connect nodes that are neighbors. The model is based on a spatially structured multivariate Student's t-distribution, where the accuracy matrix is constructed indirectly by assuming a multivariate distribution for the random edges. The joint distribution of the weights is a spatial multivariate multivariate Student's t that induces another t distribution for the spatial effects of the areas that inherit their ability to accommodate outliers and heavy-tailed behavior. More importantly, it can produce a higher marginal correlation between spatial effects than the CAR model, overcoming one of the main limitations of this model. We fit the proposed model to analyze real cancer maps and compare its performance with several state-of-the-art competitors. Our proposed model provides a better fit in almost all cases.

date/time interval

  • 2022-07-01 - 2022-12-20

keywords

  • Autoregressive Model
  • Cancer
  • Conditional Model
  • Graph in graph theory
  • Hierarchical Structure
  • Joint Distribution
  • Model
  • Modeling
  • Multivariate Distribution
  • Outlier
  • Performance
  • Random Effects
  • Spatial Correlation
  • Uncertainty
  • Undirected Graph
  • Vertex of a graph
  • t-distribution