Análisis de componentes principales en teledetección. Consideraciones estadísticas para optimizar su interpretación

S. B. Ferrero, M. G. Palacio y O. R. Campanella

RESUMEN

En este trabajo se ha aplicado el Análisis de Componentes Principales (A.C.P.) a una subimagen LANDSAT 5 TM que comprende a la ciudad de Río Cuarto, provincia de Córdoba, Argentina. Se analizan en detalle consideraciones tales como: ponderación o «peso» de cada banda y número de componentes a ser usados. Se presenta el desarrollo del A.C.P. basado en la matriz de varianza-covarianza y en la de correlación –y sus correspondientes autovalores y autovectores –y consideraciones para decidir cual de ellas usar. También se muestran criterios para seleccionar el número de componentes principales a ser usados. Si el objetivo es ponderar de la misma manera a todas las bandas intervinientes, debe usarse la matriz de correlación, en cambio, si se desea dar mayor relevancia a aquellas bandas que tienen mayor varianza, debe usarse la matriz de varianza-covarianza. Se presentan tres criterios estadísticos para decidir el número de componentes principales a ser usados: (a) En la curva que muestra los porcentajes de variación total explicada por cada componente, considerar aquellos anteriores al punto de inflexión (con lo cual se deberían usar los tres primeros componentes en el problema de aplicación); (b) Considerar los componentes cuyos autovalores son mayores que el autovalor promedio (con lo cual se deberían usar los dos primeros componentes en el problema); (c) Usar los componentes cuyos coeficientes de correlación con las bandas son grandes en valor absoluto (con lo cual se deberían usar los dos primeros componentes en el problema).

PALABRAS CLAVE: teledetección, Análisis de Componentes Principales (ACP).

ABSTRACT

A Principal Components Analysis (PCA) to a LANDSAT 5 TM that includes the city of Río Cuarto, province of Cordoba, Argentina, has been performed. Considerations are analyzed in detail such as: «weight» of each band and number of components to be used. It is presented the development of the PCA based on the covariance and correlation matrices – and their eingenvalues and eigenvectors – and considerations in order to decide which one is the most adequated. It is also suggested criteria to select the number of main components to be used. If the goal is to assign the same weight to all the intervening bands, the correlation matrix must be used, whereas if it is desired to give greater relevance to those bands that have greater variance, the covariance matrix must be used. Three statistical criteria have been shown in order to decide the number of main components to be used: (a) In the curve that shows the percentage of total variation explained by each component, it is necessary to consider the components previous to the saddle point (in this case the three first components should be use); (b) To consider the components whose eigenvalues are greater than the average (and then the two first components should be used); (c) To use those components whose correlation coefficients are high in absolute value (and then the two first components should be used, again).

KEY WORDS: remote sensing, Principal Component Analysis (PCA).

PULSE AQUI PARA DESCARGAR EL ARTÍCULO COMPLETO.