UNIVERSIDAD PONTIFICIA COMILLAS ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA (ICAI) INGENIERÍA INDUSTRIAL PROYECTO FIN DE CARRERA Aplicación de técnicas de análisis multivariante a la generación de escenarios para el análisis de riesgos ELVIRA PINEDO ZORRILLA MADRID, junio de 2006 Autorizada la entrega del proyecto al alumno: Elvira Pinedo Zorrilla EL DIRECTOR DEL PROYECTO Antonio Muñoz San Roque Fdo: Fecha: Vº Bº del Coordinador de Proyectos Claudia Meseguer Velasco Fdo: Fecha: Resumen El presente trabajo tiene como doble objeto (1) analizar los riesgos a los que está sometida la actividad de una compañía eléctrica mediante distintas técnicas de análisis multivariante y (2) generar posibles escenarios de las variables sujetas a incertidumbre que afectan al riesgo de esa actividad, y como consecuencia obtener una mejor predicción de los entornos de incertidumbre que afectan a los resultados de las empresas. En primer lugar, se analiza la metodología habitual de generación de escenarios con sorteo independiente de los componentes obtenidos mediante la aplicación del Análisis de Componentes Principales (ACP). Asimismo, en el estudio se presenta el Análisis de Componentes Independientes (ACI) como una técnica alternativa a la anterior para obtener componentes independientes con los que poder generar escenarios por separado. Posteriormente se muestra una nueva manera de calcular el valor en riesgo que optimiza ciertos aspectos de la metodología actual. Para ello se realiza una comparación de las diferentes técnicas consideradas y una valoración de ellas para concluir cuál es la más apropiada para el estudio de riesgos. El ACP es una técnica estadística lineal de simplificación y reducción de la dimensionalidad de un conjunto de datos que posee una doble utilidad: representa de manera óptima observaciones en un espacio de dimensión reducida y permite transformar las variables originales en nuevas variables incorreladas. Por otro lado, el ACI es una técnica que trata de separar un número determinado de señales estadísticamente independientes a partir de un número idéntico de señales de entrada. En el presente trabajo se compara la aplicación de ambas técnicas mediante un ejemplo sencillo en el que se demuestra, utilizando cuatro modos distintos de comparación, que el ACI recupera realmente unos componentes más independientes que el ACP. Las cuatro formas de comparación que se proponen son: (1) la comprobación de que los componentes mantienen las correlaciones existentes en los datos originales, (2) el parecido de la matriz de transformación con la original, (3) la independencia de los componentes y, (4) por último el análisis gráfico de las relaciones entre los datos originales y resultantes. Partiendo de los resultados obtenidos en el estudio de este ejemplo, se propone una metodología que mejora la actual utilizando ambas técnicas de manera complementaria. De esta forma, en la exposición que se viene haciendo se exponen las etapas que componen esta sistemática: (1) transformación de los factores de riesgo para uniformizarlos y poderlos tratar de manera conjunta, (2) aplicación del ACP para reducir la dimensión de los datos y prepararlos a su vez para el ACI, (3) aplicación del ACI para obtener unos componentes independientes y (4) generación de escenarios sorteando los componentes de manera independiente. Una vez comparados ambos métodos y presentada la nueva metodología, ésta se aplica a los factores de riesgo de una empresa eléctrica para estudiar su efecto en los nuevos escenarios. Tras estudiar los resultados, se concluye que la hipótesis de partida de los estudios actuales de que las distribuciones de los factores de riesgo son gausianas no es cierta y afecta de manera relevante a los resultados que se obtienen en la generación de escenarios. Además se demuestra que las nuevas series generadas de las distribuciones parecidas a la normal, mediante ambos métodos, reproducen las series observadas muy fielmente. Por último, se concluye que cuando las distribuciones conjuntas no son gausianas no se reproducen de igual manera mediante ambos métodos las relaciones entre las variables, siendo el ACP incapaz de reproducir en los escenarios las relaciones existentes entre los datos originales mientras que el ACI lo hace de manera muy apropiada. Esto y la presencia de este tipo de serie en los factores de riesgo implica que la generación de escenarios se debe realizar utilizando el ACI con la metodología propuesta. Con estas conclusiones se afirma que no es posible generar escenarios según la distribución original de las variables utilizando como única fuente de información la matriz de correlación, que es en lo que se basa el ACP, sino que hay que tener en cuenta otros factores y consecuentemente se debe utilizar el ACI para obtener mejores resultados. Summary This paper aims (1) to analyse the risks inherent to the activity of an electrical company exposed by using various multivariate analysis techniques and (2) to generate possible scenarios produced by variables subject to uncertainty that may influence risk of said activity and thus obtain a better prediction of uncertainty environments that affect company results. First we analyse the common methodology for generating scenarios by selecting independent components at random obtained by means of Principal Component Analysis (PCA). The paper also uses Independent Component Analysis (ICA) as an alternative technique to obtain statistically independent components in order to generate separate scenarios. The paper further describes a new way to calculate the value at risk optimizing certain aspects used in current methodology. This method is derived evaluating and comparing different techniques and reaching conclusions as to which is the most appropriate methodology for evaluating risk. PCA is a linear simplification statistical technique used to reduce the dimensionality of a dataset which serves a dual purpose: to optimally represent observations in a reduced dimension of space and to transform original variables into new uncorrelated variables. On the other hand, ICA is a technique for separating statistically independent signals from an equal number of input signals. This paper compares the application of both techniques by means of a simple example. The example uses four different means of comparison, and reveals that ICA generates distributed scenarios which are more similar to the original distribution as opposed to those obtained with PCA. The four comparison methods used are based on: (1) checking that the components maintain the same correlations as in the original data, (2) the similarity between the transformation matrix and the original matrix, (3) the independence of the components, and lastly, (4) the graphical analysis of relationships between the original and resulting data. From the results obtained studying this example, we propose a methodology that improves current methodology using both techniques in a complementary manner. This methodology comprises the following systematic stages: (1) transformation of risk factors in order to make them uniform so they can be treated as a set, (2) application of PCA to reduce data dimension and prepare them for ICA, (3) application of ICA to obtain independent components and, (4) generation of scenarios sorting components in an independent fashion. Once both methods have been compared and the methodology is presented, it is then applied to risk factors in an electrical company to study its effect in new scenarios. Having analysed the results, it can be concluded that the starting hypothesis from current studies suggesting that risk factor distributions are Gaussian is not correct; which has a relevant effect on the results obtained from generating scenarios. It can also be shown that the new series generated from similar to normal distributions, by means of both methods, reproduce observed series very accurately. Finally, it is concluded that when joint distributions are not Gaussian, relationships between variables are not reproduced equally by both methods; revealing that PCA is unable to reproduce in scenarios the existing relations shown by original data, whereas ICA does so very appropriately. This fact, and the presence of this type of series in risk factors implies that scenarios must be generated using ICA in conjunction with the proposed methodology. The above conclusions demonstrate that it is not possible to generate scenarios according to the original variable distribution relying on the correlation matrix as the sole source of information, as is the case for PCA, and that consequently one has to take other factors into account and use ICA to obtain better results. Índice vi Índice ÍNDICE.....................................................................................................................................................VI ÍNDICE DE FIGURAS..........................................................................................................................IX ÍNDICE DE TABLAS...............................................................................................................................1 1 INTRODUCCIÓN..............................................................................................................................4 1.1 Motivación del proyecto....................................................................................4 1.2 Incertidumbre y riesgo. Clases de riesgos......................................................4 1.3 Metodologías del análisis de riesgos...............................................................6 1.3.1 Valor en Riesgo 8 1.3.2 Metodología VeR 9 1.3.3 Generación de escenarios mediante el Análisis de Componentes Principales 11 2 ANÁLISIS DE COMPONENTES PRINCIPALES Y ANÁLISIS DE COMPONENTES INDEPENDIENTES.........................................................................................................................14 2.1 Independencia...................................................................................................14 2.1.1 Propiedades de las variables independientes 15 2.2 Análisis de Componentes Principales...........................................................16 2.2.1 Planteamiento del problema 16 2.2.2 Aplicación del ACP 19 2.3 Análisis de Componentes Independientes...................................................19 2.3.1 Aplicación del ACI 20 2.3.2 Coktail-party problem 20 2.3.3 ACI 21 2.3.4 Medidas de “distancia” a la distribución normal 22 2.3.5 Ambigüedades 24 2.3.6 Preprocesado de los datos 25 2.3.7 Algoritmo FastICA 25 3 METODOLOGÍA DE GENERACIÓN DE ESCENARIOS CON EL ACI..............................28 3.1 Transformación de los factores de riesgo.....................................................29 3.1.1 Limpieza de datos 29 3.1.2 Relleno de los datos 29 3.1.3 Desestacionalización 30 3.1.4 Medias móviles 30 3.1.5 Rendimiento 30 3.1.6 Estandarización 31 Índice vii 3.2 Análisis de Componentes Principales...........................................................31 3.3 Análisis de Componentes Independientes...................................................32 3.4 Sorteo de los Componentes Independientes................................................32 3.4.1 Estimación de la función de densidad probabilística de los componentes 33 3.4.2 Sorteo 33 3.5 Matriz de Escenarios........................................................................................34 3.6 Percentiles..........................................................................................................34 3.7 Ejemplo para la comparación de los dos análisis........................................34 3.7.1 Comparación de los métodos 36 3.7.2 Conclusiones 41 4 RESULTADOS..................................................................................................................................43 4.1 Generación de escenarios con sorteo independiente de los tipos de cambio................................................................................................................43 4.1.1 Análisis preliminar de los tipos de cambio 44 4.1.2 Transformación de los tipos de cambio 45 4.1.3 Análisis de Componentes Principales de los tipos de cambio 45 4.1.4 Análisis de Componentes Independientes 49 4.1.5 Generación de escenarios 51 4.1.6 Matriz de los escenarios 53 4.1.7 Percentiles 54 4.2 Comparación de los dos análisis en la generación de escenarios de los tipos de cambio.................................................................................................65 4.2.1 Matriz de correlaciones 66 4.2.2 Independencia 67 4.2.3 Análisis gráfico 67 4.3 Generación de escenarios con sorteo independiente de lo tipos de interés.................................................................................................................70 4.3.1 Análisis preliminar de los tipos de interés 72 4.3.2 Transformación de los tipos de interés 72 4.3.3 Análisis de Componentes Principales de los tipos de interés 73 4.3.4 Análisis de Componentes Independientes 76 4.3.5 Generación de escenarios 78 4.3.6 Matriz de los escenarios 80 4.3.7 Percentiles 80 4.4 Comparación de los dos análisis en la generación de escenarios de los tipos de interés..................................................................................................91 Índice viii 4.4.1 Matriz de correlaciones 91 4.4.2 Independencia 92 4.4.3 Análisis gráfico 92 4.5 Aplicación de la metodología al conjunto de factores de riesgo...............97 4.5.1 Transformación de los datos 97 4.5.2 Análisis de Componentes Principales 98 4.5.3 Análisis adicional del conjunto de factores de riesgo 98 5 CONCLUSIONES...........................................................................................................................103 5.1 Conclusiones sobre los resultados...............................................................103 5.2 Conclusiones sobre la metodología.............................................................104 BIBLIOGRAFÍA...................................................................................................................................107 A PROGRAMACIÓN DE LA METODOLOGÍA EN MATLAB................................................111 A.1 Análisis de componentes Principales..........................................................111 A.1.1 Elección del número de componentes principales 111 A.1.2 Representación del peso de los componentes en los datos originales 111 A.2 Análisis de componentes Independientes..................................................112 A.3 Comparación de los métodos con un ejemplo...........................................112 A.3.1 Calculo de la independencia de los componentes 113 A.4 Generación de escenarios mediante ACP y ACI........................................113 A.4.1 Escenarios 114 A.4.2 Aproximación de las funciones de densidades 115 A.4.3 Percentiles 115
Description: