Table Of Content

INSTITUTO TECNOLOGICO AUTONOMO DE MEXICO FUNDAMENTOS DE DEEP LEARNING Y UNA APLICACION PARA PREDECIR LA DEMANDA DE ENERGIA ELECTRICA EN MEXICO T E S I S QUE PARA OBTENER EL TITULO DE LICENCIADO EN MATEMATICAS APLICADAS PRESENTA MARIA FERNANDA MORA ALBA ASESOR: Dr. CARLOS FERNANDO ESPONDA DARLINGTON CIUDAD DE MEXICO 2016 Autorización Con fundamento en el art´ıculo 21 y 27 de la Ley Federal del Derecho de Autor y como titular de los derechos moral y patrimonial de la obra titulada “FUNDAMENTOS DE DEEP LEARNING Y UNA APLICACION PARA PREDECIR LA DEMANDA DE ENERGIA ELECTRICA EN MEXICO”, otorgo de manera gratuita y permanente al Instituto Tecnológico Autónomo de México y a la Biblioteca Rau´l Bailléres Jr. autorización para que fijen la obra en cualquier medio, incluido el electrónico, y la divulguen entre sus usuarios, profesores, estudiantes o terceras perso- nas, sin que pueda percibir por la divulgación una contraprestación. MARIA FERNANDA MORA ALBA FECHA FIRMA ii Dedicada a Mi papá, José Mora, por creer en m´ı y siempre impulsarme a seguir estudiando. Agradecimientos Nanos gigantum humeris insidentes. Bernard of Chartres Este trabajo es simbólico, pues representa el anhelado cierre de una etapa muy larga pero importante en mi formación académica e intelectual. Gracias a mis papás por su empuje y aliento para empezar y terminar este trabajo. Gracias a mi mamá por fungir de corrector de estilo un d´ıa antes de la impresión del trabajo. A Luis Manuel Román por acompanãrme en este viaje de desvelos, risas, cansancios, alegr´ıas, tropezones y logros desde 2014. A Margarita Garc´ıa por tratarme como si fuera de su familia y por siempre echarme porras. Gracias especiales a Fernando Esponda por ser mi asesor, pero sobretodo por confiar, creer en m´ı y ayudarme a desarrollar mi potencial. AmissinodalesFernandoEsponda-nuevamente-,SalvadorMármolyAdolfodeUnánue por tener tan excelente disposición de revisar mi trabajo -aunque se los haya dado con poca anticipación- y por sus valiosas aportaciones. YalosprofesoresMarcelaGonzálezyErnestoBarrios,puescadaunomeensen˜ócosas distintas. Gracias a Lolais por ser un apoyo cuando más necesitaba. A la gente que me tendió una mano cuando estaba abajo. Y gracias a los que no están aqu´ı, pero que si duda me ayudaron de una u otra forma a empezar o terminar este viaje largo, muy largo, que se llamó: “ITAM”. iv Fundamentos de Deep Learning y una aplicacioń para predecir la demanda de energ´ıa eléctrica en México Mar´ıa Fernanda Mora Alba Para obtener los grados de Lic. en Matemáticas Aplicadas y Lic. en Actuar´ıa Diciembre 2016 Resumen DeepLearning esuntérminoquesehavueltomuypopularenlosu´ltimosanõs.Empre- sascomoGoogle,AppleyFacebooklomencionancontinuamenteenentrevistasynotas de prensa. A pesar de esta popularidad, apenas se publicó un libro técnico sobre Deep Learning (hace unas semanas), lo cual es reflejo de lo nueva y fértil que es esta área de estudio. En este contexto, el primer gran objetivo de esta tesis es dar una exposición de Deep Learning: qué es, cómo se diferenc´ıa con las técnicas usuales de Aprendizaje Máquina, sobre qué supuestos descansa, para qué sirve, en qué áreas y tareas ha sido exitoso. Además, se encontró que Deep Learning sólo ha tenido impacto en industrias que usan tecnolog´ıa de punta, y en espec´ıfico, auń no ha sido muy explorado para mo- delar series de tiempo. Por otro lado, el problema de la demanda de energ´ıa eléctrica en México es relevante, pues dado que la energ´ıa no puede ser almacenada, ésta se produce “al momento”, lo cual genera pérdidas si hay un exceso de oferta y escasez ante un exceso de demanda. Entonces, como segundo gran objetivo se desarrolla un modelo de Deep Learning usando una de sus arquitecturas más populares y exitosas (longshorttermmemorynetwork)conelfindepredecirlademandadeenerg´ıaeléctri- ca en México y en un esfuerzo para incentivar el enfoque cuantitativo para la toma de decisiones.SeconcluyequeDeep Learning esunparadigmadeaprendizajeprometedor con potencial de impactar de manera significativa tanto a la industria nacional como al gobierno mexicano. ´ Indice general Autorización II Agradecimientos IV Resumen V Índice de figuras VIII 1. Introducción 1 1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. Contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.4. Objetivos y alcance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2. Marco teórico 20 2.1. Fundamentos de Aprendizaje Máquina . . . . . . . . . . . . . . . . . . . 20 2.1.1. Modelo formal básico del aprendizaje . . . . . . . . . . . . . . . 24 2.1.2. PAC Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1.3. Teorema Fundamental del Aprendizaje . . . . . . . . . . . . . . . 29 2.1.4. Complejidad Computacional de Algoritmos de Aprendizaje . . . 30 2.2. Fundamentos de Deep Learning . . . . . . . . . . . . . . . . . . . . . . . 32 2.2.1. Maldición de la Dimensionalidad . . . . . . . . . . . . . . . . . . 33 2.2.2. Constancia local y regularización . . . . . . . . . . . . . . . . . . 34 2.2.3. Arquitecturas profundas . . . . . . . . . . . . . . . . . . . . . . . 35 2.2.4. Entrenamiento de redes profundas . . . . . . . . . . . . . . . . . 37 2.3. Aplicaciones usuales de Deep Learning . . . . . . . . . . . . . . . . . . . 41 2.4. Deep Learning para series de tiempo . . . . . . . . . . . . . . . . . . . . 47 2.4.1. Trabajo relacionado . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.4.2. Series de Tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.4.3. Construcción de una DRNN . . . . . . . . . . . . . . . . . . . . . 51 vi Índice general vii 2.4.4. Long Short Term Memory Networks . . . . . . . . . . . . . . . . 63 2.4.5. Combinación de modelos: Deep LSTM . . . . . . . . . . . . . . . 77 3. Aplicación 79 3.1. La energ´ıa eléctrica en México. . . . . . . . . . . . . . . . . . . . . . . . 80 3.2. Descripción de la base . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.3. Hardware y software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.3.1. Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.3.2. Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.4. Preprocesamiento y análisis exploratorio . . . . . . . . . . . . . . . . . . 84 3.5. Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3.5.1. Sin modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.5.2. Modelo tradicional . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.5.3. Modelo de Deep Learning . . . . . . . . . . . . . . . . . . . . . . 92 4. Resultados 96 4.1. Modelo tradicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 4.1.1. Regresión lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 4.1.2. Red neuronal superficial . . . . . . . . . . . . . . . . . . . . . . . 99 4.2. Modelo de Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.2.1. Caso base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.2.2. Dropout(p) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 4.2.3. Lag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 4.2.4. Nu´mero de bloques por capa . . . . . . . . . . . . . . . . . . . . 107 4.2.5. Stateful . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4.2.6. Tamanõ del batch . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4.2.7. Nu´mero de épocas . . . . . . . . . . . . . . . . . . . . . . . . . . 109 4.2.8. Función de activación . . . . . . . . . . . . . . . . . . . . . . . . 109 4.2.9. Nu´mero de capas . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 5. Conclusiones y trabajo futuro 112 Bibliograf´ıa 116 A. Resultados adicionales 123 A.1. Código en Keras para entrenar la LSTM . . . . . . . . . . . . . . . . . . 123 ´ Indice de figuras 1.1. ¿Qué es esto? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2. Antecedentes históricos de Deep Learning . . . . . . . . . . . . . . . . . 4 1.3. Autocodificador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.4. Relación de Deep Learning con Aprendizaje Máquina y aprendizaje de atributos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5. Ejemplo de cómo funciona un algoritmo de Deep Learning para reconocer una persona (tomado de [3]). . . . . . . . . . . . . . . . . . . . . . . 12 1.6. Nivel de aprendizaje en diferentes tipos de sistemas (reconstrucción de la Figura de [3]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.1. Proceso de Aprendizaje Máquina . . . . . . . . . . . . . . . . . . . . . . 22 2.2. Maldición de la dimensionalidad (tomada de [3]) . . . . . . . . . . . . . 33 2.3. Dos gráficas computacionales con diferente profundidad (tomada de [3]) 35 2.4. Conceptos simples refinan su significado (tomada de [3]) . . . . . . . . . 36 2.5. Superficie de error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.6. Presencia de óptimos locales (elaboración propia) . . . . . . . . . . . . . 38 2.7. Reconocimiento de imágenes recortadas (tomada de [52]). . . . . . . . . 42 2.8. Resultados del modelo de Krizhevsky et al. de 2006 . . . . . . . . . . . . 43 2.9. Screenshots de cinco videojuegos de Atari 2600: Pong, Breakout, Space Invaders, Seaquest, Beam Rider. . . . . . . . . . . . . . . . . . . . . . . 44 2.10.Ciclo de vida usual de una droga y el uso de Deep Learning en R&D.. . 45 2.11.Flujo hacia adelante de una red usual. . . . . . . . . . . . . . . . . . . . 52 2.12.Flujo hacia adelante de una red con ciclo. . . . . . . . . . . . . . . . . . 52 2.13.Red neuronal recurrente vista como una red usual. . . . . . . . . . . . . 53 2.14.Arquitecturas de RNN usadas en varias aplicaciones. . . . . . . . . . . . 54 2.15.Red neuronal recurrente vista como una red profunda tomada de [47]. . 56 2.16.RNN agregando profundidad entre input y capa oculta . . . . . . . . . . 57 2.17.RNN agregando profundidad entre capa oculta y output . . . . . . . . . 59 2.18.RNN agregándole transición profunda . . . . . . . . . . . . . . . . . . . 60 viii ÍNDICE DE FIGURAS ix 2.19.RNN agregándole transición profunda y atajos para el gradiente . . . . 61 2.20.RNN agregándole transición y output profundos . . . . . . . . . . . . . 61 2.21.RNN apilada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 2.22.Modificación de una RNN para hacer una LSTM . . . . . . . . . . . . . 65 2.23.Superficie de error para una red neuronal recurrente simple (tomada de [48]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 2.24.Celda de memoria c y sus puertas in , out , tomado de [33]. . . . . . . 69 j j j 2.25.Bloque de memoria con una sola celda de una LSTM tomado de [22] . . 74 2.26.Bloque de memoria desagregado . . . . . . . . . . . . . . . . . . . . . . 75 2.27.Vista de Arquitectura parcial horizontal . . . . . . . . . . . . . . . . . . 75 2.28.Una LSTM network tomada de [22]. . . . . . . . . . . . . . . . . . . . . 76 2.29.RNN apilada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 2.30.LSTM apilada con 3 bloques por nivel . . . . . . . . . . . . . . . . . . . 78 3.1. Ejemplo de Archivo de consumo y demanda descargado de [9] . . . . . . 81 3.2. Nu´mero total de registros en el archivo consolidado . . . . . . . . . . . . 83 3.3. Oferta y demanda diaria total 2006-2015 . . . . . . . . . . . . . . . . . . 85 3.4. Serie de tiempo del consumo de energ´ıa eléctrica (sin transformar) . . . 86 3.5. Histograma del consumo de energ´ıa eléctrica 2006-2015. . . . . . . . . . 87 3.6. Serie de tiempo de consumo de energ´ıa eléctrica (estacionario). . . . . . 88 3.7. Serie estacionaria de consumo de energ´ıa eléctrica 2006-2015 . . . . . . . 90 3.8. Serie de tiempo de consumo de energ´ıa eléctrica (estacionaria y escalada) 92 4.1. Forma del modelo de regresión lineal mu´ltiple en Weka . . . . . . . . . . 97 4.2. Regresores significativos del modelo de regresión lineal mu´ltiple en Weka 98 4.3. Resultados del modelo de Weka . . . . . . . . . . . . . . . . . . . . . . . 98 4.4. Parámetros de la red neuronal (interfaz de Weka) . . . . . . . . . . . . . 99 4.5. Resultados de la red neuronal superficial en Weka. . . . . . . . . . . . . 100 4.6. Una LSTM network tomada de [22]. . . . . . . . . . . . . . . . . . . . . 101 4.7. Trayectorias de direcciones de descenso . . . . . . . . . . . . . . . . . . . 102 4.8. LSTM apilada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.9. E´pocas en caso base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4.10.Estructura de la red y parámetros en caso base . . . . . . . . . . . . . . 105 4.11.Resultados caso base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 4.12.Efecto del tamanõ del dataset en el error (tomada de [58]) . . . . . . . . 106 4.13.E´pocas de la LSTM en Keras . . . . . . . . . . . . . . . . . . . . . . . . 109 4.14.Resultados de la LSTM en Keras . . . . . . . . . . . . . . . . . . . . . . 110 Cap´ıtulo 1 Introduccioń What has been will be again, what has been done will be done again; there is nothing new under the sun. Ecclesiastes 1:9 1.1. Motivacioń Hoy en d´ıa las computadoras son muy eficientes resolviendo problemas que son dif´ıci- les para nosotros los humanos pero que pueden ser descritos por una lista de reglas algor´ıtmicas y/o formales: ordenar arreglos enormes de nu´meros, multiplicar matrices de gran tamanõ e incluso ganar una partida de ajedrez. Tan sólo basta recordar cómo la computadora Deep Blue derrotó al campeón mundial Garry Kasparov en 1997. Por otro lado, auń no son tan eficientes para resolver tareas que son intuitivas, sencillas e incluso automáticas para nosotros los humanos: caminar, reconocer d´ıgitos, figuras y voces [3]. Tan sólo consideremos la siguiente Figura 1.1 tomada de [62]. 1

Description:

Modificación de una RNN para hacer una LSTM . 65. 2.23. Superficie de error para una red neuronal recurrente simple (tomada de.

fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... PDF

137 Pages·2017·6.57 MB·Spanish

Checking for file health...

Save to my drive

Quick download

Download

Download fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... PDF Free - Full Version

by Unknow| 2017| 137 pages| 6.57| Spanish

Download fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... by in PDF format completely FREE. No registration required, no payment needed. Get instant access to this valuable resource on PDFdrive.to!

Free Download PDF

About fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ...

Modificación de una RNN para hacer una LSTM . 65. 2.23. Superficie de error para una red neuronal recurrente simple (tomada de.

Detailed Information

Author:	Unknown
Publication Year:	2017
Pages:	137
Language:	Spanish
File Size:	6.57
Format:	PDF
Price:	FREE

Download Free PDF

Safe & Secure Download - No registration required

Why Choose PDFdrive for Your Free fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... Download?

100% Free: No hidden fees or subscriptions required for one book every day.
No Registration: Immediate access is available without creating accounts for one book every day.
Safe and Secure: Clean downloads without malware or viruses
Multiple Formats: PDF, MOBI, Mpub,... optimized for all devices
Educational Resource: Supporting knowledge sharing and learning

Frequently Asked Questions

Is it really free to download fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... PDF?

Yes, on https://PDFdrive.to you can download fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... by completely free. We don't require any payment, subscription, or registration to access this PDF file. For 3 books every day.

How can I read fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... on my mobile device?

After downloading fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... PDF, you can open it with any PDF reader app on your phone or tablet. We recommend using Adobe Acrobat Reader, Apple Books, or Google Play Books for the best reading experience.

Is this the full version of fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ...?

Yes, this is the complete PDF version of fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... by Unknow. You will be able to read the entire content as in the printed version without missing any pages.

Is it legal to download fundamentos de deep learning y una aplicacion para predecir la demanda de energia electrica en ... PDF for free?

https://PDFdrive.to provides links to free educational resources available online. We do not store any files on our servers. Please be aware of copyright laws in your country before downloading.

The materials shared are intended for research, educational, and personal use in accordance with fair use principles.