Table Of ContentView metadata, citation and similar papers at core.ac.uk brought to you by CORE
provided by Universidad Carlos III de Madrid e-Archivo
U C III M
NIVERSIDAD ARLOS DE ADRID
Escuela Polite´cnica Superior
A A ´
PRENDIZAJE UTOMATICO EN
C C
ONJUNTOS DE LASIFICADORES
H ´ M
ETEROGENEOS Y ODELADO
A
DE GENTES
T D
ESIS OCTORAL
Agapito Ismael Ledezma Espino
Legane´s, 2004
Departamento de Informa´tica
Escuela Polite´cnica Superior
Universidad Carlos III de Madrid
A A ´
PRENDIZAJE UTOMATICO EN
C C
ONJUNTOS DE LASIFICADORES
H ´ M
ETEROGENEOS Y ODELADO
A
DE GENTES
AUTOR: Agapito Ismael Ledezma Espino
DIRECTORES: Ricardo Aler Mur
Araceli Sanchis de Miguel
TribunalnombradoporelMgfco.yExcmo.Sr.RectordelaUniversidadCar-
losIIIdeMadrid,eld´ıa.........de............................de2004.
Presidente:D.................................................................
Vocal:D.................................................................
Vocal:D.................................................................
Vocal:D.................................................................
Secretario:D.................................................................
Realizado el acto de defensa y lectura de la Tesis el d´ıa ......... de
.........................de2004en..............................
Calificacio´n:.................................
ELPRESIDENTE LOSVOCALES
ELSECRETARIO
Amiesposa,Yolanda
Amit´ıo,V´ıctor
Agradecimientos
Odisea,esaeslapalabraconlacualpodr´ıadescribirloquehasidoparam´ıla
culminacio´n de este trabajo. Nadie me dijo hace an˜os, en aquel pequen˜o pa´ıs lla-
mado Panama´, lo que era una tesis doctoral. Quiza´s, si en aquel momento en que
decid´ı salir del pa´ıs hubiese sabido lo que ello implicaba, me lo hubiera pensado
dosveces,...creoqueno.
As´ı como Ulises no hizo su recorrido solo, tampoco yo lo he realizado solo.
Ahora es cuando tengo que agradecer a las personas que de alguna forma me han
ayudadoaterminarloqueenestaspa´ginasserefleja.
En primer lugar a mis directores de tesis, Araceli Sanchis y Ricardo Aler, por
el tiempo que me han dedicado, por los consejos que me han dado y, porque no
decirlo, por soportar mi constante autocr´ıtica que en algunas ocasiones rozaba el
pesimismo ma´s puro y por haberme ayudado a superarlo y de esa forma concluir
estetrabajo.
A Daniel, por sus consejos y por el valioso tiempo que me ha dedicado desde
quedecid´ıhacerlatesisdoctoralenelGrupodeSistemasComplejosAdaptativos.
A mis compan˜eros de SCALAB por su apoyo. A mis amigos de dentro y fuera
del Departamento de Informa´tica de la Universidad Carlos III, por hacerme sentir
comoencasa,auncuandomeencontrabatanlejos.
A la Agencia Espan˜ola de Cooperacio´n Internacional, por haber financiado,
aunque fuese en parte, mis estudios de doctorado, da´ndole as´ı el toque tra´gico de
quetodabuenaodiseahacealarde.AlDepartamentodeInforma´ticadelaUniver-
sidad Carlos III de Madrid, por permitirme formar parte de e´l y gracias a cuyos
medios,experienciaysoportehasidoposiblelafinalizacio´ndeestainvestigacio´n.
A mi mama Lety y mi viejo, que a pesar de la distancia siempre han estado a
mi lado, y porque se´ lo que esto significa para ellos. A mi hermano, Leo, por ser
comoes.
Amit´ıoV´ıctoryamit´ıaMay,porsermissegundospadresyporsusconsejos
ysoportealolargodetodosestosan˜ostanlejosdecasa.
Al resto de mi familia, por estar ah´ı los d´ıas que llame´, y por hacerme sentir
ma´scercadecasa.
Por u´ltimo, mi agradecimiento ma´s profundo y sabiendo que con palabras no
puedo expresar lo que siento, a Yolanda. Gracias por haber cre´ıdo en m´ı desde
siempre, por querer ser parte de mi proyecto de vida, y por haber dejado todo en
Panama´ paraapoyarme.Aelladeboengranmedidaelconcluirestatesisyespero
tenerlasiempreconmigoparapodercompensarlaportodoloquehahechoporm´ı.
I
Resumen
Unadelasa´reasquema´saugehatenidoenlosu´ltimosan˜osdentrodelapren-
dizajeautoma´ticoesaque´llaendondesecombinanlasdecisionesdeclasificadores
individuales con la finalidad de que la decisio´n final de a que´ clase pertenece un
ejemplo sea realizada por un conjunto de clasificadores. Existen diversas te´cnicas
para generar conjuntos de clasificadores, desde la manipulacio´n de los datos de
entradaalautilizacio´ndemeta-aprendizaje.Unadelasmanerasenlasquesecla-
sificanestaste´cnicasesporelnu´merodealgoritmosdeaprendizajediferentesque
utilizan con el fin de generar los miembros del conjunto. Aquellas te´cnicas que
utilizan un u´nico algoritmo para generar todos los miembros del conjunto se dice
que generan un conjunto homoge´neo. Por otra parte, aquellas te´cnicas que utili-
zan ma´s de un algoritmo para generar los clasificadores se considera que generan
un conjunto de clasificadores heteroge´neo. Entre los algoritmos de generacio´n de
conjuntos heteroge´neos se encuentra Stacking, el cual, adema´s de generar los cla-
sificadoresdelconjuntoapartirdedistintosalgoritmosdeaprendizaje,utilizados
niveles de aprendizaje. El primer nivel de aprendizaje o nivel-0 utiliza los datos
del dominio de manera directa, mientras que el meta-nivel o nivel-1 utiliza datos
generadosapartirdelosclasificadoresdelnivel-0.
UnproblemainherenteaStackingesdeterminarlaconfiguracio´ndelospara´me-
tros de aprendizaje del algoritmo, entre ellos, que´ y cua´ntos algoritmos deben ser
utilizadosenlageneracio´ndelosclasificadoresdelconjunto.Trabajoprevioshan
determinadoquenohayunnu´meroexactodealgoritmosautilizarqueseaelo´pti-
moparatodoslosdominios.Tampocoesta´ perfectamentedefinidoque´ algoritmos
sedeber´ıanutilizar,aunqueexistentrabajosqueutilizanalgoritmosrepresentativos
decadatipo.
Unodelosobjetivosdeestatesisdoctoraleslautilizacio´ndealgoritmosgene´ti-
cos como te´cnica de optimizacio´n para determinar los algoritmos que deben ser
utilizadosparagenerarelconjuntodeclasificadores,aligualquelaconfiguracio´n
delospara´metrosdeaprendizajedee´stos.Deestamaneraelme´todoquesepropo-
neesindependientedeldominio,mientrasquelaconfiguracio´ndelospara´metros
deStackingencontrada,dependera´ deldominio.
El crecimiento del comercio electro´nico y las aplicaciones en la World-Wide-
Webhamotivadoelincrementodelosentornosendondeintervienenagentes.Estos
entornos incluyen situaciones competitivas y/o colaborativas en donde el conoci-
miento que se posea sobre los individuos involucrados en el entorno, proporciona
II
III
una clara ventaja a la hora de tomar una decisio´n sobre que´ accio´n llevar a cabo.
Existendiversasformasdeadquiriresteconocimiento.Unadeellasesatrave´sdel
modeladodelcomportamientodelosagentes.
Asuvez,existendiversasformasdeconstruirelmodelodeunagente.Algunas
te´cnicasutilizanmodelospreviamenteconstruidosysuobjetivoesintentarempa-
rejarelcomportamientoobservadoconunmodeloexistente.Otraste´cnicasasumen
uncomportamientoo´ptimodelagenteamodelarconelfindecrearunmodelode
sucomportamiento.
Un segundo objetivo de esta tesis doctoral es la creacio´n de un marco general
paraelmodeladodeagentesbasa´ndoseenlaobservacio´ndelcomportamientodel
agente a modelar. Para ello se propone la utilizacio´n de te´cnicas de aprendizaje
automa´ticoconelpropo´sitodellevaracabolatareademodeladobasa´ndoseenla
relacio´nexistenteentrelaentradaylasalidadelagente.
Abstract
In the last years, one of the most active research areas in Machine Learning
is that of ensembles of classifiers. Their purpose is to combine the decisions of
individual classifiers so that all classifiers in the ensemble are taken into account
in order to classify new instances. There are many techniques that generate such
ensembles.Somemanipulatetheinputdata,whileothersusemeta-learning.Inge-
neral,ensemblescanbehomogeneousorheterogeneous.Homogeneousensembles
consist of several classifiers generated by the same learning technique, whereas
heterogeneous ensembles contain classifiers generated by different algorithms. A
well-known approach to generate heterogeneous ensembles is Stacking. Stacking
usestwolevelsoflearning.Thefirstlearninglevelorlevel-0usesdirectdatafrom
the domain, whereas the meta-level or level-1 uses data generated by classifiers
fromlevel-0.
AninherentproblemtoStackingistodeterminetherightconfigurationofthe
learning parameters, like how many classifiers, and which learning algorithms,
must be used in the generation of the ensemble of classifiers. Previous work ha-
ve shown that there is no optimal decision for all the domains, although there are
worksthatuserepresentativealgorithmsfromeachtype.
OnegoalofthisthesisistouseGeneticAlgorithmsasanoptimizationtechni-
queinordertodeterminethetypeandnumberofalgorithmstobeusedtogenerate
theensembleofclassifiers,aswellastheconfigurationofthelearningparameters
ofthesealgorithms.Theproposedmethodisdomainindependent,andtheGenetic
Algorithmwillbeabletoadapttoparticulardomains.
The growth of the e-commerce and applications over the World-Wide-Web
hasmotivatedtheincreaseofenvironmentswhereagentscaninteract.Theseenvi-
ronment include competitive and/or colaborative situations where the knowledge
about other individuals involved in the environment, provides a clear advantage
whenmakingdecisionaboutactionstoperform.Thereareseveralwaystoacquire
thisknowledge.Oneofthemisbymodelingthebehaviorofotheragents.
There are several ways to construct an agent’s model. Some techniques use
previously constructed models and its goal to match the observed behavior with
anexistingmodel.Othertechniquesassumethattheagenttomodelcarriesoutan
optimalstrategyinordertocreateamodelofitsbehavior.
In this thesis, a second approach to model agents will be used based on the
observationofotheragentsbehavior.Inordertodothis,ageneralframeworkthat
usesmachinelearningtechniquesforagentmodelingisproposed.
IV
V
“So´lolosqueconstruyensobreideas,construyenparalaeternidad”
-Emerson-
´
Indice general
I Introduccio´n 1
1. Introduccio´n 2
1.1. GA-Stacking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. ModeladodeAgentesmedianteAprendizaje
Automa´tico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. ObjetivosdelaTesis . . . . . . . . . . . . . . . . . . . . . . . . 5
II GA-Stacking 7
2. Introduccio´n 8
3. EstadodelArte 10
3.1. AprendizajeAutoma´tico . . . . . . . . . . . . . . . . . . . . . . 10
3.1.1. AprendizajeSupervisado . . . . . . . . . . . . . . . . . . 11
3.1.2. AprendizajeNoSupervisado . . . . . . . . . . . . . . . . 12
3.1.3. AprendizajeporRefuerzo . . . . . . . . . . . . . . . . . 12
3.1.4. Taxonom´ıaBasadaenOtrosCriterios . . . . . . . . . . . 13
3.2. ConjuntosdeClasificadores . . . . . . . . . . . . . . . . . . . . 13
3.2.1. ¿Porque´ FuncionanlosConjuntosdeClasificadores? . . . 14
3.2.2. Construccio´ndeConjuntosdeClasificadores . . . . . . . 16
3.3. StackedGeneralization . . . . . . . . . . . . . . . . . . . . . . . 18
3.3.1. Definicio´n . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.3.2. TrabajosRelacionados . . . . . . . . . . . . . . . . . . . 20
3.4. AlgoritmosGene´ticos . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4.1. Definicio´n . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4.2. Optimizacio´nmedianteAG’s . . . . . . . . . . . . . . . . 28
3.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4. GA-Stacking 29
4.1. MarcoGeneral:GA-Stacking . . . . . . . . . . . . . . . . . . . . 30
4.2. Codificacio´ndelasSoluciones . . . . . . . . . . . . . . . . . . . 30
4.3. Evaluacio´ndelFitness . . . . . . . . . . . . . . . . . . . . . . . 33
4.4. OtrosPara´metrosdelosAG’s . . . . . . . . . . . . . . . . . . . . 34
VI
Description:III Modelado de Agentes mediante Aprendizaje Automático. 75. 7. do del AGENTE A. Es decir, el MCM construye off-line el modelo del AGENTE A, m, basado en la traza del and Speculative Play, pages 169–182. Springer