Table Of ContentM(cid:19)etodos de pontos interiores aplicados ao problema
de regress~ao pela norma L
p
Daniela Renata Cantane
Orientador: Prof. Dr. Aurelio Ribeiro Leite de Oliveira
Dissertac(cid:24)a~o apresentada ao Instituto de Ci^encias
Matema(cid:19)ticasedeComputac(cid:24)a~o-ICMC-USP,comoparte
dos requisitos para obtenc(cid:24)a~o do t(cid:19)(cid:16)tulo de Mestre em
(cid:19)
Ci^encias - Area: Ci^encias da Computac(cid:24)a~o e Matema(cid:19)tica
Computacional.
USP - Sa~o Carlos - SP
Setembro/2004
(cid:18)
A minha fam(cid:19)(cid:16)lia.
ii
Agradecimentos
(cid:18)
A Deus, por estar sempre abenc(cid:24)oando minha vida e iluminando meus caminhos du-
rante toda essa caminhada.
Aos meus pais, Cidinha e Carlinhos e aos meus irma~os, Daniel e Diego, pelo apoio e
incentivo aos meus estudos. Agradec(cid:24)o por estarem sempre presentes em minha vida.
Ao meu namorado, Daniel, pela compreensa~o nos momentos que estive ausente, pelo
seu amor, carinho e amizade durante todos estes anos.
Ao meu orientador, pela paci^encia e dedicac(cid:24)a~o ao longo do desenvolvimento do pro-
jeto e por ter me concedido esta oportunidade.
Aos professores e funciona(cid:19)rios da USP que contribuiram para a minha formac(cid:24)a~o de
uma forma em geral.
(cid:18)
As minhas amigas \irma~zinhas", Aline, Lilian, Kelly, Cec(cid:19)(cid:16)lia, Glaucia e So^nia que
sempre estiveram dispostas a ajudar quando necessitei.
(cid:18)
A FAPESP - Fundac(cid:24)a~o de Amparo e Apoio a(cid:18) Pesquisa do Estado de Sa~o Paulo,
pelo apoio (cid:12)nanceiro.
iii
Resumo
Neste trabalho a fam(cid:19)(cid:16)lia de m(cid:19)etodos de pontos interiores barreira logar(cid:19)(cid:16)tmica (cid:19)e desen-
volvida para o problema de regressa~o pela norma L e a estrutura matricial resultante (cid:19)e
p
exploradaobjetivandoumaimplementac(cid:24)a~oe(cid:12)ciente. Apresentamosalgunsconceitossobre
m(cid:19)etodos de pontos interiores necessa(cid:19)rios para o desenvolvimento do m(cid:19)etodo e descreve-
mos um m(cid:19)etodo de converg^encia quadra(cid:19)tica previamente conhecido. Uma implementac(cid:24)a~o
em Matlab dos m(cid:19)etodos de pontos interiores desenvolvidos (cid:19)e comparada com uma imple-
mentac(cid:24)a~o do m(cid:19)etodo quadra(cid:19)tico existente, obtendo desempenho computacional superior.
Abstract
In this work the family of logarithmic barrier interior point methods is developed
for the norm L (cid:12)tting problem and the resultant matrix structure is exploited in order
p
to have an e(cid:14)cient implementation. We introduce some concepts about interior point
methods necessary for the development of the method and describe a previously known
quadraticconvergentproblem. AnimplementationinMatlaboftheinteriorpointmethods
developed is compared with an implementation of the known quadratic method obtaining
better computational performance.
iv
Conteu(cid:19)do
Resumo iv
Abstract iv
1 Introduc(cid:24)~ao 1
2 M(cid:19)etodos de Pontos Interiores 4
2.1 Conceitos Iniciais sobre Pontos Interiores . . . . . . . . . . . . . . . . . . . 4
2.1.1 Otimizac(cid:24)a~o Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.2 Otimizac(cid:24)a~o Na~o Linear . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.3 Convexidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 M(cid:19)etodo de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 M(cid:19)etodo de Newton para uma varia(cid:19)vel . . . . . . . . . . . . . . . . . 9
2.2.2 M(cid:19)etodo de Newton para va(cid:19)rias varia(cid:19)veis . . . . . . . . . . . . . . . 9
2.3 M(cid:19)etodo de Pontos Interiores Primal-Dual . . . . . . . . . . . . . . . . . . . 10
2.3.1 M(cid:19)etodo Primal-Dual A(cid:12)m-Escala . . . . . . . . . . . . . . . . . . . 10
2.3.2 M(cid:19)etodo Primal-Dual Cla(cid:19)ssico . . . . . . . . . . . . . . . . . . . . . 14
2.4 M(cid:19)etodo de Pontos Interiores Barreira Logar(cid:19)(cid:16)tmica . . . . . . . . . . . . . . 16
2.4.1 Crit(cid:19)erio de Converg^encia . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.2 Inicializac(cid:24)a~o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5 M(cid:19)etodo de Pontos Interiores Barreira Logar(cid:19)(cid:16)tmica Preditor-Corretor . . . . 20
3 O Problema de Regress~ao L 24
p
3.1 O Problema de Regressa~o pela Norma L . . . . . . . . . . . . . . . . . . . 24
p
v
3.2 M(cid:19)etodos Pr(cid:19)e-Existentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2.1 M(cid:19)etodos de Relaxac(cid:24)a~o por Coluna para o problema de norma m(cid:19)(cid:16)nima 26
3.2.2 M(cid:19)etodo GNCS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4 M(cid:19)etodos de Pontos Interiores Aplicados ao Problema de Regress~ao pela
Norma L 38
p
4.1 M(cid:19)etodo Barreira Logar(cid:19)(cid:16)tmica . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.1.1 Crit(cid:19)erio de Converg^encia . . . . . . . . . . . . . . . . . . . . . . . . 44
4.1.2 Pontos Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.1.3 Algumas Considerac(cid:24)o~es . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2 M(cid:19)etodo Preditor-Corretor . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2.1 Algumas Considerac(cid:24)o~es . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.3 M(cid:19)etodo Primal-Dual Barreira Logar(cid:19)(cid:16)tmica . . . . . . . . . . . . . . . . . . 50
4.3.1 Crit(cid:19)erio de Converg^encia . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3.2 Algumas Considerac(cid:24)o~es . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4 M(cid:19)etodo Primal-Dual Preditor-Corretor . . . . . . . . . . . . . . . . . . . . 57
4.4.1 Algumas Considerac(cid:24)o~es . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.5 Regressa~o Polinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5 Resultados Computacionais 68
6 Concluso~es e Perspectivas Futuras 97
6.1 Concluso~es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.2 Perspectivas Futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
vi
Lista de Tabelas
5.1 Resultados computacionais utilizando a func(cid:24)a~o f (z). . . . . . . . . . . . . 71
1
5.2 Resultados computacionais utilizando a func(cid:24)a~o f (z). . . . . . . . . . . . . 71
2
5.3 Utilizando a func(cid:24)a~o f (z): z = u;z = v. . . . . . . . . . . . . . . . . . . . 73
1 u v
5.4 Utilizando a func(cid:24)a~o f (z): z = u;z = v. . . . . . . . . . . . . . . . . . . . 73
2 u v
5.5 Utilizando a func(cid:24)a~o f (z) e z = z = e. . . . . . . . . . . . . . . . . . . . . 74
1 u v
5.6 Utilizando a func(cid:24)a~o f (z) e z = z = e. . . . . . . . . . . . . . . . . . . . . 74
2 u v
5.7 Utilizando a func(cid:24)a~o f (z) e z = (((cid:21)+1)=2)e e z = (((cid:21) 1)=2)e. . . . . . 75
1 u v
(cid:0)
5.8 Utilizando a func(cid:24)a~o f (z) e z = (((cid:21)+1)=2)e e z = (((cid:21) 1)=2)e. . . . . . 75
2 u v
(cid:0)
5.9 Resultados computacionais utilizando a func(cid:24)a~o sinx. . . . . . . . . . . . . 85
5.10 Resultados computacionais utilizando a func(cid:24)a~o sinx. . . . . . . . . . . . . 85
5.11 Resultados computacionais utilizando a func(cid:24)a~o sinx. . . . . . . . . . . . . 86
5.12 Resultados computacionais utilizando a func(cid:24)a~o sinx. . . . . . . . . . . . . 86
5.13 Resultados computacionais utilizando a func(cid:24)a~o sinhx. . . . . . . . . . . . . 87
5.14 Resultados computacionais utilizando a func(cid:24)a~o sinhx. . . . . . . . . . . . . 87
5.15 Resultados computacionais utilizando a func(cid:24)a~o sinhx. . . . . . . . . . . . . 88
5.16 Resultados computacionais utilizando a func(cid:24)a~o sinhx. . . . . . . . . . . . . 88
5.17 Resultados computacionais utilizando a func(cid:24)a~o lnx. . . . . . . . . . . . . . 89
5.18 Resultados computacionais utilizando a func(cid:24)a~o lnx. . . . . . . . . . . . . . 89
5.19 Resultados computacionais utilizando a func(cid:24)a~o lnx. . . . . . . . . . . . . . 90
5.20 Resultados computacionais utilizando a func(cid:24)a~o lnx. . . . . . . . . . . . . . 90
5.21 Resultados computacionais utilizando a func(cid:24)a~o expx. . . . . . . . . . . . . 91
5.22 Resultados computacionais utilizando a func(cid:24)a~o expx. . . . . . . . . . . . . 91
5.23 Resultados computacionais utilizando a func(cid:24)a~o expx. . . . . . . . . . . . . 92
vii
5.24 Resultados computacionais utilizando a func(cid:24)a~o expx. . . . . . . . . . . . . 92
5.25 Resultados computacionais utilizando a func(cid:24)a~o expx2. . . . . . . . . . . . . 93
5.26 Resultados computacionais utilizando a func(cid:24)a~o expx2. . . . . . . . . . . . . 93
5.27 Resultados computacionais utilizando a func(cid:24)a~o expx2. . . . . . . . . . . . . 94
5.28 Resultados computacionais utilizando a func(cid:24)a~o expx2. . . . . . . . . . . . . 94
5.29 Resultados computacionais utilizando o problema de grande porte. . . . . . 95
5.30 Resultados computacionais utilizando o problema de grande porte. . . . . . 95
5.31 Resultados computacionais utilizando o problema de grande porte. . . . . . 96
viii
Cap(cid:19)(cid:16)tulo 1
Introduc(cid:24)~ao
Desde o surgimento dos m(cid:19)etodos de pontos interiores para otimizac(cid:24)a~o linear, co(cid:19)digos
computacionais baseados nessas id(cid:19)eias vem se apresentando como alternativas e(cid:12)cientes
para soluc(cid:24)a~o de problemas de grande porte [1; 10; 15; 19].
Uma linha de pesquisa importante nesta a(cid:19)rea considera classes espec(cid:19)(cid:16)(cid:12)cas de proble-
mas e explora as particularidades da estrutura matricial com o objetivo de obter imple-
mentac(cid:24)o~es ainda mais e(cid:12)cientes, inclusive para problemas com restric(cid:24)o~es lineares e func(cid:24)a~o
objetivo na~o linear [5; 20; 21; 22; 23; 24; 25].
O objetivo deste trabalho consiste no desenvolvimento dos m(cid:19)etodos de pontos in-
teriores para o problema de regressa~o pela norma L , 1 < p < 2, no estudo da estrutura
p
matricial resultante e na implementac(cid:24)a~o e(cid:12)ciente do m(cid:19)etodo desenvolvido. Os resultados
obtidos sera~o comparados com uma implementac(cid:24)a~o do m(cid:19)etodo proposto em [13].
Dada uma classe de problemas, a forma padra~o para o desenvolvimento de um m(cid:19)etodo
de pontos interiores consiste na aplicac(cid:24)a~o do m(cid:19)etodo de Newton a(cid:18)s condic(cid:24)o~es de otimali-
dade desconsiderando as restric(cid:24)o~es de capacidade. O m(cid:19)etodo resultante (cid:19)e essencialmente
um m(cid:19)etodo de pontos interiores espec(cid:19)(cid:16)(cid:12)co para esta classe de problemas. Algumas al-
terac(cid:24)o~es, atrav(cid:19)es da introduc(cid:24)a~o de perturbac(cid:24)o~es, sa~o necessa(cid:19)rias para obter um m(cid:19)etodo
e(cid:12)ciente [29; 30]. De forma ana(cid:19)loga, desenvolve-se uma das variantes mais importantes
1
dos m(cid:19)etodos de pontos interiores, o m(cid:19)etodo preditor-corretor [16].
A etapa seguinte desta abordagem consiste na explorac(cid:24)a~o e(cid:12)ciente da estrutura matri-
(cid:19)
cial do problema. E sempre importante lembrar que a resoluc(cid:24)a~o de um sistema linear, em
geral sim(cid:19)etrico, consiste no passo mais caro, em termos computacionais, de cada iterac(cid:24)a~o
dos m(cid:19)etodos de pontos interiores. Desta forma, a explorac(cid:24)a~o da estrutura matricial pode
levar a m(cid:19)etodos de pontos interiores mais e(cid:12)cientes que os m(cid:19)etodos gen(cid:19)ericos aplicados
a um problema particular. As id(cid:19)eias desenvolvidas em [20; 21] para os problemas de
regressa~o L e L tamb(cid:19)em podem ser adaptadas a este problema devido a(cid:18) semelhanc(cid:24)a
1 1
das estruturas matriciais com o problema de regressa~o L .
p
O problema de regressa~o
min Ax b p
x2IRm k (cid:0) kp
onde A = [a ;:::;a ] IRm(cid:2)n, b IRn e n > m, tem inu(cid:19)meras aplicac(cid:24)o~es em diversas
1 n
2 2
a(cid:19)reas de ci^encias e engenharias. As normas mais utilizadas sa~o as normas L ;L e L . A
1 2 1
norma L (cid:19)e muito popular entre outros motivos por permitir uma soluc(cid:24)a~o direta. Por sua
2
vez a norma L permite diminuir o efeito de pontos discrepantes enquanto que a norma
1
L garante protec(cid:24)a~o contra o pior caso.
1
O m(cid:19)etodo IRLS iteratively reweighted least-squares [17] foi por muito tempo a u(cid:19)nica
alternativa pra(cid:19)tica para a resoluc(cid:24)a~o deste problema para outros valores de p. Mais recen-
temente este m(cid:19)etodo foi aperfeic(cid:24)oado, no que diz respeito a(cid:18) robustez, atrav(cid:19)es da inclusa~o
de uma busca linear [13]. No mesmo trabalho, foi tamb(cid:19)em proposto um novo m(cid:19)etodo
que apresenta caracter(cid:19)(cid:16)sticas similares aos m(cid:19)etodos de pontos interiores. Este m(cid:19)etodo
apresentou resultados computacionais superiores ao IRLS.
Ambos m(cid:19)etodos apresentados em [13] t^em uma importante desvantagem: a busca
linear(cid:19)ecomputacionalmentecara. Istonosmotivouoestudodosm(cid:19)etodosdepontosinteri-
ores aplicados a este problema que obt(cid:19)em resultados computacionais superiores, repetindo
o desempenho obtido na minimizac(cid:24)a~o pelas normas L e L em [20; 21], respectivamente.
1 1
2
Description:em Matlab dos métodos de pontos interiores desenvolvidos é comparada com .. um ponto primal e dual factıvel, o gap é dado por γ = ctx − bty = ztx.