Table Of ContentUNIVERSIDADE FEDERAL DO ABC
PROGRAMA DE PÓS-GRADUAÇÃO EM
ENGENHARIA DA INFORMAÇÃO
GANM: Desenvolvimento de uma abordagem para docking Proteína
Ligante por meio de Algoritmos Genéticos e Modos Normais
ANGÉLICA NAKAGAWA LIMA
SANTO ANDRÉ/SP
SETEMBRO/2010
ANGÉLICA NAKAGAWA LIMA
GANM: Desenvolvimento de uma abordagem para docking Proteína
Ligante por meio de Algoritmos Genéticos e Modos Normais
Dissertação apresentada ao Programa de Pós-
Graduação em Engenharia da Informação
como parte dos requisitos para a obtenção do
Título de Mestre em Engenharia da
Informação
ORIENTADOR: PROF. DR. LUIS PAULO
B. SCOTT
SANTO ANDRÉ/SP
SETEMBRO/2010
Ficha catalográfica elaborada pela Biblioteca da Universidade Federal do ABC
LIMA, Angélica Nakagawa
GANM: Desenvolvimento de uma abordagem para docking Proteína Ligante por meio de
Algoritmos Genéticos e Modos Normais / Angélic a Nakagawa Lima — Santo André :
Universidade Federal do ABC, 2010.
113 fls.
Orientador: Luis Paulo B Scott
Dissertação (Mestrado) — Universidade Federal do ABC, Programa de Pós-graduação
em Engenharia da Informação, 2010.
1. Docking Molecular 2. Metodologia GAN M 3. Algoritmos Genéticos I. SCOTT, Luis
Paulo B. II. Programa de Pós-graduação em Engenharia da Informação, 2010 III. Título.
CDD 511.8
À minha família
Agradecimentos
- Primeiramente à Deus.
- Ao prof. Dr. Luis Paulo B. Scott pela oportunidade e por não medir esforços em
ajudar.
- Às Prof. Dra Káthia e Prof. Dra Camila pelas contribuições ao trabalho.
- Aos professores dos programas de Pós-Graduação em Engenharia da Informação
pela formação.
- Ao Eric por me ensinar que fazer ciência é muito mais questionar do que saber.
- Ao Prof. David Perahia, pelos ensinamentos e pela oportunidade de conhecer seu
laboratório.
- Ao Prof. Dr. Pedro Pascutti e ao seu grupo, por sempre estarem dispostos a nos
ajudar.
- Aos Professores Jorge Chahine e José Ruggiero pelo incentivo a não desistir.
- Aos meninos do Laboratório, pelos momentos de distração.
- Aos meus pais e meu irmão pelo apoio incondicional. Ao Tiago pelo amor, carinho e
compreensão.
- Às minhas amigas de Rio Preto que, mesmo distante, sei que estão torcendo por
mim.
- Aos meus amigos da PJ pelos momentos de labuta e, ao mesmo tempo, diversão.
- À UFABC e à Capes pelo apoio financeiro.
A tantos que passaram por minha vida e deixaram a sua marca, o meu sincero
Muito Obrigada!
“Não basta a leitura sem a unção,
não basta a especulação sem a devoção, não
basta a pesquisa sem maravilhar-se; não basta
a circunspecção sem o júbilo, o trabalho sem a
piedade, a ciência sem a caridade, a
inteligência sem a humildade, o estudo sem a
graça.”
São Boaventura
RESUMO
O processo de reconhecimento molecular é de extrema importância para a manutenção da
vida e está presente nos diversos mecanismos celulares, participando de maneira direta ou
indireta deles. A ativação e inibição de processos moleculares dependem de moléculas que
sinalizam tais processos, onde essas moléculas (ligantes) reconhecem sítios específicos de ligação
(receptores) e ligam-se a eles. Os processos de reconhecimento molecular também são de vital
importância para o desenvolvimento de fármacos, no qual um ligante (fármaco) se liga a
determinados receptores para combater uma patologia. Dentre os processos atuais de
desenvolvimento de fármacos, são utilizadas técnicas computacionais que ajudam a descobrir
candidatos a fármacos, como o Docking Molecular. O desafio dos métodos atuais é considerar a
flexibilidade da molécula receptora e também a presença do solvente. Este trabalho tem por
objetivo propor e implementar parte de uma metodologia (nomeada como GANM) que considera
a flexibilidade das cadeias laterais do receptor, efeitos do solvente e a flexibilização do backbone.
A metodologia GANM utiliza Algoritmos Genéticos, Bibliotecas de Rotâmeros (para a
flexibilização das cadeias laterais), modos normais (para a flexibilização do backbone) e
solvatação implícita para realizar o docking proteína-ligante. O software desenvolvido (PL-
DOCK) para a primeira versão da GANM foi testado em experimentos de cross-docking do
complexo HIV-1 protease/Nelfinavir, HIV-1 protease/Ritonavir e HIV-1 protease/Indinavir. O
PL-DOCK apresentou bons resultados uma vez que a maioria das simulações apresentou valores
aceitáveis (RMSD < 2.5 Å). O trabalho também discute a implementação e teste do programa
para o cálculo de modos normais de baixa frequência para proteínas (NoMPro).
i
ABSTRACT
The molecular recognition process is important to the life and it is present in different
cellular mechanisms. The activity of several molecular processes depends on molecules (ligands)
that recognize specific bonding sites (receptors) and binds to them. The processes of molecular
recognition are very important for the drug development. Molecular Docking is an important
technique for the drug design process. One great challenge for these techniques is implementation
of complete flexibility of the receptor molecule and a solvent explicit model. In this work, we
propose and implement part of a methodology (called GANM) that considers the flexibility of
side chains of receptor, effects of solvent and the flexibility of backbone. The methodology
GANM uses Genetic Algorithms, Rotamers Library (for the flexibility of side chain), normal
modes analysis and implicit solvatation to simulate the docking protein-ligand. The software
developed (PL-DOCK) for the first version of GANM was tested through cross-docking
experiments with the following complexes: HIV-1 protease/Nelfinavir, HIV-1 protease/Ritonavir
and HIV-1 protease/Indinavir. The first version presents interesting results, most of the
simulations showed good values for the RMSD. This work also discusses the implementation and
test of a program (NoMPro) to calculate the normal modes of low frequency for proteins.
ii
SUMÁRIO
Capítulo 1 - Introdução .................................................................................................................... 1
1.1 Objetivos ................................................................................................................................ 2
1.2 Justificativa / Motivação ........................................................................................................ 3
Capítulo 2 - Aspectos Estruturais de Proteínas e de Docking Molecular ........................................ 4
2.1 Aspectos Estruturais das Proteínas ........................................................................................ 4
2.2 Rotâmeros .............................................................................................................................. 7
2.3 Docking Molecular .............................................................................................................. 10
2.4 Programas de Docking Molecular ....................................................................................... 14
Capítulo 3 - Algoritmos Genéticos e Modos Normais .................................................................. 17
3.1 Teoria da Evolução de Darwin ............................................................................................ 17
3.2 Algoritmos Genéticos .......................................................................................................... 18
3.3 Inicialização da população................................................................................................... 21
3.4 Seleção ................................................................................................................................. 22
3.5 Avaliação ............................................................................................................................. 23
3.6 Reprodução .......................................................................................................................... 24
3.6.1. Recombinação ............................................................................................................. 24
3.6.2. Mutação ....................................................................................................................... 26
3.7 Parada .................................................................................................................................. 26
3.8 Algoritmos Genéticos e Docking Molecular ....................................................................... 26
3.9 Modos Normais ................................................................................................................... 28
Capítulo 4 - Metodologia GANM ................................................................................................. 30
4.1 A metodologia GANM ........................................................................................................ 30
4.1.1 Primeira Versão ............................................................................................................. 30
4.1.2 Segunda Versão ............................................................................................................. 31
4.1.3 Terceira Versão ............................................................................................................. 34
4.1.4 Quarta Versão ............................................................................................................... 36
4.2 Detalhes de Implementação da Primeira Versão ................................................................. 37
4.2.1 Flexibilidade Molecular ................................................................................................ 37
4.2.2 Solvatação Implementada ............................................................................................. 40
4.2.3 Função de Aptidão ........................................................................................................ 42
iii
Description:O movimento torsional pode ser do ligante, mas também da cadeia lateral do a CDK tem como atividade básica a fosforilação de outras proteínas.