Alinhamento Múltiplo de Sequências (MSA)
Objetivos
- Utilizar e manipular alinhamentos múltiplos no programa CLUSTAL;
- Conhecer e alterar os parâmetros de alinhamento, como penalidades de gaps e matrizes de substituição;
- Trabalhar com sequências muito e pouco relacionadas;
- Utilizar ferramentas iterativas e baseadas em consistência, como o MAFFT e o T-Coffee;
- Conhecer a ferramenta JalView.
Observações:
- Para visualização, utilizaremos o programa Jalview, a partir do qual podemos utilizar vários programas de alinhamento. Além disso, o Jalview é multiplataforma, por ser baseado em JAVA.
- Você pode acessar os arquivos de ajuda a qualquer momento dentro do programa, clicando 'Help' > 'Documentation'.
- Existe também um tutorial disponível em: http://www.jalview.org/tutorial/TheJalviewTutorial_screen.pdf.
- Este tutorial foi construído apenas para fins didáticos. A reprodução dele para qualquer outro fim não é permitida e nem consentida.
Conhecendo o Jalview
Acesse a home page do Jaview: http://www.jalview.org
Execute uma das opções contidas no canto superior direito. A que vai funcionar dependerá do nível de acesso e permissões que o seu usuário possui na máquina. No primeiro acesso realiza-se o download do programa. Um arquivo .jnlp é baixado e depois você o executa (caso isto não aconteça automaticamente).
Baixe o seguinte conjunto de sequências: 1dox_ref1.fasta.
- Abra o alinhamento indo em 'File' > 'Input alignment' > 'from File'.
- Observe os dados. Eles estão alinhados?
Tente alguns dos comandos básicos:
- Para selecionar um táxon, clique no nome no lado esquerdo.
- Para selecionar todas as sequências de uma só vez, clique:
- Command-A nos computadores do tipo Mac.
- Control-A, nos computadores do tipo Linux, Windows (PCs).
- Para retirar a seleção, vá em 'Select'>'Deselect All';
- Para mover as sequências selecionadas para outro ponto no grupo de dados (dataset), selecione uma e então pressione as teclas de direção (setas) para mover as sequências.
As sequências podem ser editadas manualmente:
- Clique com o botão esquerdo e arraste para selecionar onde se deseja iniciar a edição;
- Clique com o botão direito na sequência selecionada e então selecione 'Selection'>'Edit'>'Edit Sequence'.
- Inclua os caracteres que desejar, ou inclua um espaço para um gap no dataset.
- Você pode desfazer as mudanças indo em 'Edit'>'Undo'.
Feche o arquivo, evitando salvar as mudanças.
Usando diferentes programas de alinhamento
Abra o dataset (1dox_ref1.fasta) do passo anterior no Jalview:
Parte A:
- Dentro da área de trabalho do Jalview, clique na janela 1dox_ref1.fasta.
- Faça um alinhamento básico com o Clustal, clicando em 'Web Service' > 'Alignment' > 'Clustal' > ‘with Defaults’.
- Terminado o alinhamento, uma nova janela com os dados alinhados será aberta, incluíndo um gráfico abaixo do alinhamento. Observe os parâmetros indicados por este gráfico.
- Não feche a janela do alinhamento.
Parte B:
- Dentro da área de trabalho do Jalview, clique na janela 1dox_ref1.fasta. -Faça um alinhamento básico com o MAFFT, clicando em 'Web Service' > 'Alignment' > 'MAFFT with Defaults’.
- Terminado o alinhamento, uma nova janela com os dados alinhados será aberta, incluíndo um gráfico abaixo do alinhamento. Observe os parâmetros indicados por este gráfico.
Parte C: Comparando as etapas A e B
- Observe cuidadosamente os alinhamentos obtidos na Parte A e na Parte B. São diferentes? Qual dos 2 você prefere, MAFFT ou Clustal? Por que?
- Em cada uma das janelas de alinhamento, com cada um dos programas, vá em ‘File’ > ‘Save As’. Exporte o alinhamento no formato .msf ou .aln. Não esqueça de identificar no nome do arquivo o alinhamento.
- Construa um dendograma a partir de cada um dos seus alinhamentos:
- Vá na janela dos alinhamentos (tanto para o MAFFT, como para o Clustal) e clique em 'Calculate' > 'Calculate Tree' > 'Neighbor Joining using BLOSUM62'.
A árvore é um parâmetro importante para ajudar na avaliação de um alinhamento. Mas esta árvore não pode ser considerada com uma hipótese evolutiva entre estas sequências, como veremos em outra aula, de Filogenia Molecular.
- Compare as árvores obtidas pelos 2 programas. As topologias e os comprimentos de ramos diferiram?
Parte D: Utilizando os outros programas
-
Repita a mesma operação com os programas: T-Coffee, Muscle e Probscon.
-
Analise os alinhamentos e exporte os arquivos no formato .msf.
Modificando parâmetros no alinhamento
- Repita as etapas do Passo 2, com o dataset 3grs_ref2.fasta
- Faça o alinhamento com todos os programas, deixando o programa MAFFT por último.
- Com o programa MAFFT, faça um alinhamento com as condições padrões.
Passo 1:
- Volte para a janela principal do fasta e modifique o parâmetro Gap Open Penalty para 20.
Passo 2:
- Volte para a janela principal do fasta e modifique o parâmetro Gap Open Penalty para 0.1.
Passo 3:
-
Modifique a Matriz de proteínas para uma de sua escolha. (Observe o alinhamento e lembre-se das recomendações na escolha das matrizes).
-
Exporte os resultados no formato .msf ou .aln, indicando no nome do arquivo cada modificação.
PERGUNTAS
- Qual a influência destes parâmetros de GOP no alinhamento final?
- Como você acha que estes parâmetros de GOP e GEP devem ser usados para melhorar o alinhamento de proteínas que não possuem variação de tamanho em diferentes organismos?