Modelagem com o Multidomain Assembler

O Multidomain Assembler (MDA) (Hertig et al. 2015) é um programa para abordar os problemas especiais que surgem durante a modelagem de proteínas com grande número de domínios. Tais problemas incluem:

Organizar espacialmente estruturas não sobrepostas.
Obter a melhor cobertura para um modelo quando existem centenas de estruturas disponíveis para algumas regiões de seqüência, enquanto outras regiões têm poucos homólogos distantes.
Montar um único modelo de uma proteína com múltiplos domínios e diversos templates disponíveis.

O MDA automatiza as tarefas de pesquisa, visualização e seleção destes modelos e, em seguida, gera modelos multidomínios. Ele é bem simples de executar, sendo parte integrada ao UCSF CHIMERA (Hertig et al. 2015).

Em seus passos iniciais, o MDA também serve para obtenção de um resumo visual das estruturas disponíveis para uma seqüência de consulta, filtrada opcionalmente por critérios como o escore do BLAST e % de identidade, dispostos horizontalmente do N para o C-terminal. Os prováveis templates sobrepostos são organizados de maneira vertical e os segmentos de sequência sem cobertura estrutural são indicados com esferas. Adicionalmente, o MDA também mostra um alinhamento dos vários templates com a sequência alvo, o que por si só já é um resultado extremamente útil (Fonte: https://www.cgl.ucsf.edu/chimera/features.html).

Para demonstrarmos a utilização do MDA, modelaremos a proteína Ácido Graxo sintase do Boi (Bos taurus), Q71SP7 (FAS_BOVIN).

>Q71SP7_FAS_BOVIN
MEEVVITGMSGKLPESENLEEFWANLIGGVDMVTDDDRRWKAGLYGLPRRSGKLKDLSRF
DASFFGVHPKQAHNMDPQLRLLLEVTYEAIVDAGINPASIRGTNTGVWVGVSGSEASEAL
SRDPETLVGYSMVGCQRAMLANRLSFFFDFKGPSITLDTACSSSLLALQRAYQAIQRGEC
AMAIVGGVNIRLKPNTSVQFMKLGMLSPEGTCKFFDASGNGYCRAKAVMAILLTKKSLAR
RVYATILNAGTNTDGCKEKGVTFPSGEAQEQLISSLYKPAGLDPETLEYVEAHGTGTKVG
DPQELNGIVQALCGTRQSPLRIGSTKSNMGHPEPASGLAALAKVLLSLEHGLWAPNLHFH
NPNPKIPALQDGRLQVVDRPLPVLGGNVGINSFGFGGSNVHVILQPNSQPLPPPAPHAAL
PRLLRASGRTLEGVQGLLELGLQHSQNLAFVSMLNDIATPSPAAMPFRGYAVLGSQGGSQ
KVQQVLAGKRPLWFICSGMGTQWRGMGLSLMRLSRFRDSILRSDEAVKPLGLQVSQLLLS
TDEAIFDDMVISFVSLTAIQIALIDLLTSMGLQPDGIIGHSLGEVACGYADGCISQEEAI
LSAYWRGQCIKEANIPPGAMAAVGLTWEECKQRCPPGIVPACHNCIDTVTISGPQASMLE
FVQQLKQEGVFAKEVRTGGMAFHSYFMDAIAPMLLQQLKKVIREPQPRSPRWLSTSIPET
QWQESLARTFSAEYNVNNLVSPVLFQEALWRVPEDAVVLEIAPHALLQAVLKRGLKSSCT
IIPLMKKDHRDNLEFFLSNVGQLYLTGIDVNPNGLFPPVEFPAPRGTPLISPHIKWDHSQ
TWDVPTAEDFPSGSSSSSATIYKIDINPESPDHYLVDHCIDGRIIFPGTGYLCLVWKTLA
RALDQNMEHTPVVFEDVTLHQAVILPKTGIVLLKVRLLEASCTFEVSENGNLIASGKVYQ
WEDPNPKLFDNRYGPDPATPVDPTTAIHLSRGDVYKELQLQGFNYGPYFQGILEASSEGN
TGQLLWKDNWVTFMDTMLQMSILAPSKRSLRLPTRITAIYIHPATHQQKLYTLQDKTQVA
DVVINRCLDTTVAGGIYISRIHTSVAPRHQQEQLVPILEKFCFTPHVETGCLAGNLALQE
ELQLCVGLAQALQTRVAQQGIKMVVPGLDGAQAPQEAPQQGLPRLLATACQLQLNGNLQM
EMGQILAQERALLCDDPLLSGLLNSPALKACVTLALENMTSLKMKVVLAGDGQLYSRIPT
LLNTQPLLELDYTATDRHPQALEAAQAKLQQLDITQGQWDPSDPAPSNLGGANLVVCNYA
LASLGDPATAVGNMVAALKEGGFLLLHTLLRGHPLGETVTFLTCPEPQQGQRHLLSQDEW
ERLFAGASLHLVALKKSFYGSVLFLCRRLAPLDSPIFLPVEDTSFQWVDSLKNILADSSS
RAVWLMAVGCTTSGVVGLVNCLRKEPDGHRIRCVLVSNLNSTSPIPETDPKSLELQKVLQ
SDLVMNVYRDGAWGAFRHFPLEQDKPEEQTEHAFINVLTRGDLSSIRWVCSPLRHSQPTA
PGFQLCTIYYASLNFKRNHAGHGQAVPRRHPRNWASRNCLLGMEFSGRDASGKRVMGLVP
AEGLATSTLVPQSFLWDVPSNWTLEEAASVPVVYSTAYYALMVRGRMQPGETVLIHSGSG
GVGQAAIAIALSLGCRVFPLVGSAEKRAYLQSRFPQLNETSFANSRDTSFEQHVLWHTAG
KGADLVLNSLAEEKLQASVRCLAQHGRFLEIGKFDLSKNHPLGMAIFLKNVTFHGILLDS
LFEENNTMWQEVSTLLKAGIRKGVVQPLKRTVFPRTQAEDAFRYMAQGKHIGKVVIQVRE
EEQEAVLHGTKPTQMVALCKTFCPAHKSYIITGGLGGFGLELAHWLVERGAQKLVLTSRS
GIRTGYQARQVHEWRRQGVQVLVSTSDVSTLDGTRSLITEAAQLGPVGGIFNLAVVLRDA
MLDNQTPEFFQDVNKPKYNGTLNLDRVTREACPELDYFEVFSSVSCGRGNAGQTNYGFAN
STMERICEKRRHDGLPGLAVQWGAIADVGLLMELKGTKDKAIGGTLPQRITSCMEVLDLF
LNQPHPVLSSFVLAEKATSRGPSGSHQDLVKAVTHILGIRDLATVNLDSSLSDLGLDSLM
GVEVRQMLEREHNLLLSMREIRQLTIHKLQEISAQAGTADELTDSTPKFGSPAQSHTQLN
LSTLLVNPEGPTLTRLNSVQSSERPLFLVHPIEGSTTVFHSLATKLSIPTYGLQCTGAAP
LDSIQSLATYYIECIRQVQPEGNYRIAGYSYGACVAFEMCSQLQAQQNAGPTNNSLFLFD
GSHTFVMAYTQSYRAKLNPGCEAEAEAEAMCFFMQQFTEAEHSRVLEALLPLGDLEARVA
ATVELIVQSHAGLDRHALSFAARSFYHKLRAAEEYTPRATYHGNVTLLRAKMGSAYQEGL
GADYNLSQVCDGKVSVHIIEGDHRTLLEGSGLESILSIIHSSLAEPRVSVREG

A enzima FASN de mamíferos possui sete sítios ativos para reações distintas, em domínios separados. Tudo isto em uma única cadeia polipeptídica. Os múltiplos domínios atuam como enzimas distintas. A enzima final forma um homodímero. Mais informações pode ser obtidas do seu registro Uniprot (Q71SP7 (FAS_BOVIN)).

Abaixo seguem as etapas para a modelagem desta proteína.

Preparando os Arquivos

Crie uma pasta no desktop chamada MDA.
Dentro desta página, crie um arquivo no gedit e cole a sequência acima. Salve-o como FASN_Bos.fasta .

Esta pasta MDA será também onde os arquivos de saída do programa serão escritos.

Executando o MDA

O MDA é executado via linha de comando no UCSF Chimera. Para isso, precisamos mostrar a linha de comando no programa e executar as etapas abaixo:

Abra o UCSF Chimera.

Chimera-MDA-1

A linha de comando do UCSF Chimera irá aparecer embaixo da janela.
Nesta caixa, digite o seguinte comando:

mda ~/Desktop/MDA/FASN_Bos.fasta winnow 8 suppressDoubles true

Ele deverá ficar de acordo com a figura abaixo.

Chimera-MDA-2

Não esqueça de conferir se o caminho do diretório está correto.

O MDA também pode ser executado utilizando como entrada um código Uniprot.

O comando está sendo executado com duas opções:
- winnow 8 Acertos máximos por região. Valores mais baixos retornam menos hits.
- suppressDoubles true: Manter apenas o hit de maior pontuação para uma entrada do PDB.

Descrições adicionais dos comandos do MDA e suas opções, podem ser encontradas AQUI.

Pressione a tecla ENTERpara que o comando seja executado.

Nesta etapa o MDA faz uma busca BLAST contra o banco PDB para encontrar estruturas conhecidas com sequência similar, para toda extensão da sequência alvo. Depois, ele importa as estruturas do PDB correspondentes para o UCSF Chimera e as coloca da esquerda para a direita de acordo com as correspondências de seqüência ao longo da consulta do N ao C-terminal.

Na pasta de saída especificada, o MDA grava os seguintes arquivos de saída:

O alinhamento pseudo-múltiplo de sequência do BLAST no formato FASTA alinhado.
Um arquivo de texto contendo informações da execução.

Logo após a execução, a seguinte caixa de diálogo irá aparecer:

Chimera-MDA-3

Clique em Yes e espere que todos os arquivos PDBs sejam abertos.

Quando terminado o processo, os modelos alinhados de acordo com a sequência irão aparecer na área de trabalho do UCSF Chimera, além de duas novas janelas: uma com o alinhamento e a outra já com a interface para modelagem com Modeller.

As estruturas encontradas pela busca BLAST aparecerão da seguinte maneira, sempre seguindo a sequência alvo, do N para o C-terminal.

Chimera-MDA-4

Dê um zoom e veja as estruturas com mais detalhes.

A janela de alinhamento múltiplo (MAV) aparecerá com a seguinte:

Chimera-MDA-5

Verifique e navegue pelo alinhamento, para confirmar se toda a sequência da FASN_Bos teve estrutura correspondente.

Fazendo a modelagem a partir do resultado do MDA

O restante dos passos é bem similar aos descritos no tutorial de Modelagem Comparativa 1.

Na janela aberta da interface com o Modeller, selecione as opções de acordo com a figura abaixo:

Chimera-MDA-6

Não esqueça de colocar o caminho certo do executável do Modeller.

Deixe apenas como um único modelo, pois esta modelagem costuma ser demorada.

Clique em OK e espere os resultados.
No final da modelagem, aparecerão o modelo na área de trabalho do UCSF Chimera e a janela Modeller Results.

Chimera-MDA-7

Salvando o Modelo

Salve o modelo obtido, seguindo os passos abaixo:

Na janela principal do UCSF Chimera vá em:
- Select > Chain > (noID).

Chimera-MDA-8

Depois vá em:
- Select > Invert (all models).

Chimera-MDA-9

Depois de selecionados todos os modelos, siga o caminho abaixo:
- Select > Actions > Atoms/Bonds > Delete.

Chimera-MDA-10

Agora você estará apenas com a estrutura que acabou de ser modelada e as estruturas templates foram apagadas.

Dê um foco na sua estrutura com o seguinte passo:
- Clique em Actions > Focus.

Agora siga os passos abaixo:

Vá em Tools > General Controls > Model Panel.
Uma nova janela irá aparecer, chamada Model Panel.
Selecione as estruturas classificadas como Gap e aperte a tecla Closeao lado. Faça isso em todas que aparecer. Até que a janela fique semelhante a abaixo:

Chimera-MDA-11

Clique em write PDB. Na janela seguinte, dê um nome ao arquivo e salve o PDB.