CONHECENDO O GENBANK E UTILIZAÇÃO DA FERRAMENTA BLAST

Este é um exercício básico de apresentação dos principais bancos de dados que iremos trabalhar na disciplina durante as próximas aulas (Alinhamento, Busca de similaridade e Bancos de Dados). Procure observar e verificar todas as informações que os bancos disponibilizam.

Pode clicar a vontade dentro destes sites! Você não quebrará nenhuma vidraria ou equipamento de laboratório, nem se contaminará com alguma amostra ou reagente químico.

Observação:

  • Este tutorial foi construído apenas para fins didáticos. A reprodução dele para qualquer outro fim não é permitida e nem consentida.

Estrutura de um Registro (sequência) do GenBank-NCBI

  1. Abrir a Home Page do NCBI.

  2. No campo search colocar como tipo de procura nucleotide:

  3. No campo for (destinado ao termo de busca) colocar o seguinte número de acesso: NM_000402.

  4. Após o resultado, clicar na seqüência e obter as seguintes informações:

    • Tipo de Seqüência Biológica (DNA genômico, cDNA, mRNA, etc.);

    • Tamanho do Fragmento;

    • O organismo fonte;

    • O produto gênico;

    • Posição do Códon Inicial;

    • Outras características da seqüência.

Utilização da Ferramenta BLAST

  1. Abrir novamente a Home Page do NCBI

  2. Clicar no link BLAST (Na lateral direita ou ir diretamente em www.ncbi.nlm.nih.gov/blast).

  3. Verificar todas as opções de utilização da ferramenta BLAST.

  4. Clicar em nucleotide BLAST (BLASTN).

  5. Copiar e colar a seqüência abaixo no campo Query:

>Seq2
GGCACGAGCCCCCGTCTCCTCCGATCGGACGGACCACCGGGCCAGCAGCGGGGCGGATCGCGTCAGCAGC
CATGGTGAAGGCCTACCCCACGGTGAACGAGGACTACCTCAAGGCGGTCGACAAGGCCAAGCGTAAGCTC
CGCGGCCTCATCGCCGAGAAGAATTGCGCCCCGCTCATGCTCCGCCTCGCATGGCACTCCGTGGGCACCT
TCGATGTGGTCACCAAAACCGGGGGCCCCTTCGGCACCATGAAGAACCCCGTCGAGCAGGCGCACGGTGC
CAACGCCGGACTGGAAATTGCCATCAGGCTGCTAGAGCCCATCAAGGAGCAGTTCCCCATCCTATCCTAC
GCTGACTTCTACCAGCTTGCTGGAGTCGTGGCAGTCGAGGTAACCGGCGGACCTGATGTCCCCTTCCACC
CTGGGAGGCAGGACAAGCCTGAGCCTCCACCGGAAGGCCGCCTTCCTGATGCCACCCAAGGTTCTGATCA
CCTCAGGCAGGTTTTCTCCACACAGATGGGTTTGAGCGACCAGGACATTGTTGCGCTTTCTGGTGGTCAC
ACCCTGGGAAGATGCCACAAGGACAGGTCTGGATTTGAGGGAGCCTGGACGTCCAACCCTTTGATCTTTG
ACAACTCTTACTTCAAGGAGCTTCTGAGCGGAGAGAAGGAAGGCCTTCTGCAGCTACCAAGTGACAAAGC
CCTCCTCTCTGATCCATCCTTCCGCCCACTTGTTGACAAATACGCAGCGGACGAGGACGCTTTCTTTGCT
GACTACGCCGAGGCCCACCTGAAGCTTTCAGAATTGGGATTTGCTGAGGCGTAACGAACCAGAAGAGTGT
GGTGGCTGTCGCCGGCCGGCCTTGTGTTTTTGTTGTCTGCTTTTCTCTTGAACGAAGATGTGATGAACTC
AGCTGAAGATGTAGTGTGTATGTTGTCATGGTTTATTTTTCTATTTTATTTATCTATCTATAATATCTAT
CGGAGAAGGTTTGATATGAAGCGGAACACTGAGTAACGATGCCCCAAAAAAAAAAAAAAAAA

Link para baixar o arquivo: Seq2.fasta

  1. Na mesma página, verificar todas as opções de Bancos para a utilização do BLAST.

  2. Marcar a opção Database como Nucleotide Collection (nr/nt) (Banco de Seqüências não-redundante);

  3. Clicar em BLAST. Após alguns segundos, uma página será gerada com todos os alinhamentos da sequência que você submeteu, com sequências presentes no GenBank. A primeira parte é uma figura representativa do alinhamento e mais abaixo estarão os alinhamentos com cada sequência, igual ou parecida. A partir disto, obter as seguintes informações:

    • A sequência submetida é mais similar a qual Gene?
    • De qual organismo? Existem sequências similares em quais outros organismos?
    • Interpretação do alinhamentos e dos seus parâmetros de avaliação (Explicação).
  4. Repetir a busca de similaridade utilizando a ferramenta BLASTX (Votlando para a página inicial do BLAST: www.ncbi.nlm.nih.gov/blast).

  5. Realizar novamente todas as etapas anteriores com as seguintes seqüências:

>Seq3
GGGATGCATGCAGCTACTCGATCGGTCGATCGGGACCCATGCAGTCGAGCTACTTTTTACCCAG
TACATGATGGCTACGACGACGACTCTGAGCTGAGATCTAGCTAGCATCTATATCATCGCGAGGC
ATGCAGATACGCGCGCATATATATGCGCGGGCCCATACCGGTCAGCTAGGGAAACTTCAGGCAT
GACTAGCCATTTGACACCATAGAGAGCTACACTAACAGATACAGGGTAGAACCATCGCTAGCTA
GCTACATCGATCCATCGACTACGACCACACACTGCGCTACTGTCAGTACGTGATCGAGCGATCG
ATCGATCATAGCGATCGATCGGGGAACGTAGTCGTAGGACTGCGATCGAGCTAGCGGAGTCAGA
GCAGCGGCGCCCAAAGTGTATTAGCGATATGCGTATTTCGAGAGCTGCCCACATTTCAGCGGCT
ACGGGACTCTATTGGGGATCTAGCGCGATTCCGGGCTACTATTACCAGGCTCACCATAGAGTCT
ATTCACTATCTAGCGACTCGATAGCACGACTACGACGACT

>Seq4
ACCTCGTTCATCTCCTTCACCTCCGAAATGATCTCGCTTTTGGGTTTACGGCCGGTCTCTTCACCTGGAG
CATCAGCCGGGAAGGTCAGGGTCGCCCTGGCTCGGGCCTGTTCACATTGGGGTCAAAGGCACACATTGGG
GGCTCAACCAAGGCGAGCTGCGTTCGCGGGGCCGGGTCTTTCCGCACAGGCGGAGGGCGGTGGCGGGCGC
GGAGGCGTCGCGCGAGCCAGGGGGCAGCCACGGGCCGGGGGTACCTAGCGCCACCCGCTTCGCTTGCATC
AGCTGCGCGCCCCATCCCGAGGAATGGTAGAGGCAGCCCCGCCCCCGGCCCGCCCCCGCCTTTCCATTGG
CTGCCGCGCGGGGCGGGGAGCGGGGTCGGCTCAGTGGCCCTGAGACCCTAGCTCTGCTCTCGGTCCGCTC
GCTGTCCGCTAGCCCGCTGCGATGTTGCGCGCTGCCGCCCGCTTCGGGCCCCGCCTGGGCCGCCGCCTCT
TGTCAGCCGCCGCCACCCAGGCCGTGCCTGCCCCCAACCAGCAGCCCGAGGTCTTCTGCAACCAGATTTT
CATAAACAATGAATGGCACGATGCCGTCAGCAGGAAAACATTCCCCACCGTCAATCCGTCCACTGGAGAG
GTCATCTGTCAGGTAGCTGAAGGGGACAAGGAAGATGTGGACAAGGCAGTGAAGGCCGCCCGGGCCGCCT
TCCAGCTGGGCTCACCTTGGCGCCGCATGGACGCATCACACAGGGGCCGGCTGCTGAACCGCCTGGCCGA
TCTGATCGAGCGGGACCGGACCTACCTGGCGGCCTTGGAGACCCTGGACAATGGCAAGCCCTATGTCATC
TCCTACCTGGTGGATTTGGACATGGTCCTCAAATGTCTCCGGTATTATGCCGGCTGGGCTGATAAGTACC
ACGGGAAAACCATCCCCATTGACGGAGACTTCTTCAGCTACACACGCCATGAACCTGTGGGGGTGTGCGG
GCAGATCATTCCGTGGAATTTCCCGCTCCTGATGCAAGCATGGAAGCTGGGCCCAGCCTTGGCAACTGGA
AACGTGGTTGTGATGAAGGTAGCTGAGCAGACACCCCTCACCGCCCTCTATGTGGCCAACCTGATCAAGG
AGGCTGGCTTTCCCCCTGGTGTGGTCAACATTGTGCCTGGATTTGGCCCCACGGCTGGGGCCGCCATTGC
CTCCCATGAGGATGTGGACAAAGTGGCATTCACAGGCTCCACTGAGATTGGCCGCGTAATCCAGGTTGCT
GCTGGGAGCAGCAACCTCAAGAGAGTGACCTTGGAGCTGGGGGGGAAGAGCCCCAACATCATCATGTCAG
ATGCCGATATGGATTGGGCCGTGGAACAGGCCCACTTCGCCCTGTTCTTCAACCAGGGCCAGTGCTGCTG
TGCCGGCTCCCGGACCTTCGTGCAGGAGGACATCTATGATGAGTTTGTGGAGCGGAGCGTTGCCCGGGCC
AAGTCTCGGGTGGTCGGGAACCCCTTTGATAGCAAGACCGAGCAGGGGCCGCAGGTGGATGAAACTCAGT
TTAAGAAGATCCTCGGCTACATCAACACGGGGAAGCAAGAGGGGGCGAAGCTGCTGTGTGGTGGGGGCAT
TGCTGCTGACCGTGGTTACTTCATCCAGCCCACTGTGTTTGGAGATGTGCAGGATGGCATGACCATCGCC
AAGGAGGAGATCTTCGGGCCAGTGATGCAGATCCTGAAGTTCAAGACCATAGAGGAGGTTGTTGGGAGAG
CCAACAATTCCACGTACGGGCTGGCCGCAGCTGTCTTCACAAAGGATTTGGACAAGGCCAATTACCTGTC
CCAGGCCCTCCAGGCGGGCACTGTGTGGGTCAACTGCTATGATGTGTTTGGAGCCCAGTCACCCTTTGGT
GGCTACAAGATGTCGGGGAGTGGCCGGGAGTTGGGCGAGTACGGGCTGCAGGCATACACTGAAGTGAAAA
CTGTCACAGTCAAAGTGCCTCAGAAGAACTCATAAGAATCATGCAAGCTTCCTCCCTCAGCCATTGATGG
AAAGTTCAGCAAGATCAGCAACAAAACCAAGAAAAATGATCCTTGCGTGCTGAATATCTGAAAAGAGAAA
TTTTTCCTACAAAATCTCTTGGGTCAAGAAAGTTCTAGAATTTGAATTGATAAACATGGTGGGTTGGCTG
AGGGTAAGAGTATATGAGGAACCTTTTAAACGACAACAATACTGCTAGCTTTCAGGATGATTTTTAAAAA
ATAGATTCAAATGTGTTATCCTCTCTCTGAAACGCTTCCTATAACTCGAGTTTATAGGGGAAGAAAAAGC
TATTGTTTACAATTATATCACCATTAAGGCAACTGCTACACCCTGCTTTGTATTCTGGGCTAAGATTCAT
TAAAAACTAGCTGCTCTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

Links para baixar os arquivos: Seq3.fasta, Seq4.fasta.