CONHECENDO O GENBANK E UTILIZAÇÃO DA FERRAMENTA BLAST
Este é um exercício básico de apresentação dos principais bancos de dados que iremos trabalhar na disciplina durante as próximas aulas (Alinhamento, Busca de similaridade e Bancos de Dados). Procure observar e verificar todas as informações que os bancos disponibilizam.
Pode clicar a vontade dentro destes sites! Você não quebrará nenhuma vidraria ou equipamento de laboratório, nem se contaminará com alguma amostra ou reagente químico.
Observação:
- Este tutorial foi construído apenas para fins didáticos. A reprodução dele para qualquer outro fim não é permitida e nem consentida.
Estrutura de um Registro (sequência) do GenBank-NCBI
-
Abrir a Home Page do NCBI.
-
No campo search colocar como tipo de procura nucleotide:
-
No campo for (destinado ao termo de busca) colocar o seguinte número de acesso: NM_000402.
-
Após o resultado, clicar na seqüência e obter as seguintes informações:
-
Tipo de Seqüência Biológica (DNA genômico, cDNA, mRNA, etc.);
-
Tamanho do Fragmento;
-
O organismo fonte;
-
O produto gênico;
-
Posição do Códon Inicial;
-
Outras características da seqüência.
-
Utilização da Ferramenta BLAST
-
Abrir novamente a Home Page do NCBI
-
Clicar no link BLAST (Na lateral direita ou ir diretamente em www.ncbi.nlm.nih.gov/blast).
-
Verificar todas as opções de utilização da ferramenta BLAST.
-
Clicar em nucleotide BLAST (BLASTN).
-
Copiar e colar a seqüência abaixo no campo Query:
>Seq2
GGCACGAGCCCCCGTCTCCTCCGATCGGACGGACCACCGGGCCAGCAGCGGGGCGGATCGCGTCAGCAGC
CATGGTGAAGGCCTACCCCACGGTGAACGAGGACTACCTCAAGGCGGTCGACAAGGCCAAGCGTAAGCTC
CGCGGCCTCATCGCCGAGAAGAATTGCGCCCCGCTCATGCTCCGCCTCGCATGGCACTCCGTGGGCACCT
TCGATGTGGTCACCAAAACCGGGGGCCCCTTCGGCACCATGAAGAACCCCGTCGAGCAGGCGCACGGTGC
CAACGCCGGACTGGAAATTGCCATCAGGCTGCTAGAGCCCATCAAGGAGCAGTTCCCCATCCTATCCTAC
GCTGACTTCTACCAGCTTGCTGGAGTCGTGGCAGTCGAGGTAACCGGCGGACCTGATGTCCCCTTCCACC
CTGGGAGGCAGGACAAGCCTGAGCCTCCACCGGAAGGCCGCCTTCCTGATGCCACCCAAGGTTCTGATCA
CCTCAGGCAGGTTTTCTCCACACAGATGGGTTTGAGCGACCAGGACATTGTTGCGCTTTCTGGTGGTCAC
ACCCTGGGAAGATGCCACAAGGACAGGTCTGGATTTGAGGGAGCCTGGACGTCCAACCCTTTGATCTTTG
ACAACTCTTACTTCAAGGAGCTTCTGAGCGGAGAGAAGGAAGGCCTTCTGCAGCTACCAAGTGACAAAGC
CCTCCTCTCTGATCCATCCTTCCGCCCACTTGTTGACAAATACGCAGCGGACGAGGACGCTTTCTTTGCT
GACTACGCCGAGGCCCACCTGAAGCTTTCAGAATTGGGATTTGCTGAGGCGTAACGAACCAGAAGAGTGT
GGTGGCTGTCGCCGGCCGGCCTTGTGTTTTTGTTGTCTGCTTTTCTCTTGAACGAAGATGTGATGAACTC
AGCTGAAGATGTAGTGTGTATGTTGTCATGGTTTATTTTTCTATTTTATTTATCTATCTATAATATCTAT
CGGAGAAGGTTTGATATGAAGCGGAACACTGAGTAACGATGCCCCAAAAAAAAAAAAAAAAA
Link para baixar o arquivo: Seq2.fasta
-
Na mesma página, verificar todas as opções de Bancos para a utilização do BLAST.
-
Marcar a opção Database como Nucleotide Collection (nr/nt) (Banco de Seqüências não-redundante);
-
Clicar em BLAST. Após alguns segundos, uma página será gerada com todos os alinhamentos da sequência que você submeteu, com sequências presentes no GenBank. A primeira parte é uma figura representativa do alinhamento e mais abaixo estarão os alinhamentos com cada sequência, igual ou parecida. A partir disto, obter as seguintes informações:
- A sequência submetida é mais similar a qual Gene?
- De qual organismo? Existem sequências similares em quais outros organismos?
- Interpretação do alinhamentos e dos seus parâmetros de avaliação (Explicação).
-
Repetir a busca de similaridade utilizando a ferramenta BLASTX (Votlando para a página inicial do BLAST: www.ncbi.nlm.nih.gov/blast).
-
Realizar novamente todas as etapas anteriores com as seguintes seqüências:
>Seq3
GGGATGCATGCAGCTACTCGATCGGTCGATCGGGACCCATGCAGTCGAGCTACTTTTTACCCAG
TACATGATGGCTACGACGACGACTCTGAGCTGAGATCTAGCTAGCATCTATATCATCGCGAGGC
ATGCAGATACGCGCGCATATATATGCGCGGGCCCATACCGGTCAGCTAGGGAAACTTCAGGCAT
GACTAGCCATTTGACACCATAGAGAGCTACACTAACAGATACAGGGTAGAACCATCGCTAGCTA
GCTACATCGATCCATCGACTACGACCACACACTGCGCTACTGTCAGTACGTGATCGAGCGATCG
ATCGATCATAGCGATCGATCGGGGAACGTAGTCGTAGGACTGCGATCGAGCTAGCGGAGTCAGA
GCAGCGGCGCCCAAAGTGTATTAGCGATATGCGTATTTCGAGAGCTGCCCACATTTCAGCGGCT
ACGGGACTCTATTGGGGATCTAGCGCGATTCCGGGCTACTATTACCAGGCTCACCATAGAGTCT
ATTCACTATCTAGCGACTCGATAGCACGACTACGACGACT
>Seq4
ACCTCGTTCATCTCCTTCACCTCCGAAATGATCTCGCTTTTGGGTTTACGGCCGGTCTCTTCACCTGGAG
CATCAGCCGGGAAGGTCAGGGTCGCCCTGGCTCGGGCCTGTTCACATTGGGGTCAAAGGCACACATTGGG
GGCTCAACCAAGGCGAGCTGCGTTCGCGGGGCCGGGTCTTTCCGCACAGGCGGAGGGCGGTGGCGGGCGC
GGAGGCGTCGCGCGAGCCAGGGGGCAGCCACGGGCCGGGGGTACCTAGCGCCACCCGCTTCGCTTGCATC
AGCTGCGCGCCCCATCCCGAGGAATGGTAGAGGCAGCCCCGCCCCCGGCCCGCCCCCGCCTTTCCATTGG
CTGCCGCGCGGGGCGGGGAGCGGGGTCGGCTCAGTGGCCCTGAGACCCTAGCTCTGCTCTCGGTCCGCTC
GCTGTCCGCTAGCCCGCTGCGATGTTGCGCGCTGCCGCCCGCTTCGGGCCCCGCCTGGGCCGCCGCCTCT
TGTCAGCCGCCGCCACCCAGGCCGTGCCTGCCCCCAACCAGCAGCCCGAGGTCTTCTGCAACCAGATTTT
CATAAACAATGAATGGCACGATGCCGTCAGCAGGAAAACATTCCCCACCGTCAATCCGTCCACTGGAGAG
GTCATCTGTCAGGTAGCTGAAGGGGACAAGGAAGATGTGGACAAGGCAGTGAAGGCCGCCCGGGCCGCCT
TCCAGCTGGGCTCACCTTGGCGCCGCATGGACGCATCACACAGGGGCCGGCTGCTGAACCGCCTGGCCGA
TCTGATCGAGCGGGACCGGACCTACCTGGCGGCCTTGGAGACCCTGGACAATGGCAAGCCCTATGTCATC
TCCTACCTGGTGGATTTGGACATGGTCCTCAAATGTCTCCGGTATTATGCCGGCTGGGCTGATAAGTACC
ACGGGAAAACCATCCCCATTGACGGAGACTTCTTCAGCTACACACGCCATGAACCTGTGGGGGTGTGCGG
GCAGATCATTCCGTGGAATTTCCCGCTCCTGATGCAAGCATGGAAGCTGGGCCCAGCCTTGGCAACTGGA
AACGTGGTTGTGATGAAGGTAGCTGAGCAGACACCCCTCACCGCCCTCTATGTGGCCAACCTGATCAAGG
AGGCTGGCTTTCCCCCTGGTGTGGTCAACATTGTGCCTGGATTTGGCCCCACGGCTGGGGCCGCCATTGC
CTCCCATGAGGATGTGGACAAAGTGGCATTCACAGGCTCCACTGAGATTGGCCGCGTAATCCAGGTTGCT
GCTGGGAGCAGCAACCTCAAGAGAGTGACCTTGGAGCTGGGGGGGAAGAGCCCCAACATCATCATGTCAG
ATGCCGATATGGATTGGGCCGTGGAACAGGCCCACTTCGCCCTGTTCTTCAACCAGGGCCAGTGCTGCTG
TGCCGGCTCCCGGACCTTCGTGCAGGAGGACATCTATGATGAGTTTGTGGAGCGGAGCGTTGCCCGGGCC
AAGTCTCGGGTGGTCGGGAACCCCTTTGATAGCAAGACCGAGCAGGGGCCGCAGGTGGATGAAACTCAGT
TTAAGAAGATCCTCGGCTACATCAACACGGGGAAGCAAGAGGGGGCGAAGCTGCTGTGTGGTGGGGGCAT
TGCTGCTGACCGTGGTTACTTCATCCAGCCCACTGTGTTTGGAGATGTGCAGGATGGCATGACCATCGCC
AAGGAGGAGATCTTCGGGCCAGTGATGCAGATCCTGAAGTTCAAGACCATAGAGGAGGTTGTTGGGAGAG
CCAACAATTCCACGTACGGGCTGGCCGCAGCTGTCTTCACAAAGGATTTGGACAAGGCCAATTACCTGTC
CCAGGCCCTCCAGGCGGGCACTGTGTGGGTCAACTGCTATGATGTGTTTGGAGCCCAGTCACCCTTTGGT
GGCTACAAGATGTCGGGGAGTGGCCGGGAGTTGGGCGAGTACGGGCTGCAGGCATACACTGAAGTGAAAA
CTGTCACAGTCAAAGTGCCTCAGAAGAACTCATAAGAATCATGCAAGCTTCCTCCCTCAGCCATTGATGG
AAAGTTCAGCAAGATCAGCAACAAAACCAAGAAAAATGATCCTTGCGTGCTGAATATCTGAAAAGAGAAA
TTTTTCCTACAAAATCTCTTGGGTCAAGAAAGTTCTAGAATTTGAATTGATAAACATGGTGGGTTGGCTG
AGGGTAAGAGTATATGAGGAACCTTTTAAACGACAACAATACTGCTAGCTTTCAGGATGATTTTTAAAAA
ATAGATTCAAATGTGTTATCCTCTCTCTGAAACGCTTCCTATAACTCGAGTTTATAGGGGAAGAAAAAGC
TATTGTTTACAATTATATCACCATTAAGGCAACTGCTACACCCTGCTTTGTATTCTGGGCTAAGATTCAT
TAAAAACTAGCTGCTCTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
Links para baixar os arquivos: Seq3.fasta, Seq4.fasta.