búsqueda de

secuencias

ÍNDICE:

OBjetivos

BÚSQUEDA DE SECUENCIAS

ALINEAMIENTO DE SECUENCIAS:

-Nucleoproteninas

-Proteinas de la  matriz

-Polimerasa

RESULTADOS Y CONCLUSIONES

Volver a la página principal

 

 

 

 

 

 

 

 

En primer lugar, buscamos el genoma completo de Ébola Zaire en GenBank, y de ahí copiamos las secuencias aminoacídicas que hacen referéncia a la nucleoproteina, a la proteina de la matriz y a la polimerasa:

  Location    Strand Length  PID    Gene    Synonym  Product
470..2689      +740 10314000 NP Nucleoprotein
4479..5459 +327 10313993 VP40 Matrix protein
11581..18219     +2213 10313999 L Polymerase

Con esas secuencias realizamos una búsqueda por similitud mediante Blast. Los resultados obtenidos fueron los siguientes:

1) Búsqueda por similitud de la Nucleoproteina (BLAST)

2) Búsqueda por similitud de la Proteina de la Matriz (BLAST)

3) Búsqueda por similitud de la Polimerasa (BLAST)

A partir de estos resultados, seleccionamos las secuencias que despues compararemos:

Ebola Reston

Nucleoproteina gi|22789223|ref|NP_690580.1|
Proteina de la matriz VP40 gi|22789225|ref|NP_690582.1|
RNA-dependent RNA polymerase gi|22789229|ref|NP_690587.1|  

Ebola Marburg

Nucleoproteina gi|13489276|ref|NP_042025.1|
Proteina de la matriz VP40 gi|1552357|emb|CAA78116.1|
RNA-directed RNA polymerase gi|1350906|sp|P31352|RRPL_MABVM  

Ebola Sudan

Nucleoproteina gi|8479542|sp|Q9QP77|VNUC_EBOSB
RNA-directed RNA polymerase gi|8477362|sp|Q66802|RRPL_EBOSM  

Virus parainfluenza humano1

L polymerase protein gi|19718373|ref|NP_604442.1|  

Measles virus

Nucleoproteina gi|2895838|gb|AAC03043.1|
RNA polymerase gi|133603|sp|P12576|RRPL_MEASE  

Mumps virus

Polymerase gi|14325895|gb|AAK60064.1|  

RSV

Polymerase subunit L gi|2627308|gb|AAB86667.1|  

Las proteinas que no encontramos mediante ese análisis por similitud las buscamos al GenBank. Los resultados son los siguientes:

  Location    Strand Length  PID    Gene    Synonym  Product

Rabies virus

71..1423 +   451  9627198   nucleoprotein N
5418..11846     +  2143  9627202   L protein
2496..3104 +   203  9627200   M2 protein

Measles virus

3438..4445 +   336  9626949 M
matrix protein

Mumps virus

146..1795 +   550  9695416 NP  nucleocapsid protein
SCORE P ACCESSION GI  protein description
1939 8 BAA13025 1468929 matrix protein [Mumps virus]

RSV

1140..2315 +   392  9629201 N nucleocapsid protein
3263..4033 +   257  9629203 M matrix protein

Virus parainfluenza humano1

120..1694      +   525  19718364 N nucleoprotein
3669..4715 +   349  19718370 M matrix protein

Las secuencias obtenidas tras estas búsquedas en formato .txt han sido las siguientes:

1) Nucleoproteina

2) Proteina de la Matriz

3) Polimerasa