Una base de datos que unifica toda la información genómica del patógeno Piscirickettsia salmonis disponible en la base de datos biológicas, eso es “PsalmonisDB”, herramienta desarrollada por el Magíster (c) en Microbiología de la línea “Salud Animal en el Ambiente Marino” (RP3), Guillermo Nourdin, en colaboración con el equipo del Dr. Vinicius Maracaja-Coutinho, director del Laboratorio de Bioinformática Integrativa de la Facultad de Ciencias Químicas y Farmacéuticas de la Universidad de Chile.
Esta base de datos es capaz de almacenar la información relacionada a secuencias y sus respectivas anotaciones funcionales. Por otro lado, PsalmonisDB implementa “UCSC Genome Browser”, el cual es una aplicación de exploración genómica en donde se encuentran cargada toda la información correspondiente a P. salmonis. Además, implementa el software BLAST dentro de su interfaz, permitiendo hacer un alineamiento contra toda la nueva información generada y almacenada dentro de la base de datos PsalmonisDB”, explica Guillermo Nourdin.
La gran ventaja que posee PsalmonisDB es que almacena toda esta información en un lugar específico, correspondiente a la información genómica (genes codificantes y no codificantes) y diversas anotaciones contra bases de datos biológicas disponibles en la red. Esto se observa al momento de hacer un análisis global de genomas de este patógeno, “algo que sin herramientas como PsalmonisDB, sería una tarea extensa”, recalca Nourdin. Por otro lado, esta herramienta funcionará como repositorio de secuencias y sus propias funciones biológicas y que, por medio de BLAST, alinea las secuencias a consultar solo contra secuencias de P. salmonis de interés.
Otra ventaja que posee esta herramienta es que agrupa diversa información de muchas bases de datos biológicas en un solo sitio, teniendo como objetivo tener la mayor cantidad de información en solo una consulta. “En otros casos, por cada base de datos biológica es necesario una consulta, teniendo el límite las bases de datos que quiera consultar. Este último caso es un proceso engorroso, por lo que PsalmonisDB es una herramienta útil para la investigación en el área acuícola”, señala el joven profesional.
El modelo de entidad-relación de la base de datos se construyó utilizando MySQL WorkBench y el código SQL se exportó y editó manualmente. Para la predicción y traducción de ORFs a proteínas codificantes, utilizaron Glimmer 3.02 y TransDecoder, respectivamente. Las secuencias se agruparon con corte de identidad del 98%, y se efectuaron anotaciones mediante la búsqueda de similitud de secuencias con el software DIAMOND, utilizando un conjunto de bases de datos públicas (NR, Uniprot, Swissprot, Gene Ontology).
“En resumen, identificamos un total de 59,439 genes de 19 genomas completos de P. salmonis disponibles en bases de datos públicas, con un promedio de 3,128 genes por genoma. Esta información actualizada podría ser útil para futuros estudios genómicos; siendo una herramienta adicional para la anotación de los genomas de este patógeno y nuevos estudios vinculados a su organización, su biología y desarrollo de metodologías de tratamiento y diagnóstico de enfermedades asociadas a P. salmonis”, explica el Candidato a Magíster en Microbiología.
En el mes de noviembre, Guillermo Nourdin, presentó sus resultados en formato póster en el Congreso International Society for Computational Biology, ISCB, realizado en la ciudad de Viña del Mar.
“Dentro de los días de presentación recibí buenos comentarios por parte de los asistentes al congreso, en donde me comentaban lo importante de este tipo de trabajo, debido a que en las grandes bases de datos biológicas tienen demasiada información poco clasificada y muchas veces redundante y mal catalogada. Al mismo tiempo, me señalaban la necesidad de trabajar en la creación de bases de datos específicas a diversos organismos de interés en el área clínica o en la industria”, concluyó el estudiante de la RP3 del Centro INCAR.