Mindy Stephania Muñoz
PhD studentMindy Stephania Muñoz es estudiante de doctorado del Programa de Posgrado en Bioinformática de la Universidad de São Paulo, Brasil, en el Instituto de Matemáticas y Estadística. Después de obtener su Licenciatura en Bioinformática, trabajó en la Universidad Católica de Chile en investigaciones para el mejoramiento de Vitis vinifera, en el Centro de Genómica y Bioinformática de la Universidad Mayor con datos genómicos públicos y privados y en el Instituto de Nutrición y Tecnología de Alimentos (INTA) en la Universidad de Chile aplicando conocimientos en genómica y transcriptómica para mejorar la producción de alimentos y cultivos. Se unió al Laboratorio de Biología de Sistemas Computacionales dirigido por el Dr. Helder Nakaya, con el objetivo de integrar datos ómicos con un enfoque específico en el cáncer humano. La proteómica es un desafío en esta área para ella y el EMBL-EBI presenta una oportunidad formidable para aprender sobre el análisis y los procedimientos sobre repositorios para los conjuntos de datos y metadatos en proteómica.
Project summary
La base de datos PRoteomics IDEntifications (PRIDE) es un repositorio de datos públicos centralizado, que cumple con los estándares, para datos de proteómica, incluidas las identificaciones de proteínas y péptidos, modificaciones postraduccionales y evidencia espectral. La reutilización de datos y la validación de resultados están firmemente integrados para su característica principal de difusión de datos. Sus servicios de datos han demostrado ser fundamentales para muchos estudios que realizan reanálisis de datos en un contexto más amplio que sus publicaciones originales.
En cualquier disciplina analítica, la reproducibilidad del análisis de datos está estrechamente relacionada con la calidad de los datos. El control de calidad (QC) proporciona una forma de mejorar la fiabilidad experimental, la reproducibilidad y el nivel de consistencia en las mediciones analíticas de proteómica, lo cual es importante para que los conjuntos de datos se almacenen en cualquier repositorio. Las herramientas desarrolladas y utilizadas para el control de calidad y el nuevo análisis deben estar sujetas al mismo nivel de atención y control para formar parte de los procedimientos de un repositorio. La contenerización, las pruebas unitarias y el CI/CD (integración continua / implementación continua) son herramientas importantes para garantizar que el software y las secuencias de procedimiento funcionen según las especificaciones. La comprensión de la conexión de datos dentro de un repositorio y sus conjuntos de datos son esenciales para un nuevo análisis exitoso. Por lo tanto, aprender a manejar los datos de acuerdo con sus metadatos y si es necesario, mejorar la anotación de datos y estratificar los metadatos actuales, serán parte del objetivo en el que se centrará.
Project outcomes and impact
TBA