CABANA Online

Meet secondees

Mindy Stephania Muñoz

PhD student

Home institute: University of São Paulo

Country of residence: Brazil

Highest qualification: PhD

Name of the host: Juan Antonio Vizcaino

Projects start date: 08 Sep 2019

Relevant challenge area(s): Communicable disease, Sustainable food production, Protection of biodiversity

Projects end date: 07 Mar 2020

Type of project: Software curation

Mindy Stephania Muñoz es estudiante de doctorado del Programa de Posgrado en Bioinformática de la Universidad de São Paulo, Brasil, en el Instituto de Matemáticas y Estadística. Después de obtener su Licenciatura en Bioinformática, trabajó en la Universidad Católica de Chile en investigaciones para el mejoramiento de Vitis vinifera, en el Centro de Genómica y Bioinformática de la Universidad Mayor con datos genómicos públicos y privados y en el Instituto de Nutrición y Tecnología de Alimentos (INTA) en la Universidad de Chile aplicando conocimientos en genómica y transcriptómica para mejorar la producción de alimentos y cultivos. Se unió al Laboratorio de Biología de Sistemas Computacionales dirigido por el Dr. Helder Nakaya, con el objetivo de integrar datos ómicos con un enfoque específico en el cáncer humano. La proteómica es un desafío en esta área para ella y el EMBL-EBI presenta una oportunidad formidable para aprender sobre el análisis y los procedimientos sobre repositorios para los conjuntos de datos y metadatos en proteómica.

Project summary

La base de datos PRoteomics IDEntifications (PRIDE) es un repositorio de datos públicos centralizado, que cumple con los estándares, para datos de proteómica, incluidas las identificaciones de proteínas y péptidos, modificaciones postraduccionales y evidencia espectral. La reutilización de datos y la validación de resultados están firmemente integrados para su característica principal de difusión de datos. Sus servicios de datos han demostrado ser fundamentales para muchos estudios que realizan reanálisis de datos en un contexto más amplio que sus publicaciones originales.

En cualquier disciplina analítica, la reproducibilidad del análisis de datos está estrechamente relacionada con la calidad de los datos. El control de calidad (QC) proporciona una forma de mejorar la fiabilidad experimental, la reproducibilidad y el nivel de consistencia en las mediciones analíticas de proteómica, lo cual es importante para que los conjuntos de datos se almacenen en cualquier repositorio. Las herramientas desarrolladas y utilizadas para el control de calidad y el nuevo análisis deben estar sujetas al mismo nivel de atención y control para formar parte de los procedimientos de un repositorio. La contenerización, las pruebas unitarias y el CI/CD (integración continua / implementación continua) son herramientas importantes para garantizar que el software y las secuencias de procedimiento funcionen según las especificaciones. La comprensión de la conexión de datos dentro de un repositorio y sus conjuntos de datos son esenciales para un nuevo análisis exitoso. Por lo tanto, aprender a manejar los datos de acuerdo con sus metadatos y si es necesario, mejorar la anotación de datos y estratificar los metadatos actuales, serán parte del objetivo en el que se centrará.

Project outcomes and impact

TBA

Mindy Stephania Muñoz

Project summary

Project outcomes and impact

Socios de CABANA

Fondos