diff --git a/Dissertation.org b/Dissertation.org index 9fbab87..592896f 100644 --- a/Dissertation.org +++ b/Dissertation.org @@ -392,6 +392,13 @@ El entrenamiento del modelo se realiza, a partir de 2 archivos FASTQ, en diferen 9. Obtención de las métricas que miden el rendimiento del modelo ** Reproducibilidad + +La reproducibilidad de los experimentos en la ciencia es un elemento esencial en el método científico, el cual asegura que una técnica novedosa ofrece resultados verídicos. Actualmente, nos encontramos en un montón de crisis de ésta donde el 70% de los investigadores han fallado al tratar de replicar el estudio de otro científico cite:Baker_2016. + +Asimismo, en el ámbito de la informática pocos experimentos computacionales son documentados de forma precisa. Por lo general, no existe un registro del flujo de trabajo, la configuración del /hardware/ y el /software/ del equipo, la configuración de los parámetros o las secuencias de invocación de funciones. El código fuente a menudo se revisa sin dejar constancia de ello. Además de dificultar la reproducibilidad de los resultados, estas prácticas acaban impidiendo la productividad de los propios investigadores cite:Stodden13publishingstandards. + +Recientemente, han surgido nuevos enfoques para lidiar con este problema desde el punto de vista de la resolución de dependencias de un proyecto /software/. En este proyecto, usamos el gestor de paquetes Nix cite:inproceedings, para garantizar que los resultados que obtenemos son reproducibles, en cualquier máquina. + * Resultados El algoritmo de /Deep Learning/ fue entrenado con un /dataset/ sintético de las secuencias de la región CDR3 del TCR. En concreto, se generó un dataset de 20,000 secuencias, procedentes de una simulación de secuenciación (reproducida durante 100 iteraciones), de 200 secuencias únicas. Este /dataset/ se proporciona en el repositorio de locimend. diff --git a/Dissertation.pdf b/Dissertation.pdf index 46b9c13..41a1959 100644 Binary files a/Dissertation.pdf and b/Dissertation.pdf differ diff --git a/assets/bibliography.bib b/assets/bibliography.bib index 5aa127a..d6ac74e 100644 --- a/assets/bibliography.bib +++ b/assets/bibliography.bib @@ -1420,3 +1420,25 @@ url = {http://dx.doi.org/10.1016/j.matcom.2020.07.011}, publisher = {Elsevier BV} } + +@Article{Baker_2016, + author = {Baker, Monya}, + title = {1,500 scientists lift the lid on reproducibility}, + journal = {Nature}, + year = 2016, + volume = 533, + number = 7604, + month = {May}, + pages = {452–454}, + issn = {1476-4687}, + doi = {10.1038/533452a}, + url = {http://dx.doi.org/10.1038/533452a}, + publisher = {Springer Science and Business Media LLC} +} + +@MISC{Stodden13publishingstandards, + author = {Victoria Stodden and Jonathan Borwein and David H. Bailey}, + title = {Publishing Standards for Computational Science: “Setting + the Default to Reproducible”}, + year = 2013 +}