diff --git a/Dissertation.org b/Dissertation.org index f551ed3..1bc0e0d 100644 --- a/Dissertation.org +++ b/Dissertation.org @@ -394,16 +394,23 @@ El entrenamiento del modelo se realiza, a partir de 2 archivos FASTQ, en diferen ** Reproducibilidad * Resultados -Dataset 200 secuencias 100 lecturas cada una -Training time 23 minutes +El algoritmo de /Deep Learning/ fue entrenado con un /dataset/ sintético de las secuencias de la región CDR3 del TCR. En concreto, se generó un dataset de 20,000 secuencias, procedentes de una simulación de secuenciación (reproducida durante 100 iteraciones), de 200 secuencias únicas. Este /dataset/ se proporciona en el repositorio de locimend. -#+CAPTION: Rendimiento de locimend con los diferentes /datasets/ +Dado que los conjuntos de datos de entrenamiento estaban completamente anotados (\ie aprendizaje supervisado), el problema se formuló como una tarea de clasificación binaria supervisada de predicción de una base dada como error/no error, y el rendimiento se midió en unos /datasets/ de validación y de test. + +El entrenamiento del modelo de /Deep Learning/ se efectuó en un PC con un procesador Ryzen 5 2600X (6 núcleos, 12 hebras) y 16 GB de RAM. El tiempo necesario para realizarlo fue de 23 minutos. + +Presentamos las métricas obtenidas al finalizar el entrenamiento de locimend: + +#+CAPTION: Rendimiento de locimend con cada /dataset/ #+NAME: tab:results | Dataset | Accuracy | AUC | |------------+----------+------| | Validación | 0.89 | 0.98 | | Test | 0.89 | 0.98 | +En definitiva, locimend adquirió una gran capacidad para discernir entre entre nucleótidos erróneos y correctos, en ambos /datasets/, con una precisión de 0.89 y un área bajo la curva (AUC) de 0.98. + * Conclusiones * Futuras mejoras * Bibliografía diff --git a/Dissertation.pdf b/Dissertation.pdf index 5962390..c05a88f 100644 Binary files a/Dissertation.pdf and b/Dissertation.pdf differ