Add results section

2021-07-07 03:47:14 +02:00 · 2021-07-07 03:47:14 +02:00 · a9c1ac1b69
commit a9c1ac1b69
parent 6b60af04f7
2 changed files with 10 additions and 3 deletions
--- a/Dissertation.org
+++ b/Dissertation.org
@ -394,16 +394,23 @@ El entrenamiento del modelo se realiza, a partir de 2 archivos FASTQ, en diferen
 ** Reproducibilidad
 * Resultados

-Dataset 200 secuencias 100 lecturas cada una
-Training time 23 minutes
+El algoritmo de /Deep Learning/ fue entrenado con un /dataset/ sintético de las secuencias de la región CDR3 del TCR. En concreto, se generó un dataset de 20,000 secuencias, procedentes de una simulación de secuenciación (reproducida durante 100 iteraciones), de 200 secuencias únicas. Este /dataset/ se proporciona en el repositorio de locimend.

-#+CAPTION: Rendimiento de locimend con los diferentes /datasets/
+Dado que los conjuntos de datos de entrenamiento estaban completamente anotados (\ie aprendizaje supervisado), el problema se formuló como una tarea de clasificación binaria supervisada de predicción de una base dada como error/no error, y el rendimiento se midió en unos /datasets/ de validación y de test.
+
+El entrenamiento del modelo de /Deep Learning/ se efectuó en un PC con un procesador Ryzen 5 2600X (6 núcleos, 12 hebras) y 16 GB de RAM. El tiempo necesario para realizarlo fue de 23 minutos.
+
+Presentamos las métricas obtenidas al finalizar el entrenamiento de locimend:
+
+#+CAPTION: Rendimiento de locimend con cada /dataset/
 #+NAME: tab:results
 | Dataset    | Accuracy |  AUC |
 |------------+----------+------|
 | Validación |     0.89 | 0.98 |
 | Test       |     0.89 | 0.98 |

+En definitiva, locimend adquirió una gran capacidad para discernir entre entre nucleótidos erróneos y correctos, en ambos /datasets/, con una precisión de 0.89 y un área bajo la curva (AUC) de 0.98.
+
 * Conclusiones
 * Futuras mejoras
 * Bibliografía
--- a/Dissertation.pdf
+++ b/Dissertation.pdf