Add results section

This commit is contained in:
coolneng 2021-07-07 03:47:14 +02:00
parent 6b60af04f7
commit a9c1ac1b69
Signed by: coolneng
GPG Key ID: 9893DA236405AF57
2 changed files with 10 additions and 3 deletions

View File

@ -394,16 +394,23 @@ El entrenamiento del modelo se realiza, a partir de 2 archivos FASTQ, en diferen
** Reproducibilidad
* Resultados
Dataset 200 secuencias 100 lecturas cada una
Training time 23 minutes
El algoritmo de /Deep Learning/ fue entrenado con un /dataset/ sintético de las secuencias de la región CDR3 del TCR. En concreto, se generó un dataset de 20,000 secuencias, procedentes de una simulación de secuenciación (reproducida durante 100 iteraciones), de 200 secuencias únicas. Este /dataset/ se proporciona en el repositorio de locimend.
#+CAPTION: Rendimiento de locimend con los diferentes /datasets/
Dado que los conjuntos de datos de entrenamiento estaban completamente anotados (\ie aprendizaje supervisado), el problema se formuló como una tarea de clasificación binaria supervisada de predicción de una base dada como error/no error, y el rendimiento se midió en unos /datasets/ de validación y de test.
El entrenamiento del modelo de /Deep Learning/ se efectuó en un PC con un procesador Ryzen 5 2600X (6 núcleos, 12 hebras) y 16 GB de RAM. El tiempo necesario para realizarlo fue de 23 minutos.
Presentamos las métricas obtenidas al finalizar el entrenamiento de locimend:
#+CAPTION: Rendimiento de locimend con cada /dataset/
#+NAME: tab:results
| Dataset | Accuracy | AUC |
|------------+----------+------|
| Validación | 0.89 | 0.98 |
| Test | 0.89 | 0.98 |
En definitiva, locimend adquirió una gran capacidad para discernir entre entre nucleótidos erróneos y correctos, en ambos /datasets/, con una precisión de 0.89 y un área bajo la curva (AUC) de 0.98.
* Conclusiones
* Futuras mejoras
* Bibliografía

Binary file not shown.