Add project planning section

This commit is contained in:
coolneng 2021-07-07 02:31:57 +02:00
parent 43fdd47d47
commit fc6aac05d5
Signed by: coolneng
GPG Key ID: 9893DA236405AF57
5 changed files with 36 additions and 1 deletions

View File

@ -279,6 +279,26 @@ El uso de /Deep Learning/ para la corrección de errores de secuenciación es un
5. Introducción al uso de Tensorflow y Keras para /Deep Learning/
6. Estudio de aplicación de Tensorflow/Keras a la corrección de errores de secuenciación en base a los datos sintetizados previamente
* Planificación del proyecto
El presente proyecto pertenece al ámbito de la bioinformática, lo cual implica que es un trabajo interdisciplinar. Por lo tanto, se requiere una formación previa en ciertos ámbitos. En particular, fue necesario un estudio de las bases bioquímicas, las /NGS/, la recombinación VDJ, el lenguaje de programación R, el /Deep Learning/ y el funcionamiento de Tensorflow y Keras.
El proyecto se divide en 2 partes:
- locigenesis: Generación y secuenciación /in silico/ de CDR3
- locimend: Corrección de los errores de secuenciación del ADN
La razón de esta segmentación se expone en la sección siguiente.
#+CAPTION: Cronograma del proyecto
#+ATTR_HTML: :height 30% :width 90%
#+NAME: fig:gantt
[[./assets/figures/gantt.png]]
La estimación temporal inicial del proyecto no se vio representada por la implementación real del susodicho. Tanto la extracción de CDR3 mediante alineamiento múltiple, como el preprocesamiento de las secuencias para el uso de Tensorflow ocuparon la mayor parte de la implementación del sistema.
Estas observaciones no son sorprendentes, en la práctica se ha comprobado que el preprocesamiento de los datos supone aproximadamente el 80% del esfuerzo total del proceso de /machine learning/ cite:Zhang_2003. Incorporamos esta información a nuestro bagaje académico, como una forma de /feedback/ positivo para mejorar la estimación temporal de los futuros proyectos relacionados con el /machine learning/.
* Diseño y descripción del sistema
La finalidad de este proyecto es el desarrollo de un /pipeline/, con el objetivo de crear un algoritmo de /Deep Learning/ capaz de corregir errores de secuenciación en secuencias de ADN, en particular, en la región CDR3 del TCR.

Binary file not shown.

View File

@ -470,7 +470,7 @@
\textbf{Autor}\\ {$author$}\\[2.5ex]
\textbf{Directores}\\
{Carlos Cano Gutiérrez}\\[0.3cm]
{Carlos Cano Gutiérrez}\\[2.5ex]
\textbf{Mentores}\\
{María Soledad Benítez Cantos}\\[2cm]
\includegraphics[width=0.3\textwidth]{assets/logo-ceuta.jpg}\\[0.1cm]

View File

@ -1356,3 +1356,18 @@
year = 2019,
note = {R package version 2.50.2},
}
@Article{Zhang_2003,
author = {Zhang, Shichao and Zhang, Chengqi and Yang, Qiang},
title = {Data preparation for data mining},
journal = {Applied Artificial Intelligence},
year = 2003,
volume = 17,
number = {5-6},
month = {May},
pages = {375381},
issn = {1087-6545},
doi = {10.1080/713827180},
url = {http://dx.doi.org/10.1080/713827180},
publisher = {Informa UK Limited}
}

BIN
assets/figures/gantt.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 69 KiB