Add project planning section

2021-07-07 02:31:57 +02:00 · 2021-07-07 02:31:57 +02:00 · fc6aac05d5
parent 43fdd47d47
commit fc6aac05d5
5 changed files with 36 additions and 1 deletions
--- a/Dissertation.org
+++ b/Dissertation.org
@ -279,6 +279,26 @@ El uso de /Deep Learning/ para la corrección de errores de secuenciación es un
 5. Introducción al uso de Tensorflow y Keras para /Deep Learning/
 6. Estudio de aplicación de Tensorflow/Keras a la corrección de errores de secuenciación en base a los datos sintetizados previamente

+* Planificación del proyecto
+
+El presente proyecto pertenece al ámbito de la bioinformática, lo cual implica que es un trabajo interdisciplinar. Por lo tanto, se requiere una formación previa en ciertos ámbitos. En particular, fue necesario un estudio de las bases bioquímicas, las /NGS/, la recombinación VDJ, el lenguaje de programación R, el /Deep Learning/ y el funcionamiento de Tensorflow y Keras.
+
+El proyecto se divide en 2 partes:
+
+- locigenesis: Generación y secuenciación /in silico/ de CDR3
+- locimend: Corrección de los errores de secuenciación del ADN
+
+La razón de esta segmentación se expone en la sección siguiente.
+
+#+CAPTION: Cronograma del proyecto
+#+ATTR_HTML: :height 30% :width 90%
+#+NAME: fig:gantt
+[[./assets/figures/gantt.png]]
+
+La estimación temporal inicial del proyecto no se vio representada por la implementación real del susodicho. Tanto la extracción de CDR3 mediante alineamiento múltiple, como el preprocesamiento de las secuencias para el uso de Tensorflow ocuparon la mayor parte de la implementación del sistema.
+
+Estas observaciones no son sorprendentes, en la práctica se ha comprobado que el preprocesamiento de los datos supone aproximadamente el 80% del esfuerzo total del proceso de /machine learning/ cite:Zhang_2003. Incorporamos esta información a nuestro bagaje académico, como una forma de /feedback/ positivo para mejorar la estimación temporal de los futuros proyectos relacionados con el /machine learning/.
+
 * Diseño y descripción del sistema

 La finalidad de este proyecto es el desarrollo de un /pipeline/, con el objetivo de crear un algoritmo de /Deep Learning/ capaz de corregir errores de secuenciación en secuencias de ADN, en particular, en la región CDR3 del TCR.
--- a/Dissertation.pdf
+++ b/Dissertation.pdf
--- a/assets/babathesis.latex
+++ b/assets/babathesis.latex
@ -470,7 +470,7 @@

  \textbf{Autor}\\ {$author$}\\[2.5ex]
  \textbf{Directores}\\
-  {Carlos Cano Gutiérrez}\\[0.3cm]
+  {Carlos Cano Gutiérrez}\\[2.5ex]
  \textbf{Mentores}\\
  {María Soledad Benítez Cantos}\\[2cm]
  \includegraphics[width=0.3\textwidth]{assets/logo-ceuta.jpg}\\[0.1cm]
--- a/assets/bibliography.bib
+++ b/assets/bibliography.bib
@ -1356,3 +1356,18 @@
  year            = 2019,
  note            = {R package version 2.50.2},
 }
+
+@Article{Zhang_2003,
+  author          = {Zhang, Shichao and Zhang, Chengqi and Yang, Qiang},
+  title           = {Data preparation for data mining},
+  journal         = {Applied Artificial Intelligence},
+  year            = 2003,
+  volume          = 17,
+  number          = {5-6},
+  month           = {May},
+  pages           = {375–381},
+  issn            = {1087-6545},
+  doi             = {10.1080/713827180},
+  url             = {http://dx.doi.org/10.1080/713827180},
+  publisher       = {Informa UK Limited}
+}
--- a/assets/figures/gantt.png
+++ b/assets/figures/gantt.png