Add consensus sequence figure

2021-06-30 01:45:45 +02:00 · 2021-06-30 01:45:45 +02:00 · d8da37359b
commit d8da37359b
parent 91aaa82a86
4 changed files with 50 additions and 2 deletions
--- a/Dissertation.org
+++ b/Dissertation.org
@ -62,7 +62,9 @@ Aunque las tecnologías de secuenciación paralelas (NGS) han revolucionado el e
 Para contrarrestar este obstáculo, varias técnicas mitigatorias se han puesto en marcha. Una de las más populares es el uso de una secuencia de consenso, que es un perfil estadístico a partir de un alineamiento múltiple de secuencias. Es una forma básica de descubrimiento de patrones, en la que un alineamiento múltiple de secuencias más amplio se resume en las características que se conservan. Este tipo de análisis permite determinar la probabilidad de cada base en cada posición de una secuencia. cite:10.1093/bioinformatics/btg109
-# TODO Find an appropriate figure
+#+CAPTION: Alineamiento múltiple de secuencias. La secuencia de consenso aparece en la parte inferior y está formada por los nucleótidos que más aparecen en cada posición. cite:Nagar2013
 #+label: fig:consensus-sequence
 [[./assets/figures/consensus-sequence.png]]
 Todas las técnicas de consenso monocatenarias reducen los errores en dos o tres órdenes de magnitud, lo que es mucho mayor que cualquier enfoque computacional o bioquímico anterior, y permiten identificar con precisión variantes raras por debajo del 0.1% de abundancia. Sin embargo, persisten algunos errores. Los errores que se producen durante la primera ronda de amplificación pueden propagarse a todas las demás copias escapando la corrección. cite:Salk2018
@ -82,7 +84,8 @@ En el timo, durante el desarrollo de los linfocitos T, se selecciona al azar un
 Debido a la diversidad de uniones, las moléculas de anticuerpos y TCR muestran la mayor variabilidad, que forman la región determinante de la complementariedad 3 (CDR3). De hecho, debido a la diversidad de uniones, el número de secuencias de aminoácidos que están presentes en las regiones CDR3 de las de las moléculas de Ig y TCR es mucho mayor que el número que pueden ser codificadas por segmentos de genes de la línea germinal. cite:abbas_lichtman_pillai_2017
 Frente a la evidencia recaudada, diversos métodos computacionales basados en la inteligencia artificial se aplican para aliviar estos impedimentos.
-
+** Inteligencia artificial
 ** Hacia el Deep Learning
 * Estado del arte
 ** Bioinformática
 ** Deep Learning
--- a/Dissertation.pdf
+++ b/Dissertation.pdf
--- a/assets/bibliography.bib
+++ b/assets/bibliography.bib
@ -517,3 +517,48 @@
  url             = {https://doi.org/10.1093/bioinformatics/btg109},
  eprint          = {https://academic.oup.com/bioinformatics/article-pdf/19/8/999/642375/btg109.pdf},
 }
@Article{Nagar2013,
  author          = {Nagar, Anurag and Hahsler, Michael},
  title           = {Fast discovery and visualization of conserved regions in
                  DNA sequences using quasi-alignment},
  journal         = {BMC Bioinformatics},
  year            = 2013,
  month           = {Sep},
  day             = 13,
  volume          = 14,
  number          = 11,
  pages           = {S2},
  abstract        = {Next Generation Sequencing techniques are producing
                  enormous amounts of biological sequence data and analysis
                  becomes a major computational problem. Currently, most
                  analysis, especially the identification of conserved regions,
                  relies heavily on Multiple Sequence Alignment and its various
                  heuristics such as progressive alignment, whose run time grows
                  with the square of the number and the length of the aligned
                  sequences and requires significant computational resources. In
                  this work, we present a method to efficiently discover regions
                  of high similarity across multiple sequences without
                  performing expensive sequence alignment. The method is based
                  on approximating edit distance between segments of sequences
                  using p-mer frequency counts. Then, efficient high-throughput
                  data stream clustering is used to group highly similar
                  segments into so called quasi-alignments. Quasi-alignments
                  have numerous applications such as identifying species and
                  their taxonomic class from sequences, comparing sequences for
                  similarities, and, as in this paper, discovering conserved
                  regions across related sequences.},
  issn            = {1471-2105},
  doi             = {10.1186/1471-2105-14-S11-S2},
  url             = {https://doi.org/10.1186/1471-2105-14-S11-S2}
 }
@book{book:771224,
  title           = {Artificial Intelligence: A Modern Approach},
  author          = {Stuart Russell, Peter Norvig},
  publisher       = {Prentice Hall},
  isbn            = {0136042597, 9780136042594},
  year            = 2010,
  series          = {Prentice Hall Series in Artificial Intelligence},
  edition         = {3rd}
 }
--- a/assets/figures/consensus-sequence.png
+++ b/assets/figures/consensus-sequence.png