Add consensus sequence figure
This commit is contained in:
parent
91aaa82a86
commit
d8da37359b
|
@ -62,7 +62,9 @@ Aunque las tecnologías de secuenciación paralelas (NGS) han revolucionado el e
|
||||||
|
|
||||||
Para contrarrestar este obstáculo, varias técnicas mitigatorias se han puesto en marcha. Una de las más populares es el uso de una secuencia de consenso, que es un perfil estadístico a partir de un alineamiento múltiple de secuencias. Es una forma básica de descubrimiento de patrones, en la que un alineamiento múltiple de secuencias más amplio se resume en las características que se conservan. Este tipo de análisis permite determinar la probabilidad de cada base en cada posición de una secuencia. cite:10.1093/bioinformatics/btg109
|
Para contrarrestar este obstáculo, varias técnicas mitigatorias se han puesto en marcha. Una de las más populares es el uso de una secuencia de consenso, que es un perfil estadístico a partir de un alineamiento múltiple de secuencias. Es una forma básica de descubrimiento de patrones, en la que un alineamiento múltiple de secuencias más amplio se resume en las características que se conservan. Este tipo de análisis permite determinar la probabilidad de cada base en cada posición de una secuencia. cite:10.1093/bioinformatics/btg109
|
||||||
|
|
||||||
# TODO Find an appropriate figure
|
#+CAPTION: Alineamiento múltiple de secuencias. La secuencia de consenso aparece en la parte inferior y está formada por los nucleótidos que más aparecen en cada posición. cite:Nagar2013
|
||||||
|
#+label: fig:consensus-sequence
|
||||||
|
[[./assets/figures/consensus-sequence.png]]
|
||||||
|
|
||||||
Todas las técnicas de consenso monocatenarias reducen los errores en dos o tres órdenes de magnitud, lo que es mucho mayor que cualquier enfoque computacional o bioquímico anterior, y permiten identificar con precisión variantes raras por debajo del 0.1% de abundancia. Sin embargo, persisten algunos errores. Los errores que se producen durante la primera ronda de amplificación pueden propagarse a todas las demás copias escapando la corrección. cite:Salk2018
|
Todas las técnicas de consenso monocatenarias reducen los errores en dos o tres órdenes de magnitud, lo que es mucho mayor que cualquier enfoque computacional o bioquímico anterior, y permiten identificar con precisión variantes raras por debajo del 0.1% de abundancia. Sin embargo, persisten algunos errores. Los errores que se producen durante la primera ronda de amplificación pueden propagarse a todas las demás copias escapando la corrección. cite:Salk2018
|
||||||
|
|
||||||
|
@ -82,7 +84,8 @@ En el timo, durante el desarrollo de los linfocitos T, se selecciona al azar un
|
||||||
Debido a la diversidad de uniones, las moléculas de anticuerpos y TCR muestran la mayor variabilidad, que forman la región determinante de la complementariedad 3 (CDR3). De hecho, debido a la diversidad de uniones, el número de secuencias de aminoácidos que están presentes en las regiones CDR3 de las de las moléculas de Ig y TCR es mucho mayor que el número que pueden ser codificadas por segmentos de genes de la línea germinal. cite:abbas_lichtman_pillai_2017
|
Debido a la diversidad de uniones, las moléculas de anticuerpos y TCR muestran la mayor variabilidad, que forman la región determinante de la complementariedad 3 (CDR3). De hecho, debido a la diversidad de uniones, el número de secuencias de aminoácidos que están presentes en las regiones CDR3 de las de las moléculas de Ig y TCR es mucho mayor que el número que pueden ser codificadas por segmentos de genes de la línea germinal. cite:abbas_lichtman_pillai_2017
|
||||||
|
|
||||||
Frente a la evidencia recaudada, diversos métodos computacionales basados en la inteligencia artificial se aplican para aliviar estos impedimentos.
|
Frente a la evidencia recaudada, diversos métodos computacionales basados en la inteligencia artificial se aplican para aliviar estos impedimentos.
|
||||||
|
** Inteligencia artificial
|
||||||
|
** Hacia el Deep Learning
|
||||||
* Estado del arte
|
* Estado del arte
|
||||||
** Bioinformática
|
** Bioinformática
|
||||||
** Deep Learning
|
** Deep Learning
|
||||||
|
|
BIN
Dissertation.pdf
BIN
Dissertation.pdf
Binary file not shown.
|
@ -517,3 +517,48 @@
|
||||||
url = {https://doi.org/10.1093/bioinformatics/btg109},
|
url = {https://doi.org/10.1093/bioinformatics/btg109},
|
||||||
eprint = {https://academic.oup.com/bioinformatics/article-pdf/19/8/999/642375/btg109.pdf},
|
eprint = {https://academic.oup.com/bioinformatics/article-pdf/19/8/999/642375/btg109.pdf},
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@Article{Nagar2013,
|
||||||
|
author = {Nagar, Anurag and Hahsler, Michael},
|
||||||
|
title = {Fast discovery and visualization of conserved regions in
|
||||||
|
DNA sequences using quasi-alignment},
|
||||||
|
journal = {BMC Bioinformatics},
|
||||||
|
year = 2013,
|
||||||
|
month = {Sep},
|
||||||
|
day = 13,
|
||||||
|
volume = 14,
|
||||||
|
number = 11,
|
||||||
|
pages = {S2},
|
||||||
|
abstract = {Next Generation Sequencing techniques are producing
|
||||||
|
enormous amounts of biological sequence data and analysis
|
||||||
|
becomes a major computational problem. Currently, most
|
||||||
|
analysis, especially the identification of conserved regions,
|
||||||
|
relies heavily on Multiple Sequence Alignment and its various
|
||||||
|
heuristics such as progressive alignment, whose run time grows
|
||||||
|
with the square of the number and the length of the aligned
|
||||||
|
sequences and requires significant computational resources. In
|
||||||
|
this work, we present a method to efficiently discover regions
|
||||||
|
of high similarity across multiple sequences without
|
||||||
|
performing expensive sequence alignment. The method is based
|
||||||
|
on approximating edit distance between segments of sequences
|
||||||
|
using p-mer frequency counts. Then, efficient high-throughput
|
||||||
|
data stream clustering is used to group highly similar
|
||||||
|
segments into so called quasi-alignments. Quasi-alignments
|
||||||
|
have numerous applications such as identifying species and
|
||||||
|
their taxonomic class from sequences, comparing sequences for
|
||||||
|
similarities, and, as in this paper, discovering conserved
|
||||||
|
regions across related sequences.},
|
||||||
|
issn = {1471-2105},
|
||||||
|
doi = {10.1186/1471-2105-14-S11-S2},
|
||||||
|
url = {https://doi.org/10.1186/1471-2105-14-S11-S2}
|
||||||
|
}
|
||||||
|
|
||||||
|
@book{book:771224,
|
||||||
|
title = {Artificial Intelligence: A Modern Approach},
|
||||||
|
author = {Stuart Russell, Peter Norvig},
|
||||||
|
publisher = {Prentice Hall},
|
||||||
|
isbn = {0136042597, 9780136042594},
|
||||||
|
year = 2010,
|
||||||
|
series = {Prentice Hall Series in Artificial Intelligence},
|
||||||
|
edition = {3rd}
|
||||||
|
}
|
||||||
|
|
Binary file not shown.
After Width: | Height: | Size: 392 KiB |
Loading…
Reference in New Issue