Add consensus sequence figure

This commit is contained in:
coolneng 2021-06-30 01:45:45 +02:00
parent 91aaa82a86
commit d8da37359b
Signed by: coolneng
GPG Key ID: 9893DA236405AF57
4 changed files with 50 additions and 2 deletions

View File

@ -62,7 +62,9 @@ Aunque las tecnologías de secuenciación paralelas (NGS) han revolucionado el e
Para contrarrestar este obstáculo, varias técnicas mitigatorias se han puesto en marcha. Una de las más populares es el uso de una secuencia de consenso, que es un perfil estadístico a partir de un alineamiento múltiple de secuencias. Es una forma básica de descubrimiento de patrones, en la que un alineamiento múltiple de secuencias más amplio se resume en las características que se conservan. Este tipo de análisis permite determinar la probabilidad de cada base en cada posición de una secuencia. cite:10.1093/bioinformatics/btg109 Para contrarrestar este obstáculo, varias técnicas mitigatorias se han puesto en marcha. Una de las más populares es el uso de una secuencia de consenso, que es un perfil estadístico a partir de un alineamiento múltiple de secuencias. Es una forma básica de descubrimiento de patrones, en la que un alineamiento múltiple de secuencias más amplio se resume en las características que se conservan. Este tipo de análisis permite determinar la probabilidad de cada base en cada posición de una secuencia. cite:10.1093/bioinformatics/btg109
# TODO Find an appropriate figure #+CAPTION: Alineamiento múltiple de secuencias. La secuencia de consenso aparece en la parte inferior y está formada por los nucleótidos que más aparecen en cada posición. cite:Nagar2013
#+label: fig:consensus-sequence
[[./assets/figures/consensus-sequence.png]]
Todas las técnicas de consenso monocatenarias reducen los errores en dos o tres órdenes de magnitud, lo que es mucho mayor que cualquier enfoque computacional o bioquímico anterior, y permiten identificar con precisión variantes raras por debajo del 0.1% de abundancia. Sin embargo, persisten algunos errores. Los errores que se producen durante la primera ronda de amplificación pueden propagarse a todas las demás copias escapando la corrección. cite:Salk2018 Todas las técnicas de consenso monocatenarias reducen los errores en dos o tres órdenes de magnitud, lo que es mucho mayor que cualquier enfoque computacional o bioquímico anterior, y permiten identificar con precisión variantes raras por debajo del 0.1% de abundancia. Sin embargo, persisten algunos errores. Los errores que se producen durante la primera ronda de amplificación pueden propagarse a todas las demás copias escapando la corrección. cite:Salk2018
@ -82,7 +84,8 @@ En el timo, durante el desarrollo de los linfocitos T, se selecciona al azar un
Debido a la diversidad de uniones, las moléculas de anticuerpos y TCR muestran la mayor variabilidad, que forman la región determinante de la complementariedad 3 (CDR3). De hecho, debido a la diversidad de uniones, el número de secuencias de aminoácidos que están presentes en las regiones CDR3 de las de las moléculas de Ig y TCR es mucho mayor que el número que pueden ser codificadas por segmentos de genes de la línea germinal. cite:abbas_lichtman_pillai_2017 Debido a la diversidad de uniones, las moléculas de anticuerpos y TCR muestran la mayor variabilidad, que forman la región determinante de la complementariedad 3 (CDR3). De hecho, debido a la diversidad de uniones, el número de secuencias de aminoácidos que están presentes en las regiones CDR3 de las de las moléculas de Ig y TCR es mucho mayor que el número que pueden ser codificadas por segmentos de genes de la línea germinal. cite:abbas_lichtman_pillai_2017
Frente a la evidencia recaudada, diversos métodos computacionales basados en la inteligencia artificial se aplican para aliviar estos impedimentos. Frente a la evidencia recaudada, diversos métodos computacionales basados en la inteligencia artificial se aplican para aliviar estos impedimentos.
** Inteligencia artificial
** Hacia el Deep Learning
* Estado del arte * Estado del arte
** Bioinformática ** Bioinformática
** Deep Learning ** Deep Learning

Binary file not shown.

View File

@ -517,3 +517,48 @@
url = {https://doi.org/10.1093/bioinformatics/btg109}, url = {https://doi.org/10.1093/bioinformatics/btg109},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/19/8/999/642375/btg109.pdf}, eprint = {https://academic.oup.com/bioinformatics/article-pdf/19/8/999/642375/btg109.pdf},
} }
@Article{Nagar2013,
author = {Nagar, Anurag and Hahsler, Michael},
title = {Fast discovery and visualization of conserved regions in
DNA sequences using quasi-alignment},
journal = {BMC Bioinformatics},
year = 2013,
month = {Sep},
day = 13,
volume = 14,
number = 11,
pages = {S2},
abstract = {Next Generation Sequencing techniques are producing
enormous amounts of biological sequence data and analysis
becomes a major computational problem. Currently, most
analysis, especially the identification of conserved regions,
relies heavily on Multiple Sequence Alignment and its various
heuristics such as progressive alignment, whose run time grows
with the square of the number and the length of the aligned
sequences and requires significant computational resources. In
this work, we present a method to efficiently discover regions
of high similarity across multiple sequences without
performing expensive sequence alignment. The method is based
on approximating edit distance between segments of sequences
using p-mer frequency counts. Then, efficient high-throughput
data stream clustering is used to group highly similar
segments into so called quasi-alignments. Quasi-alignments
have numerous applications such as identifying species and
their taxonomic class from sequences, comparing sequences for
similarities, and, as in this paper, discovering conserved
regions across related sequences.},
issn = {1471-2105},
doi = {10.1186/1471-2105-14-S11-S2},
url = {https://doi.org/10.1186/1471-2105-14-S11-S2}
}
@book{book:771224,
title = {Artificial Intelligence: A Modern Approach},
author = {Stuart Russell, Peter Norvig},
publisher = {Prentice Hall},
isbn = {0136042597, 9780136042594},
year = 2010,
series = {Prentice Hall Series in Artificial Intelligence},
edition = {3rd}
}

Binary file not shown.

After

Width:  |  Height:  |  Size: 392 KiB