diff --git a/Dissertation.org b/Dissertation.org index 58b27d3..db83dae 100644 --- a/Dissertation.org +++ b/Dissertation.org @@ -103,7 +103,6 @@ El estudio se basa en la conjetura de que cada aspecto del aprendizaje o cualqui A finales de los años 1960, los investigadores se toparon con numerosos obstáculos al tratar de usar sus sistemas para resolver problemas más complejos. Debido a una carencia de resultados decisivos, la financiación en este ámbito académico fue cancelada. cite:book:771224 Los sistemas de conocimiento (década de 1970) aprovecharon conocimiento específico de una rama para escalar los sistemas inteligentes, intercambiando sistemas generales con bajo rendimiento por sistemas específicos al problema con mejor rendimiento. Estos sistemas novedosos se empezaron a comercializar en los años 80, creando la industria de la IA. cite:book:771224 - ** Redes neuronales artificiales Una red neuronal artificial es un modelo de computación bioinspirado, formado por capas de neuronas artificiales. Comenzaremos definiendo el concepto de neurona artificial, con el fin de introducir la noción de red neuronal artificial de forma clara y concisa. @@ -149,7 +148,7 @@ El /gradient descent/ es una forma de minimizar una función objetivo parametriz #+CAPTION: Diagrama del algoritmo de /gradient descent/. Comenzando en el punto inicial $w^0$ hacemos nuestra primera aproximación a $g(w)$ en el punto $(w^0,g(w^0))$ en la función (mostrada como un punto negro hueco) con la aproximación en serie de Taylor de primer orden dibujada en rojo. Moviéndonos en la dirección de descenso del gradiente negativo proporcionada por esta aproximación llegamos a un punto $w^1=w^0-\alpha\frac{d}{dw}g(w^0)$. A continuación, repetimos este proceso en $w^1$, moviéndonos en la dirección del gradiente negativo allí, y así sucesivamente. cite:book:2530718 #+ATTR_HTML: :height 25% :width 80% -#+NAME: fig:central-dogma +#+NAME: fig:gradient-descent [[./assets/figures/gradient-descent.png]] \clearpage @@ -166,8 +165,39 @@ Este proceso, junto con sus variantes, es el algoritmo de optimización local m ** Hacia el Deep Learning -En la actualidad, los avances tanto en potencia de cálculo del /hardware/, especialmente en las tarjetas gráficas (GPU) cite:Cireşan2010, como la disponibilidad de grandes /datasets/ cite:book:771224 han dado lugar al /Deep Learning/. +El /Deep Learning/ es un subconjunto del /machine learning/, en el cual se utiliza como modelo de computación las redes neuronales artificiales (ANN), con múltiples capas ocultas. Este enfoque trata de resolver el problema de una buena capacidad expresiva de las redes neuronales, sin el aumento exponencial del número de neuronas. cite:DBLP:journals/corr/WangRX17 +#+CAPTION: Diferencia entre inteligencia artificial, /machine learning/ y /deep learning/ +#+ATTR_HTML: :height 25% :width 80% +#+NAME: fig:ai-ml-dl +[[./assets/figures/ai-ml-dl.png]] + +La pregunta sobre cómo mantener esta capacidad expresiva de la red y al mismo tiempo reducir el número de unidades de cálculo se ha planteado durante años. Intuitivamente, se sugirió que es natural buscar redes más profundas porque 1) el sistema neuronal humano es una arquitectura profunda y 2) los humanos tienden a representar conceptos en un nivel de abstracción como la composición de conceptos en niveles inferiores. Actualmente, la solución es construir arquitecturas más profundas, \ie redes neuronales con más capas ocultas. cite:DBLP:journals/corr/WangRX17 + +En la actualidad, los avances tanto en potencia de cálculo del /hardware/, especialmente en las tarjetas gráficas (GPU) cite:Cireşan2010, junto con la disponibilidad de grandes /datasets/ cite:book:771224 han permitido que esta disciplina prospere. + +Este área de conocimiento ha mejorado drásticamente el estado del arte en muchas tareas de inteligencia artificial, como la detección de objetos, el reconocimiento del habla o la traducción automática. Su naturaleza de arquitectura profunda otorga al aprendizaje profundo la posibilidad de resolver muchas tareas de IA más complicadas. cite:DBLP:journals/corr/WangRX17 Como resultado, los investigadores están extendiendo el aprendizaje profundo a una variedad de diferentes dominios y tareas modernas: + +- Eliminación del ruido en las señales de voz +- Descubrimiento de patrones de agrupación de expresiones genéticas +- Generación de imágenes con distintos estilos +- Análisis de sentimientos de diferentes fuentes simultáneas +** Bioinformática + +La bioinformática es un campo interdisciplinar en el que intervienen principalmente la biología molecular y la genética, la informática, las matemáticas y la estadística. Los problemas biológicos a gran escala y con gran cantidad de datos se abordan desde un punto de vista informático. Los problemas más comunes son el modelado de procesos biológicos a nivel molecular y la realización de inferencias a partir de los datos recogidos, cite:Can2014 en particular: + +#+CAPTION: Problemas clásicos de la bioinformática +#+NAME: tab:bioinformatics-problems +| Problema | Fuente de datos | +|--------------------------------------+------------------| +| Alineamiento de secuencias múltiples | ADN | +| Búsqueda de patrones de secuencias | ADN | +| Análisis evolutivos | ADN | +| Análisis de la función | Proteínas | +| Predicción de las estructuras | Proteínas | +| Estudio de las vías metabólicas | Redes biológicas | + +Es tentador atribuir los orígenes de la bioinformática a la reciente convergencia de la secuenciación del ADN, los proyectos genómicos a gran escala, Internet y los superordenadores. Sin embargo, algunos científicos que afirman que la bioinformática se encuentra en su infancia reconocen que los ordenadores eran herramientas importantes en la biología molecular una década antes de que la secuenciación del ADN se convirtiera en algo factible (década de los 1960). cite:Hagen2000 * Estado del arte ** Bioinformática diff --git a/Dissertation.pdf b/Dissertation.pdf index 43f8601..8c69bb4 100644 Binary files a/Dissertation.pdf and b/Dissertation.pdf differ diff --git a/assets/babathesis.latex b/assets/babathesis.latex index cf15d1d..2d2b4c4 100644 --- a/assets/babathesis.latex +++ b/assets/babathesis.latex @@ -331,7 +331,7 @@ \usepackage{booktabs} % Proper formatting of tables \usepackage{siunitx} % Proper formatting of units \usepackage{mhchem} % Proper formatting of chemicals -\usepackage{lipsum} % Insertion of arbitrary content +\usepackage{longtable} % Proper rendering of tables in pandoc @@ -395,6 +395,10 @@ \def\fps@figure{htbp} \makeatother +% Define tightlist +\providecommand{\tightlist}{% + \setlength{\itemsep}{0pt}\setlength{\parskip}{0pt}} + %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % diff --git a/assets/bibliography.bib b/assets/bibliography.bib index 2e4dbbf..2cf67ee 100644 --- a/assets/bibliography.bib +++ b/assets/bibliography.bib @@ -723,3 +723,52 @@ biburl = {https://dblp.org/rec/journals/corr/WangRX17.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} } + +@Inbook{Can2014, + author = "Can, Tolga", + editor = "Yousef, Malik and Allmer, Jens", + title = "Introduction to Bioinformatics", + bookTitle = "miRNomics: MicroRNA Biology and Computational Analysis", + year = 2014, + publisher = "Humana Press", + address = "Totowa, NJ", + pages = "51--71", + abstract = "Bioinformatics is an interdisciplinary field mainly + involving molecular biology and genetics, computer science, + mathematics, and statistics. Data intensive, large-scale + biological problems are addressed from a computational point + of view. The most common problems are modeling biological + processes at the molecular level and making inferences from + collected data. A bioinformatics solution usually involves the + following steps:Collect statistics from biological data.Build + a computational model.Solve a computational modeling + problem.Test and evaluate a computational algorithm.", + isbn = "978-1-62703-748-8", + doi = "10.1007/978-1-62703-748-8_4", + url = "https://doi.org/10.1007/978-1-62703-748-8_4" +} + + + +@Article{Hagen2000, + author = {Hagen, Joel B.}, + title = {The origins of bioinformatics}, + journal = {Nature Reviews Genetics}, + year = 2000, + month = {Dec}, + day = 01, + volume = 1, + number = 3, + pages = {231-236}, + abstract = {Bioinformatics is often described as being in its infancy, + but computers emerged as important tools in molecular biology + during the early 1960s. A decade before DNA sequencing became + feasible, computational biologists focused on the rapidly + accumulating data from protein biochemistry. Without the + benefits of supercomputers or computer networks, these + scientists laid important conceptual and technical foundations + for bioinformatics today.}, + issn = {1471-0064}, + doi = {10.1038/35042090}, + url = {https://doi.org/10.1038/35042090} +} diff --git a/assets/figures/ai-ml-dl.png b/assets/figures/ai-ml-dl.png new file mode 100644 index 0000000..fdcf263 Binary files /dev/null and b/assets/figures/ai-ml-dl.png differ