MH-P1/docs/Summary.org

#+TITLE: Práctica 1
#+SUBTITLE: Metaheurísticas
#+AUTHOR: Amin Kasrou Aouam
#+DATE: 2021-04-19
#+PANDOC_OPTIONS: template:~/.pandoc/templates/eisvogel.latex
#+PANDOC_OPTIONS: listings:t
#+PANDOC_OPTIONS: toc:t
#+PANDOC_METADATA: lang=es
#+PANDOC_METADATA: titlepage:t
#+PANDOC_METADATA: listings-no-page-break:t
#+PANDOC_METADATA: toc-own-page:t
#+PANDOC_METADATA: table-use-row-colors:t
#+PANDOC_METADATA: colorlinks:t
#+PANDOC_METADATA: logo:/home/coolneng/Photos/Logos/UGR.png
#+LaTeX_HEADER: \usepackage[ruled, lined, linesnumbered, commentsnumbered, longend]{algorithm2e}
* Práctica 1

** Introducción

En esta práctica, usaremos distintos algoritmos de búsqueda para resolver el problema de la máxima diversidad (MDP). Implementaremos:

- Algoritmo /Greedy/
- Algoritmo de búsqueda local

** Algoritmos

*** Greedy

El algoritmo /greedy/ añade de forma iterativa un punto, hasta conseguir una solución de tamaño m.

En primer lugar, seleccionamos el elemento más lejano de los demás (centroide), y lo añadimos en nuestro conjunto de elementos seleccionados. A éste, añadiremos en cada paso el elemento correspondiente según la medida del /MaxMin/. Ilustramos el algoritmo a continuación:

\begin{algorithm}
    \KwIn{A list $[a_i]$, $i=1, 2, \cdots, m$, that contains the chosen point and the distance}
    \KwOut{Processed list}

    $Sel = [\ ]$

    $centroid \leftarrow getFurthestElement()$

    \For{$i \leftarrow 0$ \KwTo $m$}{
        \For{$element$ in $Sel$}{
            $closestElements = [\ ]$

            $closestPoint \leftarrow getClosestPoint(element)$

            $closestElements.append(closestPoint)$
        }
        $maximum \leftarrow max(closestElements)$

        $Sel.append(maximum)$
    }
    \KwRet{$Sel$}
\end{algorithm}

*** Búsqueda local

El algoritmo de búsqueda local selecciona una solución aleatoria, de tamaño /m/, y explora durante un número máximo de iteraciones soluciones vecinas.

Para mejorar la eficiencia del algoritmo, usamos la heurística del primer mejor (selección de la primera solución vecina que mejora la actual). Ilustramos el algoritmo a continuación:

\begin{algorithm}
    \KwIn{A list $[a_i]$, $i=1, 2, \cdots, m$, the solution}
    \KwOut{Processed list}

    $Solutions = [\ ]$

    $firstSolution \leftarrow getRandomSolution()$

    $Solutions.append(firstSolution)$

    $lastSolution \leftarrow getLastElement(neighbour)$

    $maxIterations \leftarrow 1000$

    \For{$i \leftarrow 0$ \KwTo $maxIterations$}{
        \While{$neighbour \leq lastSolution$}{
            $neighbour \leftarrow getNeighbouringSolution(lastSolution)$

            $Solutions.append(neighbour)$

            $lastSolution \leftarrow getLastElement(neighbour)$
        }
        $finalSolution \leftarrow getLastElement(Solutions)$
    }
    \KwRet{$finalSolution$}
\end{algorithm}
** Implementación

La práctica ha sido implementada en /Python/, usando las siguientes bibliotecas:

- NumPy
- Pandas

*** Instalación

Para ejecutar el programa es preciso instalar Python, junto con las bibliotecas *Pandas* y *NumPy*.

Se proporciona el archivo shell.nix para facilitar la instalación de las dependencias, con el gestor de paquetes [[https://nixos.org/][Nix]]. Tras instalar la herramienta Nix, únicamente habría que ejecutar el siguiente comando en la raíz del proyecto:

#+begin_src shell
nix-shell
#+end_src

*** Ejecución

La ejecución del programa se realiza mediante el siguiente comando:

#+begin_src shell
python src/main.py <dataset> <algoritmo>
#+end_src

Los parámetros posibles son:

| dataset                              | algoritmo |
| Cualquier archivo de la carpeta data | greedy    |
|                                      | local     |

También se proporciona un script que ejecuta 3 iteraciones de ambos algoritmos, con cada uno de los /datasets/, y guarda los resultados en una hoja de cálculo. Se puede ejecutar mediante el siguiente comando:

#+begin_src shell
python src/execution.py
#+end_src

*Nota*: se precisa instalar la biblioteca [[https://xlsxwriter.readthedocs.io/][XlsxWriter]] para la exportación de los resultados a un archivo Excel.

** Análisis de los resultados

Los resultados obtenidos se encuentran en el archivo /algorithm-results.xlsx/, procedemos a analizar cada algoritmo por separado.

*** Algoritmo greedy

#+CAPTION: Algoritmo greedy
[[./assets/greedy.png]]

El algoritmo greedy es determinista, por lo tanto la desviación típica es prácticamente nula (varía en el tiempo de ejecución únicamente). El tiempo de ejecución varía considerablemente según el dataset:

- Dataset con n=500: 8-10 segundos
- Dataset con n=2000: 6-7 minutos

Por lo tanto, el algoritmo o la implementación de éste no escalan al aumentar el número de casos.

Las distancias obtenidas son considerablemente peores que las del algoritmo de búsqueda local, aunque hay que tener en cuenta que en la implementación del algoritmo de búsqueda local la distancia del primer elemento no es 0, lo cual tiene afecta el resultado final.

*** Algoritmo de búsqueda local

#+CAPTION: Algoritmo de búsqueda local
[[./assets/local.png]]

El algoritmo de búsqueda local es estocástico, debido a que para la obtención de cada una de las soluciones se utiliza un generador de números pseudoaleatorio. El tiempo de ejecución es prácticamente constante con cada dataset:

- Dataset con n=500: 1-3 segundos
- Dataset con n=2000: 8-12 segundos

Por lo tanto éste escala bien al aumentar el número de casos. Aún así, al realizar ciertas pruebas aumentando el número de iteraciones máximas, el rendimiento del algoritmo emperoaba considerablemente. Por este motivo, las ejecuciones de este algoritmo se han hecho con 100 iteraciones máximas.
Add algorithms pseudocode in the summary 2021-04-19 22:15:57 +02:00			`#+TITLE: Práctica 1`
			`#+SUBTITLE: Metaheurísticas`
			`#+AUTHOR: Amin Kasrou Aouam`
			`#+DATE: 2021-04-19`
			`#+PANDOC_OPTIONS: template:~/.pandoc/templates/eisvogel.latex`
			`#+PANDOC_OPTIONS: listings:t`
			`#+PANDOC_OPTIONS: toc:t`
			`#+PANDOC_METADATA: lang=es`
			`#+PANDOC_METADATA: titlepage:t`
			`#+PANDOC_METADATA: listings-no-page-break:t`
			`#+PANDOC_METADATA: toc-own-page:t`
			`#+PANDOC_METADATA: table-use-row-colors:t`
Add batch execution explanation to summary 2021-04-20 21:21:51 +02:00			`#+PANDOC_METADATA: colorlinks:t`
Add algorithms pseudocode in the summary 2021-04-19 22:15:57 +02:00			`#+PANDOC_METADATA: logo:/home/coolneng/Photos/Logos/UGR.png`
			`#+LaTeX_HEADER: \usepackage[ruled, lined, linesnumbered, commentsnumbered, longend]{algorithm2e}`
			`* Práctica 1`

			`** Introducción`

			`En esta práctica, usaremos distintos algoritmos de búsqueda para resolver el problema de la máxima diversidad (MDP). Implementaremos:`

			`- Algoritmo /Greedy/`
			`- Algoritmo de búsqueda local`

			`** Algoritmos`

			`*** Greedy`

			`El algoritmo /greedy/ añade de forma iterativa un punto, hasta conseguir una solución de tamaño m.`

			`En primer lugar, seleccionamos el elemento más lejano de los demás (centroide), y lo añadimos en nuestro conjunto de elementos seleccionados. A éste, añadiremos en cada paso el elemento correspondiente según la medida del /MaxMin/. Ilustramos el algoritmo a continuación:`

			`\begin{algorithm}`
			`\KwIn{A list $[a_i]$, $i=1, 2, \cdots, m$, that contains the chosen point and the distance}`
			`\KwOut{Processed list}`

			$Sel = [\ ]$

			$centroid \leftarrow getFurthestElement()$

			`\For{$i \leftarrow 0$ \KwTo $m$}{`
			`\For{$element$ in $Sel$}{`
			$closestElements = [\ ]$

			$closestPoint \leftarrow getClosestPoint(element)$

			$closestElements.append(closestPoint)$
			`}`
			$maximum \leftarrow max(closestElements)$

			$Sel.append(maximum)$
			`}`
			`\KwRet{$Sel$}`
			`\end{algorithm}`

			`*** Búsqueda local`

			`El algoritmo de búsqueda local selecciona una solución aleatoria, de tamaño /m/, y explora durante un número máximo de iteraciones soluciones vecinas.`

			`Para mejorar la eficiencia del algoritmo, usamos la heurística del primer mejor (selección de la primera solución vecina que mejora la actual). Ilustramos el algoritmo a continuación:`

			`\begin{algorithm}`
			`\KwIn{A list $[a_i]$, $i=1, 2, \cdots, m$, the solution}`
			`\KwOut{Processed list}`

			$Solutions = [\ ]$

			$firstSolution \leftarrow getRandomSolution()$

			$Solutions.append(firstSolution)$

			$lastSolution \leftarrow getLastElement(neighbour)$

			$maxIterations \leftarrow 1000$

			`\For{$i \leftarrow 0$ \KwTo $maxIterations$}{`
			`\While{$neighbour \leq lastSolution$}{`
			$neighbour \leftarrow getNeighbouringSolution(lastSolution)$

			$Solutions.append(neighbour)$

			$lastSolution \leftarrow getLastElement(neighbour)$
			`}`
			$finalSolution \leftarrow getLastElement(Solutions)$
			`}`
			`\KwRet{$finalSolution$}`
			`\end{algorithm}`
Add user manual to summary 2021-04-20 00:02:38 +02:00			`** Implementación`

			`La práctica ha sido implementada en /Python/, usando las siguientes bibliotecas:`

			`- NumPy`
			`- Pandas`

			`*** Instalación`

			`Para ejecutar el programa es preciso instalar Python, junto con las bibliotecas Pandas y NumPy.`

Add batch execution explanation to summary 2021-04-20 21:21:51 +02:00			`Se proporciona el archivo shell.nix para facilitar la instalación de las dependencias, con el gestor de paquetes [[https://nixos.org/][Nix]]. Tras instalar la herramienta Nix, únicamente habría que ejecutar el siguiente comando en la raíz del proyecto:`
Add user manual to summary 2021-04-20 00:02:38 +02:00
			`#+begin_src shell`
			`nix-shell`
			`#+end_src`

			`*** Ejecución`

Add batch execution explanation to summary 2021-04-20 21:21:51 +02:00			`La ejecución del programa se realiza mediante el siguiente comando:`
Add user manual to summary 2021-04-20 00:02:38 +02:00
			`#+begin_src shell`
			`python src/main.py <dataset> <algoritmo>`
			`#+end_src`

			`Los parámetros posibles son:`

			`\| dataset \| algoritmo \|`
			`\| Cualquier archivo de la carpeta data \| greedy \|`
			`\| \| local \|`
Add batch execution explanation to summary 2021-04-20 21:21:51 +02:00
			`También se proporciona un script que ejecuta 3 iteraciones de ambos algoritmos, con cada uno de los /datasets/, y guarda los resultados en una hoja de cálculo. Se puede ejecutar mediante el siguiente comando:`

			`#+begin_src shell`
			`python src/execution.py`
			`#+end_src`

			`Nota: se precisa instalar la biblioteca [[https://xlsxwriter.readthedocs.io/][XlsxWriter]] para la exportación de los resultados a un archivo Excel.`

			`** Análisis de los resultados`
Add results analysis to summary 2021-04-20 22:19:44 +02:00
			`Los resultados obtenidos se encuentran en el archivo /algorithm-results.xlsx/, procedemos a analizar cada algoritmo por separado.`

			`*** Algoritmo greedy`

			`#+CAPTION: Algoritmo greedy`
			`[[./assets/greedy.png]]`

			`El algoritmo greedy es determinista, por lo tanto la desviación típica es prácticamente nula (varía en el tiempo de ejecución únicamente). El tiempo de ejecución varía considerablemente según el dataset:`

			`- Dataset con n=500: 8-10 segundos`
			`- Dataset con n=2000: 6-7 minutos`

			`Por lo tanto, el algoritmo o la implementación de éste no escalan al aumentar el número de casos.`

			`Las distancias obtenidas son considerablemente peores que las del algoritmo de búsqueda local, aunque hay que tener en cuenta que en la implementación del algoritmo de búsqueda local la distancia del primer elemento no es 0, lo cual tiene afecta el resultado final.`

			`*** Algoritmo de búsqueda local`

			`#+CAPTION: Algoritmo de búsqueda local`
			`[[./assets/local.png]]`

			`El algoritmo de búsqueda local es estocástico, debido a que para la obtención de cada una de las soluciones se utiliza un generador de números pseudoaleatorio. El tiempo de ejecución es prácticamente constante con cada dataset:`

			`- Dataset con n=500: 1-3 segundos`
			`- Dataset con n=2000: 8-12 segundos`

			`Por lo tanto éste escala bien al aumentar el número de casos. Aún así, al realizar ciertas pruebas aumentando el número de iteraciones máximas, el rendimiento del algoritmo emperoaba considerablemente. Por este motivo, las ejecuciones de este algoritmo se han hecho con 100 iteraciones máximas.`