Plantilla para /pipelines/ usando Luigi + Docker
pyenv
python version 3.5.2
ag
hub
git flow
docker
docker-compose
docker-machine
- Instala y ejecuta el pipeline mediante el comando
./iniciar_pipeline.sh
Este archivo ejecutará las siguientes tareas:
- Crea maquinas con docker localmente
- Crea un swarm utilizando esas maquinas
- Instala las imagenes necesarias
- Por último ejecuta el pipeline.
Para poder visualizar el resultado graficamente con Luigi es necesario iniciar un servidor de Luigi:
luigid
En localhost, podremos observar el grafo dirigido aciclico (DAG) de iris pipeline.
Los archivos resultantes de la ejecución se encontrarán en /data/
De acuerdo a las siguientes especificaciones:
Our old friend: *The Magic loop*, Ahora en su presentación de /pipeline/
1. Vamos a partir del =iris= /dataset/ y vamos a entrenar varios modelos para predecir la variable del tipo de flor.
2. Estos modelos *no* pueden entrenar en serie. Cada modelo entrenará en un =Task=, con parámetros:
- Nombre del algoritmo
- Hiperparámetros
3. La salida de los =Task= debe de ser un archivo =pickle= llamado =nombre_algoritmo/nombre_algoritmo-lista-hiperparámetros.pl=
y un archivo =json= con la siguiente estructura:
{
"algoritmo": "nombre_algoritmo",
"hiperparametros": {
"hiperparametro_1": valor,
"hiperparametro_1": valor,
...
"path": "path_al_archivo_pickle"
}
}
"El archivo necesario colocar iris.csv en la carpeta data (para este ejemplo ya debe estar ahí)."
Basado en el proyecto pipeline-template