Etiqueta python

Apache Spark: Transformaciones y Lazy Evaluation

Introducción Apache Spark es un framework open source que nos permite procesar grandes volúmenes de datos de forma distribuida. ¿Cómo? Dividiendo los grandes volúmenes de datos, imposibles de procesar en una máquina, y repartiendolos entre los diferentes nodos del clúster.…

Machine Learning en contenedores Docker

machine-learning-en-contenedores-docker

Introducción Si alguna vez has compartido código, es bastante probable que hayas dicho aquello de “pues en mi máquina funciona” al ver como los demás tienen dificultades para ejecutarlo. Configuración incorrecta, diferencias de versiones o dependencias no instaladas suelen ser…

Introducción a la Regresión Logística

Introducción La regresión logística es una metodología estadística que permite modelar las relaciones entre una variable categórica binaria y un conjunto de variables explicativas. Específicamente, se modela la probabilidad de que una observación pertenezca a una de las categorías de…

Programación Lineal y Método Simplex

Introducción A todos nos suena el concepto de Programación Lineal u Optimización Lineal, aquella rama de las matemáticas que se dedica a optimizar (maximizar o minimizar) una función objetivo lineal sujeta a unas restricciones en forma de ecuaciones y/o inecuaciones.…

Creando gráficos vectoriales con Python

Cuando tratamos con datos y queremos representarlos en gráficos, en ocasiones necesitamos generar esos gráficos en un formato que permita escalar a cualquier resolución y sin perder calidad. Si además necesitamos cierta interactividad, poder crear representaciones gráficas en el formato…