Apache Spark: Transformaciones y Lazy Evaluation

Apache Spark: Transformaciones y Lazy Evaluation

Apache Spark es un framework open source que nos permite procesar grandes volúmenes de datos de forma distribuida. ¿Cómo? Dividiendo los grandes volúmenes de datos, imposibles de procesar en una máquina, y repartiendolos entre los diferentes nodos del clúster. En…

Machine Learning en contenedores Docker

Machine Learning en contenedores Docker

Si alguna vez has compartido código, es bastante probable que hayas dicho aquello de “pues en mi máquina funciona” al ver como los demás tienen dificultades para ejecutarlo. Configuración incorrecta, diferencias de versiones o dependencias no instaladas suelen ser algunas…

Demo Apache Drools con Scala y Templates

Demo Apache Drools con Scala y Templates

Apache Drools es un software usado para gestionar reglas de negocio de cualquier tipo. Al ser un framework muy extenso, limitamos este artículo a aplicar directamente con Scala un caso de uso simple, dejando así de lado las explicaciones teóricas…

Introducción a Apache Kafka

Introducción a Apache Kafka

¿Qué es Apache Kafka? Apache Kafka es un sistema de eventos distribuido de código abierto. Fue originalmente desarrollado por LinkedIn, para suplir las necesidades causadas por su rápido crecimiento, y pasó a infraestructura basada en microservicios.  Es también una parte…

Introducción a la Regresión Logística

Introducción a la Regresión Logística

La regresión logística es una metodología estadística que permite modelar las relaciones entre una variable categórica binaria y un conjunto de variables explicativas. Específicamente, se modela la probabilidad de que una observación pertenezca a una de las categorías de dicha…