


Introducción a Apache Hadoop
Configuración de un único nodo sin Yarn A veces puede resultar un poco agobiante entender el papel de las tecnologías open source más comunes utilizadas en contextos de big data. Por ejemplo, probablemente la mayoría de vosotros ha oído hablar…

Primeros pasos con Pyspark y Pycharm
Guía definitiva para poder configurar el entorno de desarrollo de Pyspark en Pycharm; una de las opciones más completas. Spark se ha convertido en la herramienta Big Data por excelencia, nos ayuda a procesar grandes volúmenes de datos de una…

Plugin de Pentaho PDI para Airflow
Programa, orquesta y monitoriza tus tareas de Kettle con este plugin de Pentaho PDI para Airflow En Damavis sabemos la importancia que tiene el procesado de los datos. Extraer, limpiar, transformar, agregar, cargar o cruzar múltiples fuentes de datos permiten…

Grafos – Encontrando caminos óptimos
Un ejemplo de cómo el uso de grafos puede ayudarnos a encontrar rutas óptimas para solucionar diversos problemas. Un sistema de grafos puede utilizarse con múltiples finalidades, siendo en algunos casos muy útil para resolver problemas complejos. En esta ocasión…