Óscar García

Óscar García

Introducción a Apache Arrow

Introducción a Apache Arrow

En este artículo vamos a ver qué es y cómo funciona esta herramienta. Apache Arrow está presente en la mayoría de frameworks de nuestro entorno, como por ejemplo Spark, Dask, Drill, Tensorflow, Kudu, etc. Todos ellos son más antiguos que…

Tutorial DataHub 4 – API

Tutorial DataHub 4: API

En esta nueva entrega de la saga de tutoriales acerca de DataHub, vamos a trabajar en la conectividad con la plataforma a través de la API. Como ingenieros de datos, el objetivo es incorporar DataHub como herramienta de Data Governance…

Novedades de Apache Spark 4.0

Novedades de Apache Spark 4.0

La llegada de Apache Spark 4.0 se está haciendo esperar, pero para alentar a la comunidad, la famosa fundación ha liberado un preview access de la versión. Hace ya unos meses, los desarrolladores de Databricks contaron un pequeño avance de…