Implementaciones y extensiones de RAG

Implementaciones y extensiones de RAG

En un artículo anterior detallamos qué es el RAG (Retrieval Augmented Generation) y cómo aprovechar los modelos de embedding para ampliar el conocimiento de un LLM con nuestra propia base documental. En este post, hablaremos de la implementación de un…

Comparativa Looker Studio y Looker Studio Pro

Comparativa Looker Studio y Looker Studio Pro

Como herramienta de BI, Looker Studio es un visualizador al mismo tiempo que una plataforma de gestión de datos que permite extraer información manteniendo su gobernanza, seguridad, accesibilidad y agilidad en el uso. La principal ventaja de su empleo reside…

Testing en Apache Airflow

Testing en Apache Airflow

Hoy vamos a hablar de dos formas de realizar testing en Apache Airflow. Históricamente, realizar tests en Airflow ha sido algo que nos ha traído de cabeza a todos los usuarios del famoso framework. El acoplamiento del código con la…

Custom Data Source en Spark 3

Custom Data Source en Spark 3

En 2020 Apache Spark publicó su versión 3.0.0 con la que se introdujeron cambios en la API para la definición de fuentes de datos personalizadas, conocida dentro del entorno de Spark como Custom Data Source. Estas eran usadas anteriormente a…

Retrieval Augmented Generation: ¿Qué es el RAG?

Retrieval Augmented Generation: ¿Qué es el RAG?

RAG son siglas para «retrieval augmented generation», o en castellano “generación aumentada por recuperación”. Con RAG se pretende que un «gran modelo de lenguaje» (LLM en adelante, siglas en inglés de «Large Language Model») pueda utilizar información adicional suministrada por…

Apache Airflow con LocalStack

Apache Airflow con LocalStack

Por lo general, cuando comenzamos a trabajar en una nueva integración donde es necesario conectarse a los servicios de AWS en las etapas tempranas del desarrollo, es más fácil y rápido trabajar solo de forma local. Para ello, podemos hacer…