Testing en Apache Airflow

Introducción Hoy vamos a hablar de dos formas de realizar testing en Apache Airflow. Históricamente, realizar tests en Airflow ha sido algo que nos ha traído de cabeza a todos los usuarios del famoso framework. El acoplamiento del código con…

Custom Data Source en Spark 3

Introducción En 2020 Apache Spark publicó su versión 3.0.0 con la que se introdujeron cambios en la API para la definición de fuentes de datos personalizadas, conocida dentro del entorno de Spark como Custom Data Source. Estas eran usadas anteriormente…

Retrieval Augmented Generation: ¿Qué es el RAG?

Introducción RAG son siglas para «retrieval augmented generation», o en castellano “generación aumentada por recuperación”. Con RAG se pretende que un «gran modelo de lenguaje» (LLM en adelante, siglas en inglés de «Large Language Model») pueda utilizar información adicional suministrada…

Apache Airflow con LocalStack

Introducción Por lo general, cuando comenzamos a trabajar en una nueva integración donde es necesario conectarse a los servicios de AWS en las etapas tempranas del desarrollo, es más fácil y rápido trabajar solo de forma local. Para ello, podemos…

Introducción a Templates de Pycharm

Introducción PyCharm es un IDE desarrollado por JetBrains para Python. Al ser un IDE, su objetivo es proveer al programador de un conjunto de funcionalidades que hacen que el desarrollo de código en este lenguaje sea más eficiente. Por ejemplo,…

Overloading: Sobrecarga de funciones en Python

Introducción El overloading o sobrecarga de funciones es una herramienta muy interesante que nos permite que varias funciones diferentes compartan un mismo identificador, mejorando la legibilidad y la interpretabilidad de nuestro código en algunos escenarios. Esta herramienta está disponible por…