Kafka + Spark para el procesamiento en batch

El procesamiento en batch (o por lotes) es una metodología que se utiliza ampliamente en el mundo del Big Data. A lo largo de este post, analizaremos cómo se pueden aprovechar tecnologías con las que habitualmente se trabajan datos en streaming (tiempo real), como Apache Kafka y Apache Spark, para procesar datos en batch. ¿Qué … Sigue leyendo Kafka + Spark para el procesamiento en batch