El uso de Window en Apache Spark

Al procesar datos muchas veces nos encontramos en una situación en la que queremos calcular variables sobre un cierto subconjunto de observaciones. Por ejemplo, podríamos estar interesados en la media por grupo o el valor máximo para cada grupo. La función groupBy disponible en muchos lenguajes de programación o de consulta permite que hagamos estos … Sigue leyendo El uso de Window en Apache Spark