Articles de la catégorie « Spark »

05 avr. 2024 — Focus sur le Z-Ordering et le Liquid Clustering avec Delta Lake
04 avr. 2024 — Créer ou modifier un tableau croisé dynamique à partir de ses données Spark avec Apache POI
19 janv. 2023 — Comment la génération de code de zio-spark fonctionne
17 févr. 2021 — Retour d'expérience : optimisation de traitement Spark - Le piège du tout DataFrame
28 avr. 2020 — Patientons avec les nouveautés de Spark 3.0
09 déc. 2019 — Tests with Spark: how to keep our heads above water
08 oct. 2019 — Les monoïdes ne sont pas une maladie
10 sept. 2019 — La data quality, notre amie pour la vie
19 juil. 2019 — Historisation de données avec Parquet
09 juil. 2019 — Les tests avec Spark : sortir la tête de l'eau
17 mai 2019 — Spark & ZIO : rencontre du 3e type
15 mars 2019 — Shuffle dans Spark, reduceByKey vs groupByKey
08 mars 2019 — Spark : Déduplication dans le schéma
26 févr. 2019 — En finir avec les problèmes de case class dans Spark
07 févr. 2019 — Lancer un job Spark dans un cluster Kubernetes en local
05 févr. 2019 — Fonctions d'ordre supérieur dans Spark 2 pour traiter des structures imbriquées
25 janv. 2019 — Amélioration du lead time des chaînes en Spark avec un peu de Monix
22 nov. 2018 — ScalaIO 2018 - Le retour de l'équipe Univalence
21 nov. 2018 — Implicit Encoder / SparkSession / Configuration, quelques astuces pour structurer du code Spark
19 nov. 2018 — Alignement de schémas (union)
14 nov. 2018 — Deuxième article : Array ⇒ Denormalized #1
08 nov. 2018 — Spark 2.4 : #TheWaitIsOver Tour d'horizon de la nouvelle version
11 mai 2018 — JSON ⇒ CSV en Spark - Première approche