Articles de la catégorie « Spark »
- 05 avr. 2024 — Focus sur le Z-Ordering et le Liquid Clustering avec Delta Lake
- 04 avr. 2024 — Créer ou modifier un tableau croisé dynamique à partir de ses données Spark avec Apache POI
- 19 janv. 2023 — Comment la génération de code de zio-spark fonctionne
- 17 févr. 2021 — Retour d'expérience : optimisation de traitement Spark - Le piège du tout DataFrame
- 28 avr. 2020 — Patientons avec les nouveautés de Spark 3.0
- 09 déc. 2019 — Tests with Spark: how to keep our heads above water
- 08 oct. 2019 — Les monoïdes ne sont pas une maladie
- 10 sept. 2019 — La data quality, notre amie pour la vie
- 19 juil. 2019 — Historisation de données avec Parquet
- 09 juil. 2019 — Les tests avec Spark : sortir la tête de l'eau
- 17 mai 2019 — Spark & ZIO : rencontre du 3e type
- 15 mars 2019 — Shuffle dans Spark, reduceByKey vs groupByKey
- 08 mars 2019 — Spark : Déduplication dans le schéma
- 26 févr. 2019 — En finir avec les problèmes de case class dans Spark
- 07 févr. 2019 — Lancer un job Spark dans un cluster Kubernetes en local
- 05 févr. 2019 — Fonctions d'ordre supérieur dans Spark 2 pour traiter des structures imbriquées
- 25 janv. 2019 — Amélioration du lead time des chaînes en Spark avec un peu de Monix
- 22 nov. 2018 — ScalaIO 2018 - Le retour de l'équipe Univalence
- 21 nov. 2018 — Implicit Encoder / SparkSession / Configuration, quelques astuces pour structurer du code Spark
- 19 nov. 2018 — Alignement de schémas (union)
- 14 nov. 2018 — Deuxième article : Array ⇒ Denormalized #1
- 08 nov. 2018 — Spark 2.4 : #TheWaitIsOver Tour d'horizon de la nouvelle version
- 11 mai 2018 — JSON ⇒ CSV en Spark - Première approche