Apache Spark ist ein Framework für die Analyse und Bearbeitung großer Datenmengen. Als Datenquelle können Dateien, Datenbanken oder Message Queues verwendet werden. Der Vorteil von Spark ist, dass es einfach auch auf einem Cluster betrieben werden kann. Der Vortrag gibt einen kurzen Überblick über die Struktur von Spark und zeigt anhand von Beispielen, wie mit Spark gearbeitet wird.