Apache Spark SQL to narzędzie do „przetwarzania SQL i danych strukturalnych” w Spark, szybkim i uniwersalnym systemie przetwarzania klastrów. Może być używany do pobierania danych z Hive, Parquet itp. Oraz do uruchamiania zapytań SQL na istniejących RDD i Datasets.