Как установить Apache Spark за 10 минут

Пререквизиты: MacOs


1. Открыть Terminal

12e802a63fe2ea255f2ad80138491f1b.png

2. Install Homebrew

Выполнить команду:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

9cd0215ff73f38af946866e2b7e94fd7.png

Как итог после установки необходимо выполнить две команды, предварительно изменив директорию на свою:
Здесь заменяем /Users/admin на свою (проверив через команду pwd)

echo 'eval ")"' >> /Users/admin/.zprofileeval "" class="formula inline">(/opt/homebrew/bin/brew shellenv)"

1dc2bce3a55b36d34f5aef6d7b4719ca.png

и вторая команда:

eval "$(/opt/homebrew/bin/brew shellenv)"

3. Install Java Development Kit (JDK)

Java является необходимым условием для запуска PySpark, поскольку она предоставляет среду выполнения, необходимую для выполнения приложений Spark. Когда PySpark инициализирован, он запускает процесс JVM (Java Virtual Machine) для запуска среды выполнения Spark, которая включает библиотеки Spark Core, SQL, Streaming, MLlib и GraphX. Этот процесс JVM выполняет код Spark.

Java от Oracle не имеет открытого исходного кода, поэтому я буду использовать Java от openjdk и установлю его с помощью brew. Следующая команда установит Java/JDK 11 версии из openjdk.

brew install openjdk@11

начало установки JDK

начало установки JDK

4. Install Python
Последовательно выполняем следующие команды:

brew install pyenv # Install pyenv pyenv install 3.11.5 # Install Python version

Установка без виртуального окружения:

brew install python

5. Install Apache Spark 

Устанавливаем Spark:
brew install apache-spark

Как результат Spark установлен и запущен:

Копируем выделенный url

Копируем выделенный url

6. Start Spark UI

Копируем выделенный url на предыдущем скрине и открываем в браузере Spark UI:

9b8512adb9f9624d68a6eeb9b1ed2c53.png

Все! На все ушло менее 10 минут!

© Habrahabr.ru