如何在Fedora 38上安装Apache Spark

Apache Spark,一个开源的分布式计算系统,已经彻底改变了大数据处理和分析的世界。它提供闪电般的数据处理功能,使其成为数据工程师和数据科学家的首选。

apache-spark-logo

Fedora 38 上安装 Apache Spark

第 1 步。在 Fedora 38 上安装 Apache Spark 之前,重要的是要确保我们的系统是最新的软件包。这将确保我们可以访问最新的功能和错误修复,并且我们可以毫无问题地安装 Apache Spark:

sudo dnf update

第 2 步。安装爪哇。

Apache Spark依靠Java开发工具包(JDK)来实现其功能。要安装 OpenJDK 11,请执行以下命令:

sudo dnf install java-11-openjdk

现在,通过检查 Java 版本来验证安装:

java -version

第 3 步。在 Fedora 38 上安装 Apache Spark。

访问 Apache Spark 官方网站并选择最适合您要求的 Spark 版本。对于大多数用户来说,Hadoop的预构建版本是合适的:

wget https://www.apache.org/dyn/closer.lua/spark/spark-3.5.0/spark-3.5.0-bin-hadoop3.tgz

After downloading Spark, extract the archive using the following command:

tar -xvf spark-3.5.0-bin-hadoop3.tgz

接下来,将解压缩的目录移动到该目录:/opt

mv spark-3.5.0-bin-hadoop3 /opt/spark

然后,添加一个用户来运行 Spark,然后设置 Spark 目录的所有权:

useradd spark
chown -R spark:spark /opt/spark

第 4 步。创建系统服务。

现在我们创建一个服务文件来管理 Spark master 服务:systemd

nano /etc/systemd/system/spark-master.service

添加以下文件:

[Unit]
Description=Apache Spark Master
After=network.target

[Service]
Type=forking
User=spark
Group=spark
ExecStart=/opt/spark/sbin/start-master.sh
ExecStop=/opt/spark/sbin/stop-master.sh

[Install]
WantedBy=multi-user.target

保存并关闭文件,然后为 Spark 从属服务器创建一个服务文件:

nano /etc/systemd/system/spark-slave.service

添加以下配置。

[Unit]

Description=Apache Spark Slave

After=network.target

[Service]
Type=forking
User=spark
Group=spark
ExecStart=/opt/spark/sbin/start-slave.sh spark://your-IP-server:7077
ExecStop=/opt/spark/sbin/stop-slave.sh

[Install]
WantedBy=multi-user.target

保存并关闭文件,然后重新加载守护程序。systemd

sudo systemctl daemon-reload
sudo systemctl start spark-master
sudo systemctl enable spark-master

第5步。配置防火墙。

首先,您需要确定Apache Spark用于其各种组件的端口。通常,您应该打开的基本端口是:

  • Spark Master Web UI:端口 8080(或已配置的端口)
  • Spark 主端口:7077(或已配置的端口)
  • Spark 工作线程端口:指定范围内的随机端口(默认值为 1024-65535)

若要打开 Spark Master 和 Web UI 端口(例如 8080 和 7077),可以使用以下命令:firewall-cmd

sudo firewall-cmd --zone=public --add-port=8080/tcp --permanent
sudo firewall-cmd --zone=public --add-port=7077/tcp --permanent

After adding the necessary rules, you should reload the firewall for the changes to take effect:

sudo firewall-cmd --reload

第 6 步。访问 Apache Spark Web 界面。

若要验证 Spark 是否已正确安装以及群集是否正在运行,现在请打开 Web 浏览器并通过输入以下 URL 访问 Spark Web UI:

http://your-IP-address:8080

应在以下屏幕上看到 Spark 仪表板:

Apache-Spark-Fedora

感谢您使用本教程在 Fedora 38 系统上安装 Apache Spark。有关其他帮助或有用信息,我们建议您查看 Spark 官方网站

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun260960.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年10月1日
下一篇 2023年10月2日

相关推荐

  • 如何在 Fedora 38 上安装 Icinga

    Icinga 是一个强大的开源监控解决方案,提供了一个强大的平台来确保您的 IT 基础架构的稳定性和性能。 在 Fedora 38 上安装 Icinga 第 1 步。在我们可以在 …

    Linux命令 2023年10月17日
  • 如何在 Fedora 38 上更改时区

    在Linux的世界里,Fedora 38作为一个流行和用户友好的发行版而屹立不倒。管理 Fedora 系统的一个重要方面是正确配置时区。无论您是旅行、搬迁还是只是适应不同的时区,知…

    Linux命令 2023年10月16日
  • 如何在Fedora 38上安装WordPress

    WordPress是一个功能强大且流行的内容管理系统(CMS),可让您轻松创建和管理网站。将其与Fedora 38,Nginx,PHP 8和MariaDB相结合,为您的WordPr…

    Linux命令 2023年10月15日
  • 如何在 Fedora 38 上安装 InfluxDB

    InfluxDB是一个开源时间序列数据库,是有效管理时间戳数据的强大解决方案。无论您是参与监控应用程序、分析还是物联网项目,InfluxDB 都可以成为无价的工具。 在 Fedor…

    Linux命令 2023年10月11日
  • 如何在 Fedora 38 上安装 Jellyfin Media Server

    在当今的数字时代,管理和流媒体内容已成为我们生活中不可或缺的一部分。无论您拥有大量的电影、电视节目还是音乐,拥有可靠的媒体服务器都可以带来天壤之别。Jellyfin Media S…

    Linux命令 2023年10月9日
  • 如何在 Fedora 38 上安装 ReactJS

    由Facebook开发和维护的React.js已经成为构建用户界面的首选库。它的受欢迎程度源于其灵活性、基于组件的架构和强大的生态系统。在本指南结束时,您将在 Fedora 38 …

    Linux命令 2023年10月8日
  • 如何在 Fedora 38 上安装 VMware Workstation Player

    VMware Workstation是一个强大的虚拟化工具,允许您在一台主机上运行多个操作系统。Fedora 38 是一种流行的 Linux 发行版,它为托管 VMware 工作站…

    Linux命令 2023年10月8日
  • 如何在 Fedora 38 上安装 LightZone

    LightZone,一个开源的照片编辑软件,已经成为一个多功能和强大的解决方案。本指南将引导您完成使用命令行界面 (CLI) 在 Fedora 38 上安装 LightZone 的…

    Linux命令 2023年10月7日
  • 如何在 Fedora 38 上安装 Webmin

    Webmin 是一个开源的基于 Web 的控制面板,允许您通过用户友好的图形界面管理 Linux 服务器。使用 Webmin,您可以管理服务器的各个方面,例如用户帐户、软件包、文件…

    Linux资讯 2023年10月7日
  • 如何在 Fedora 38 上安装和设置 SFTP 服务器

    在当今互联的数字世界中,安全高效的文件传输是现代计算的基石。无论您是 IT 专业人员还是临时用户,在系统之间安全传输文件的能力都至关重要。本综合指南将引导您完成在 Fedora 3…

    2023年10月5日
  • 如何在 Fedora 38 上安装 Deluge

    BitTorrent客户端已成为我们数字生活的基本组成部分,使我们能够有效地下载和共享大文件。Deluge是一个开源和跨平台的BitTorrent客户端,以其轻量级和高度的可定制性…

    Linux命令 2023年10月3日
  • 如何在 Fedora 38 上安装 Ruby on Rails

    Ruby on Rails(通常简称为Rails)是一个著名的Web应用程序框架,以其效率和开发人员友好性而闻名。如果您正在 Fedora 38 上进行 Web 开发,本指南将引导…

    Linux命令 2023年10月2日
  • 如何在 Fedora 38 上安装 Prometheus

    监视和警报是现代系统管理不可或缺的方面。它们可确保基础结构的运行状况、性能和可靠性。在众多可用的监控工具中,普罗米修斯以其强大的功能和灵活性脱颖而出。 在 Fedora 38 上安…

    2023年9月28日
  • 如何在 Fedora 38 上安装 Netdata

    Netdata 是一个强大的实时监控和性能优化工具,可以帮助您深入了解 Fedora 38 系统的性能。 在 Fedora 38 上安装 Netdata 第 1 步。在我们可以在 …

    Linux命令 2023年9月25日
  • 如何在 Fedora 38 上安装 CodeIgniter

    CodeIgniter是一个健壮的PHP框架,因其简单性,效率和灵活性而在Web开发人员中获得了极大的欢迎。虽然存在自动安装方法,但本综合指南将引导您使用命令行界面 (CLI) 在…

    Linux命令 2023年9月24日
  • 如何在 Fedora 38 上安装 LibreNMS

    在当今快节奏的数字世界中,网络监控是必不可少的。密切关注网络的运行状况和性能可以防止潜在问题并确保无缝运行。LibreNMS 是一个开源网络监控系统,是一个强大的工具,可以帮助您实…

    Linux命令 2023年9月23日
  • 如何在 Fedora 38 上安装 LibreOffice

    LibreOffice是一个免费且功能强大的办公套件,包含一系列应用程序,包括Writer(文字处理),Calc(电子表格),Impress(演示文稿)等。它的开源性质使其成为全球…

    Linux命令 2023年9月22日
  • 如何在 Fedora 38 上安装 Jenkins

    在软件开发的动态环境中,效率和自动化至关重要。Jenkins 是经过时间考验的开源自动化服务器,通过自动执行从构建和测试代码到部署的一系列任务,为开发人员提供支持。 在 Fedor…

    Linux命令 2023年9月10日
  • 如何在 Fedora 38 上安装 RPM Fusion

    Fedora 38 依靠 DNF(Dandified YUM)作为其包管理器,简化了安装、更新和管理软件的过程。此过程的核心是存储库,即托管软件包的联机数据库。虽然 Fedora …

    Linux命令 2023年9月9日
  • 如何在 Fedora 38 上安装 GitLab

    GitLab,一个强大的基于Web的Git存储库管理器,为协作软件开发提供了一个多功能平台。GitLab 集成了 Git 存储库管理、代码审查和持续集成 (CI/CD) 管道,简化…

    Linux命令 2023年9月9日
  • 如何在Debian 10上安装Apache Spark

    在Debian 10 Buster上安装Apache Spark 步骤1.在运行下面的教程之前,重要的是通过apt在终端中运行以下命令来确保系统是最新的: sudo apt upd…

    2021年3月19日
  • 如何在Ubuntu 20.04 LTS上安装Apache Spark

    在Ubuntu 20.04 LTS Focal Fossa上安装Apache Spark 步骤1.首先,通过apt在终端中运行以下以下命令,确保所有系统软件包都是最新的。 sudo…

    2021年3月9日
  • 如何在CentOS 8上安装Apache Spark

    在CentOS 8上安装Apache Spark 步骤1.首先,让我们首先确保您的系统是最新的并安装所有必需的依赖项。 sudo dnf install epel-release …

    2021年2月24日