yarn 常用命令（yarn常用命令更新）

R语言数据分析来源：网络编辑：小编更新时间：2025-09-30 14:54:08 浏览量：58

Apache Hadoop YARN 是许多数据处理框架中流行的资源提供者。Flink 服务提交给 YARN 的 ResourceManager，后者在由 YARN NodeManagers 管理的机器上生成容器。Flink 将其 JobManager 和 TaskManager 实例部署到此类容器中。

Flink 可以根据在 JobManager 上运行的作业所需的处理槽数量动态分配和取消分配 TaskManager 资源。

本入门部分假设从版本 2.10.2 开始有一个可运行的 YARN 环境。最方便的方法是使用 Amazon EMR、Google Cloud DataProc 或 Cloudera 等产品等服务来提供 YARN 环境。不建议在本地或集群上手动设置 YARN 环境以完成本入门教程。

通过运行 yarn top 确保您的 YARN 集群已准备好接受 Flink 应用程序。它应该不会显示任何错误消息。
从下载页面下载最新的 Flink 发行版并解压。
重要提示确保已设置 HADOOP_CLASSPATH 环境变量（可以通过运行 echo $HADOOP_CLASSPATH 进行检查）。如果没有，请使用以下命令进行设置。

Flink 可在所有类 UNIX 环境中运行，即 Linux、Mac OS X 和 Cygwin（适用于 Windows）。

可以参考概述检查支持的版本并下载 Flink 的二进制版本，然后提取存档：

应该设置 FLINK_HOME 环境变量，例如：

一旦确保已设置 HADOOP_CLASSPATH 环境变量，即可在 YARN 会话上启动 Flink：

启动 YARN 会话后，现在可以通过命令输出最后几行中打印的 URL 或通过 YARN ResourceManager Web UI 访问 Flink Web UI。

然后，需要向 flink-conf.yaml 添加一些配置：

{{REST_PORT}} 和 {{NODE_IP}} 应替换为 JobManager Web 界面的实际值，{{YARN_APPLICATION_ID}} 应替换为 Flink 的实际 YARN 应用程序 ID。

从发布页面下载 Flink CDC 的 tar 文件，然后提取存档：

解压后的 flink-cdc 包含四个目录：bin、lib、log 和 conf。

从发布页面下载连接器 jar，并将其移动到 lib 目录。

下载链接仅适用于稳定版本，SNAPSHOT 依赖项需要您根据特定分支自行构建。

下面是同步整个数据库的示例文件mysql-to-doris.yaml：

需要根据自己的需求修改配置文件。最后使用Cli将作业提交到Flink Standalone集群。

提交成功后返回信息如下：

可以通过 Flink Web UI 找到正在运行的名为 Sync MySQL Database to Doris 的作业。

请注意，目前不支持提交到应用程序模式集群和 per-job 模式集群。

到此这篇yarn 常用命令（yarn常用命令更新）的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章，希望大家都能在编程的领域有一番成就！

上一篇： oracle教程 csdn（oracle教程第2版）

下一篇： tldraw下载（tratra下载）

版权声明：
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符，请将相关资料发送至xkadmin@xkablog.com进行投诉反馈，一经查实，立即处理！

转载请注明出处，原文链接：https://www.xkablog.com/rfx/55588.html

相关文章：