当前位置:网站首页 > 大数据架构 > 正文

cephfs架构(ceph hdfs)



1.1 项目结构

外部hdfs动态挂载kubenetes pv_hdfs

1.2 项目主要依赖

项目主要依赖如下,有两个地方需要注意:

  • 这里由于我服务器上安装的是 CDH 版本的 Hadoop,在导入依赖时引入的也是 CDH 版本的依赖,需要使用 标签指定 CDH 的仓库地址;
  • 、、 均需要排除 依赖,原因是 中已经有该依赖,不排除的话有 JAR 包冲突的风险;

1.3 DataSourceSpout

产生的模拟数据格式如下:

1.4 将数据存储到HDFS

这里 HDFS 的地址和数据存储路径均使用了硬编码,在实际开发中可以通过外部传参指定,这样程序更为灵活。

1.5 启动测试

可以用直接使用本地模式运行,也可以打包后提交到服务器集群运行。本仓库提供的源码默认采用 进行打包,打包命令如下:

运行后,数据会存储到 HDFS 的 目录下。使用以下命令可以查看目录内容:

外部hdfs动态挂载kubenetes pv_Hadoop_02

2.1 项目结构

集成用例: 进行词频统计并将最后的结果存储到 HBase,项目主要结构如下:

外部hdfs动态挂载kubenetes pv_ide_03

2.2 项目主要依赖

2.3 DataSourceSpout

产生的模拟数据格式如下:

2.4 SplitBolt

2.5 CountBolt

2.6 WordCountToHBaseApp

2.7 启动测试

可以用直接使用本地模式运行,也可以打包后提交到服务器集群运行。本仓库提供的源码默认采用 进行打包,打包命令如下:

运行后,数据会存储到 HBase 的 表中。使用以下命令查看表的内容:

外部hdfs动态挂载kubenetes pv_hadoop_04

2.8 withCounterFields

在上面的用例中我们是手动编码来实现词频统计,并将最后的结果存储到 HBase 中。其实也可以在构建 的时候通过 指定 count 字段,被指定的字段会自动进行累加操作,这样也可以实现词频统计。需要注意的是 withCounterFields 指定的字段必须是 Long 类型,不能是 String 类型。

到此这篇cephfs架构(ceph hdfs)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • 苹果特殊符号大全花样符号图案(苹果特殊符号大全花样符号图案是什么)2026-05-20 10:00:07
  • 结构游戏的分类主要有(结构游戏分为哪七大类)2026-05-20 10:00:07
  • 中国大学慕课认证码填哪(中国大学慕课的认证码)2026-05-20 10:00:07
  • 三千大道和三千法则(三千大道法则大全)2026-05-20 10:00:07
  • 中国大学慕课认证码(中国大学慕课认证码与录入学号不匹配)2026-05-20 10:00:07
  • 免费二级域名解析(免费二级域名解析网站网址大全)2026-05-20 10:00:07
  • plc1200指令大全(plc1200指令大全scl)2026-05-20 10:00:07
  • 大气分层图到太空(大气层分层示意图高清图)2026-05-20 10:00:07
  • 字体图案设计(字体图案设计大全)2026-05-20 10:00:07
  • netsend命令(netsh命令大全)2026-05-20 10:00:07
  • 全屏图片