当前位置:网站首页 > 数据科学与大数据 > 正文

大数据培训大数据(大数据培训都有哪些)



01 大数据入门基础课程 1.JavaSE;2.MySQL;3.JDBC;4.Linux;5.shell;6.HTML;7.CSS;8.JavaScript;9.JSP;10.Servlet 02 大数据Hadoop基础 1.大数据概论;2.Hadoop框架;3.HDFS分布式文件系统;4.MapReduce计算模型;5.全真实训项目 03 大数据离线分析 1.Hive数据仓库;2.Sqoop ETL工具;3.Azkaban工作流引擎;4.Ooize;5.Impala;6.全真实训项目 04 大数据实时计算 1.Zookeeper分布式协调系统;2.HBase分布式数据库;3.Redis数据库;4.mogDB数据库;5.Kudu列式存储系统;6.Storm实时数据处理平台;7.Kafka分布式发布订阅消息系统;8.Flume海量日志采集系统;9.全真实训综合项目 05 Spark数据计算 1.Scala;2.Spark;3RDD;4.Spark SQL;5. Streaming;6. Mahout;7.MLlib;8.GraphX;9.Spark R;10.Python;11.Alluxio;12.Python爬虫;13.ElasticSearch;14.Lucene Hadoop基础实战 项目名称:搜狗搜索日志分析系统
数据体量:5000W+/日
硬件环境:Hadoop集群 12台
软件环境:Hadoop2.5.2+Hive1.2.1+MR+Oracle10g
项目描述:搜狗每天产生大量的日志数据,从日志数据里面能提取到有用的数据包括每个用户的ID、浏览次数、月/日浏览频率、访问源、浏览内容等等,提取这些内容、统计数据分析每个用户行为,从而做出有利的决定。
大数据离线实战 项目名称:新浪微博数据分析系统
日均数据体量:3GB+
硬件环境:Hadoop集群 50台
软件环境:MapReduce+HBase0.98.9+Storm0.9.6+Hadoop2.5.2+Kafka2.10+Zooke
eper3.4.5+CentOS-6.5-X86
项目描述:此次项目我们需要处理微博产生的数据,通过对数据的处理得到所需的数据,微博拥有大量的用户,大量的用户潜在的价值是巨大,怎么挖掘这些潜在的宝藏就是我们项目最直接的目的,为了能够实时的进行数据处理使用Storm流式计算系统,和HBase、Zookeeper、Kafka组成框架,对数据进行处理,当然这些都是建立在hadoop集群上实现的,底层的存储还是HDFS。
大数据实时计算 项目名称:网络流量流向异常账号统计项目
数据体量:每天1000亿,每秒峰值100 000
硬件环境:Hadoop集群 600台
软件环境:Hadoop2.5.2+Hive1.2.1+MR+Oracle10g
项目描述:运营商骨干网上采集现网流量流向信息,根据这些原始信息检测账号是否存在异常,如果多个终端使用同一个宽带账号,超过一定阈值则触发报警机制,例如阈值为5时,同一个账号同时连接的终端数量不能超过该值,如果超过则报警。
Spark阶段项目 项目名称:京东网上商城数据统计分析平台
数据体量:5000W+/日
硬件环境:centos-6.5-x86 集群:spark standalone(Master-1,Worker-3)
软件环境:hadoop,spark,hive,mysql,idea,navicat,kafka,flume
每日处理的数据量:3GB
项目描述:基于京东网上商城数据统计分析平台--该项目采用了目前大数据领域非常流行的技术——Spark。本项目使用了Spark技术生态栈中最常用的三个技术框架,Spark Core、Spark SQL和Spark Streaming,进行离线计算和实时计算业务模块的开发。实现了包括:统计和分析UV、PV、登录、留存、热门商品离线统计、广告流量实时统计3个业务模块。
到此这篇大数据培训大数据(大数据培训都有哪些)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • 自动驾驶数据标注工作怎么样做(自动驾驶数据标注工作怎么样做的)2025-01-03 16:36:05
  • pointnet自己的数据集(pointnet++数据集)2025-01-03 16:36:05
  • orecal默认端口(数据库oracle默认端口)2025-01-03 16:36:05
  • 广度优先搜索(广度优先搜索时需要用到的数据结构是)2025-01-03 16:36:05
  • 达梦客户端安装(如何安装达梦数据库)2025-01-03 16:36:05
  • 自动驾驶数据标注员(自动驾驶数据标注员一个框多少钱)2025-01-03 16:36:05
  • 中文期刊全文数据库cnki(中文期刊全文数据库网络版的基本使用方法是)2025-01-03 16:36:05
  • Oracle数据库增删改查(oracle数据库增删改查基本语句举例)2025-01-03 16:36:05
  • max30205数据手册(max232数据手册)2025-01-03 16:36:05
  • Apollo配置中心修改数据库配置生效(apollo修改了配置要重启吗)2025-01-03 16:36:05
  • 全屏图片