当前位置:网站首页 > 数据科学与大数据 > 正文

大数据培训大数据(大数据培训大数据分析)



01 大数据入门基础课程 1.JavaSE;2.MySQL;3.JDBC;4.Linux;5.shell;6.HTML;7.CSS;8.JavaScript;9.JSP;10.Servlet 02 大数据Hadoop基础 1.大数据概论;2.Hadoop框架;3.HDFS分布式文件系统;4.MapReduce计算模型;5.全真实训项目 03 大数据离线分析 1.Hive数据仓库;2.Sqoop ETL工具;3.Azkaban工作流引擎;4.Ooize;5.Impala;6.全真实训项目 04 大数据实时计算 1.Zookeeper分布式协调系统;2.HBase分布式数据库;3.Redis数据库;4.mogDB数据库;5.Kudu列式存储系统;6.Storm实时数据处理平台;7.Kafka分布式发布订阅消息系统;8.Flume海量日志采集系统;9.全真实训综合项目 05 Spark数据计算 1.Scala;2.Spark;3RDD;4.Spark SQL;5. Streaming;6. Mahout;7.MLlib;8.GraphX;9.Spark R;10.Python;11.Alluxio;12.Python爬虫;13.ElasticSearch;14.Lucene Hadoop基础实战 项目名称:搜狗搜索日志分析系统
数据体量:5000W+/日
硬件环境:Hadoop集群 12台
软件环境:Hadoop2.5.2+Hive1.2.1+MR+Oracle10g
项目描述:搜狗每天产生大量的日志数据,从日志数据里面能提取到有用的数据包括每个用户的ID、浏览次数、月/日浏览频率、访问源、浏览内容等等,提取这些内容、统计数据分析每个用户行为,从而做出有利的决定。



大数据离线实战 项目名称:新浪微博数据分析系统
日均数据体量:3GB+
硬件环境:Hadoop集群 50台
软件环境:MapReduce+HBase0.98.9+Storm0.9.6+Hadoop2.5.2+Kafka2.10+Zooke
eper3.4.5+CentOS-6.5-X86
项目描述:此次项目我们需要处理微博产生的数据,通过对数据的处理得到所需的数据,微博拥有大量的用户,大量的用户潜在的价值是巨大,怎么挖掘这些潜在的宝藏就是我们项目最直接的目的,为了能够实时的进行数据处理使用Storm流式计算系统,和HBase、Zookeeper、Kafka组成框架,对数据进行处理,当然这些都是建立在hadoop集群上实现的,底层的存储还是HDFS。




大数据实时计算 项目名称:网络流量流向异常账号统计项目
数据体量:每天1000亿,每秒峰值100 000
硬件环境:Hadoop集群 600台
软件环境:Hadoop2.5.2+Hive1.2.1+MR+Oracle10g
项目描述:运营商骨干网上采集现网流量流向信息,根据这些原始信息检测账号是否存在异常,如果多个终端使用同一个宽带账号,超过一定阈值则触发报警机制,例如阈值为5时,同一个账号同时连接的终端数量不能超过该值,如果超过则报警。



Spark阶段项目 项目名称:京东网上商城数据统计分析平台
数据体量:5000W+/日
硬件环境:centos-6.5-x86 集群:spark standalone(Master-1,Worker-3)
软件环境:hadoop,spark,hive,mysql,idea,navicat,kafka,flume
每日处理的数据量:3GB
项目描述:基于京东网上商城数据统计分析平台--该项目采用了目前大数据领域非常流行的技术——Spark。本项目使用了Spark技术生态栈中最常用的三个技术框架,Spark Core、Spark SQL和Spark Streaming,进行离线计算和实时计算业务模块的开发。实现了包括:统计和分析UV、PV、登录、留存、热门商品离线统计、广告流量实时统计3个业务模块。




到此这篇大数据培训大数据(大数据培训大数据分析)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • 数据库端口号可以改吗(数据库的端口号在哪可以看到)2025-08-12 23:54:10
  • springboot数据源加密(springboot数据库配置加密)2025-08-12 23:54:10
  • 数据库要怎么学(数据库怎么学比较快)2025-08-12 23:54:10
  • 数据库课程设计选题(数据库课程设计选题哪个简单)2025-08-12 23:54:10
  • 小米手机数据迁移到vivo手机怎么操作(小米手机转移数据到vivo手机)2025-08-12 23:54:10
  • 小米手机数据迁移到苹果手机(小米手机数据迁移到苹果手机上)2025-08-12 23:54:10
  • tidb数据库教程(tidb数据库原理)2025-08-12 23:54:10
  • 自动驾驶数据安全算法(自动驾驶 数据安全)2025-08-12 23:54:10
  • sundb数据库 达梦(达梦数据库blob)2025-08-12 23:54:10
  • druid数据库连接池(druid数据库连接池原理)2025-08-12 23:54:10
  • 全屏图片