大数据基础入门教程


所谓大数据(Big Data),就是需要处理的数据量非常巨大,已经达到了 TB、PB 甚至 EB、ZB 级别,需要成千上万块硬盘才能存储。传统的技术手段在大数据面前不堪一击,只能探索一套新的解决方案。

这套《大数据技术与应用教程》对大数据处理过程中涉及的各种关键技术做了详细的介绍,包括大数据思维、大数据采集、大数据处理、大数据存储、大数据挖掘、大数据应用等各个环节,帮助初学者规划了一条完整的学习路线。

这套教程只是一本入门指南手册,目的是给初学者指引方向,它虽然讲解了大数据的各种技术,但并不非常深入。对于大数据开发人员,还需要结合其它教程深度学习;对于大数据从业者,这些知识已经足够了。


年薪40+W的大数据开发【教程】,都在这儿!

1.大数据是什么
2.大数据时代
3.大数据的产生和作用
4.大数据时代的10个重大变化
5.大数据处理的基本流程
6.大数据涉及到的关键技术
7.大数据采集概述
8.通过系统日志采集大数据
9.通过网络爬虫采集大数据
10.Scrapy网络爬虫简介
11.大数据预处理架构和方法
12.数据清洗
13.数据集成
14.数据转换
15.数据消减
16.离散化和数值概念层次树
17.大数据处理技术
18.Google大数据处理系统
19.Hadoop大数据处理框架
20.HDFS
21.HDFS基本原理和设计理念
22.HDFS架构和实现机制
23.HDFS读取和写入数据
24.HDFS两种操作方式
25.NoSQL简介
26.NoSQL类型简介
27.HBase简介
28.HBase列式数据模型
29.HBase Shell
30.HBase主要运行机制
31.HBase常用Java API
32.HBase Java API编程实例
33.Hadoop MapReduce
34.Hadoop MapReduce架构
35.Hadoop MapReduce工作流程
36.MapReduce案例分析:单词计数
37.Hadoop MapReduce工作机制
38.MapReduce编程实例
39.Spark简介
40.Spark RDD
41.Spark总体架构和运行流程
42.Spark生态圈
43.Spark开发实例
44.Spark Streaming简介
45.Spark Streaming系统架构
46.Spark Streaming编程模型
47.Spark DStream相关操作
48.Spark Streaming开发实例
49.数据挖掘简介
50.Spark MLlib
51.数据挖掘之分类和预测
52.决策树和朴素贝叶斯算法
53.回归分析
54.聚类分析简介
55.k-means聚类算法
56.DBSCAN聚类算法
57.数据挖掘之关联规则分析
58.Apriori算法和FP-Tree算法
59.基于大数据的精准营销
60.基于大数据的个性化推荐系统
61.大数据预测
62.大数据的其他应用领域
63.大数据可以应用在哪些行业
64.大数据在金融行业的应用
65.大数据在互联网行业的应用
66.大数据在物流行业的应用