想入行大数据,面对开发语言和分析软件时,该如何选择?

先开门见山的给出结论:在职场中,学习任何一门技术,优先考虑工作需求本身,其次是职业发展所需,最后才是兴趣和好奇…

对大数据开发常见的相关概念

很多零基础转来学习大数据开发的童鞋,对大数据开发常见的相关概念有哪些,怎么理解会有不太清楚的地方,今天就来简单…

大数据分析现状、模式与常用4大分析技术

近年来互联网的高速发展引领人类进入了一个信息量爆炸性增长的时代。每个人的生活中都充满了结构化和非结构化的数据。…

Java后端开发工程师是否该转大数据开发?

撰写我对java后端开发工程师选择方向的想法,写给在java后端选择转方向的人 背景 看到一些java开发工程…

Scala 中 10 个超赞的集合操作函数

当我处理 Scala 集合时,我会进行两类操作:转换操作和聚合操作。第一种操作类型将集合转换为另一个集合,第二…

Java开发三年转行大数据,我失业了

互联网人的中年危机似乎都来的特别早…… 面对日新月异的技术和层出不穷的架构,几乎每一个互联网人都需要在工作中不…

什么是Kafka?

能了解到Kafka的基本部署,使用,但他和其他的消息中间件有什么不同呢? Kafka的基本原理,术语,版本等等…

大数据之Kafka史上最详细原理总结

Kafka Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本…

hadoop集群搭建

本文用以记录hadoop分布式集群搭建过程 基础环境准备 1、软件环境 centos 6.5 三台服务器分配的…

hadoop单机模式、伪分布式和分布式

hadoop Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 Hadoop实现了一个分布式…

Hadoop实战:使用Maxwell把MySQL数据实时同步到HDFS

Maxwell介绍 Maxwell是一个守护程序,一个应用程序,能够读取MySQL Binlogs然后解析输出…

Hadoop分布式集群部署

一、系统参数配置优化 1、系统内核参数优化配置 修改文件/etc/sysctl.conf,添加如下配置,然后执…