Seal^_^【送书活动第3期】——《Hadoop大数据分析技术》

Seal^_^【送书活动第3期】——《Hadoop大数据分析技术》

  • 一、参与方式
  • 二、作者荐语
  • 三、图书简介
  • 四、本期推荐图书
    • 4.1 前 言
    • 4.2 本书内容
    • 4.3 本书目的
    • 4.4 本书适合的读者
    • 4.5 配套源码、PPT课件等资源下载
  • 五、目 录
  • 六、🛒 链接直达

在这里插入图片描述

Hadoop框架入门书,可当教材。配套PPT课件、源码,可做教材。书中包括两个大数据分析综合案例,可用于专科本科毕业论文。

一、参与方式

1、关注博主的账号。
2、点赞、收藏、评论博主的文章。
3、在文章下留下评论,每位参与者最多可以评论三次。
4、加入粉丝群,通过小程序自动抽奖。

📚 本次抽奖将 送出1至3本 书籍。

🕚 活动截止时间为 2024年5月12日晚上8点整


注意: 活动结束后,请留意查看您的私信消息。

加入粉丝群,通过小程序自动抽奖。

在这里插入图片描述

二、作者荐语

迟殿委,计算机软件与理论专业硕士,毕业于南昌大学,系统架构设计师。有多年企业软件研发经验和丰富的JavaEE培训经验,熟练掌握JavaEE全栈技术框架,对Java核心编程技术有深刻理解。主要擅长JavaEE系统架构设计、大数据分析与挖掘。

本书系统讲解Hadoop生态圈各组件的核心知识、操作方法和分析技术,并通过两个综合实战项目——影评大数据分析、旅游酒店评价大数据分析,来贯穿Hadoop大数据分析的完整流程。

三、图书简介

伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop 3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。

本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。

本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。

四、本期推荐图书

在这里插入图片描述

4.1 前 言

国家提出要加快 5G 网络和数据中心等新型基础设施建设(简称新基建)的进度。其中,信息化新型基础设施包含云计算、大数据、人工智能、区块链、5G 等内容。大数据是指具有海量(volume)、多模态(variety)、变化速度快(velocity)、蕴含价值高(value)和真实性(veracity)“5V”特征的数据,使得传统的数据存储、管理、分析技术已经无法满足大数据的处理要求。大数据给传统的数据处理和数据分析带来巨大的挑战,已引起学术界和工业界的高度关注。Hadoop正是在这种背景下产生的一个大数据开源平台。许多大型互联网公司,如谷歌、阿里巴巴、百度、京东等互联网公司都急需掌握Hadoop大数据技术的人才,而目前人才市场上大数据技术相关人才由于种种原因存在供不应求的状况,本书在这个背景下创作而成。

4.2 本书内容

本书是一本关于Hadoop 3.2.2大数据平台搭建和数据分析、生态体系主要组件的应用和开发方面的实战书籍,涉及的知识面比较广,涵盖了当前整个Hadoop生态系统主流的大数据开发技术。本书从实践操作与开发讲起,在基本操作已经掌握以后,再回过头来讲解理论知识。所以,本书是先实践再理论,方便读者快速掌握Hadoop大数据分析技术。

全书共分11章,第1章讲解Hadoop框架简介及新版本特性,并详细介绍大数据环境的准备工作,包括Linux操作系统的安装、SSH工具使用和配置等;第2章讲解Hadoop伪分布式的安装和开发体验,使读者熟悉Hadoop大数据开发两大核心组件,即HDFS和MapReduce;第39章讲解Hadoop生态系统各框架HDFS、MapReduce、输入/输出、Hadoop集群配置、ZooKeeper、HBase、Hive、Flume数据采集系统、Kafka等,并通过实际案例加深对各个框架的理解与应用。第1011章分别通过影评大数据分析项目实战和旅游酒店评价大数据分析项目实战,使读者了解完整的大数据项目开发过程,并巩固所学的知识,使之掌握的内容更加系统、全面。

4.3 本书目的

通过本书的学习,读者可以对照书中的步骤成功搭建属于自己的Hadoop大数据集群,并掌握基于Hadoop的大数据分析与开发技术,最终能够独立完成Hadoop大数据分析与开发项目。

4.4 本书适合的读者

本书可作为Hadoop框架初学者的入门书以及大数据分析人员的参考手册,也可作为高校开设大数据平台搭建或大数据开发课程的参考教材。学习本书要求读者有一定的Java编程基础并了解Linux系统的基础知识。本书每一个章节的实践操作内容都有详细清晰的步骤讲解,即使读者没有任何大数据基础,也可以对照书中的步骤成功搭建属于自己的大数据集群,本书是一本真正提高读者动手能力、以实操为主的入门书籍。通过本书的学习,结合每章配套的源代码,读者能够迅速理解与掌握Hadoop大数据相关技术框架,并可以熟练使用Hadoop集成环境进行大数据项目的开发。

4.5 配套源码、PPT课件等资源下载

本书配套源码、PPT课件、教学大纲与编程环境,需要用微信扫描下边二维码获取,可按扫描后的页面提示填写你的邮箱,把下载链接转发到邮箱中下载。

五、目 录

1章  Hadoop概述与大数据环境准备 1

1.1  大数据定义 2

1.2  Hadoop生态介绍 2

1.2.1  Hadoop简介 2

1.2.2  Hadoop版本简介 4

1.2.3  Hadoop生态系统和组件介绍 6

1.3  Hadoop 3新特性 7

1.4  虚拟机安装 9

1.5  安装Linux操作系统 10

1.6  SSH工具与使用 15

1.7  Linux统一设置 16

1.8  小结 182章  Hadoop伪分布式集群搭建 19

2.1  安装独立运行的Hadoop 19

2.2  Hadoop伪分布式环境准备 22

2.3  Hadoop伪分布式安装 26

2.4  HDFS操作命令 31

2.5  Java项目访问HDFS 33

2.5.1  创建Maven项目 34

2.5.2  HDFS操作示例 36

2.6  winutils 38

2.7  快速MapReduce程序示例 39

2.8  小结 423章  HDFS分布式存储实战 43

3.1  HDFS的体系结构 43

3.2  NameNode的工作 44

3.2.1  查看镜像文件 45

3.2.2  查看日志文件 46

3.2.3  日志文件和镜像文件的操作过程 47

3.3  SecondaryNameNode 49

3.4  DataNode 50

3.5  HDFS的命令 50

3.6  远程过程调用 51

3.7  小结 534章  MapReduce实战 55

4.1  MapReduce的运算过程 55

4.2  WordCount示例 57

4.3  自定义Writable 60

4.4  Partitioner分区编程 64

4.5  自定义排序 66

4.6  Combiner编程 67

4.7  默认Mapper和默认Reducer 68

4.8  倒排索引 69

4.9  Shuffle 73

4.10  小结 775章  ZooKeeper与高可用集群实战 79

5.1  ZooKeeper简介 79

5.1.1  Zxid 80

5.1.2  版本号 81

5.2  单一节点安装ZooKeeper 82

5.3  基本客户端命令 83

5.4  Java代码操作ZooKeeper 86

5.5  ZooKeeper集群安装 91

5.6  znode节点类型 92

5.7  观察节点 93

5.8  配置Hadoop高可用集群 93

5.9  用Java代码操作集群 102

5.10  小结 1046章  Hive数据仓库实战 105

6.1  Hive3的安装配置 107

6.2  Hive的命令 110

6.3  Hive内部表 114

6.4  Hive外部表 116

6.5  Hive表分区 117

6.5.1  分区技术细节 117

6.5.2  分区示例 119

6.6  查询示例汇总 121

6.7  Hive函数 122

6.8  Hive自定义函数 128

6.9  Hive视图 132

6.10  hiveserver2 132

6.11  使用JDBC连接hiveserver2 134

6.12  小结 1357章  HBase数据库实战 136

7.1  HBase的特点 136

7.2  HBase安装 139

7.2.1  HBase的单节点安装 140

7.2.2  HBase的伪分布式安装 142

7.2.3  Java客户端代码 144

7.3  HBase集群安装 150

7.4  HBase Shell操作 153

7.4.1  数据模型定义 154

7.4.2  数据基本操作 156

7.5  协处理器 160

7.6  Phoenix 162

7.7  小结 1688章  Flume数据采集实战 169

8.1  Flume的安装与配置 170

8.2  快速示例 171

8.3  在ZooKeeper中保存Flume的配置文件 172

8.4  Flume的更多Source 176

8.4.1  Avro Source 176

8.4.2  Thrift Source和Thrift Sink 180

8.4.3  Exec Source 183

8.4.4  Spool Source 184

8.4.5  HDFS Sinks 184

8.5  小结 1859章  Kafka实战 186

9.1  Kafka的特点 187

9.2  Kafka术语 188

9.3  Kafka安装与部署 189

9.3.1  单机部署 189

9.3.2  集群部署 195

9.4  小结 19810章  影评大数据分析项目实战 199

10.1  项目介绍 199

10.2  项目需求分析 199

10.3  项目详细实现 203

10.3.1  搭建项目环境 203

10.3.2  编写爬虫类 206

10.3.3  编写分词类 207

10.3.4  第一个job的Map阶段实现 210

10.3.5  第一个job的Reducer阶段实现 210

10.3.6  第二个job的Map阶段实现 211

10.3.7  第二个job的自定义排序类阶段的实现 211

10.3.8  第二个job的自定义分区阶段实现 212

10.3.9  第二个job的Reduce阶段实现 212

10.3.10  Run程序主类实现 213

10.3.11  编写词云类 214

10.3.12  效果测试 21511章  旅游酒店评价大数据分析项目实战 216

11.1  项目介绍 216

11.2  项目需求分析 217

11.2.1  数据集需求 217

11.2.2  功能需求 217

11.3  项目详细实现 218

11.3.1  数据集上传到HDFS 219

11.3.2  Hadoop数据清洗 221

11.3.3  构建Hive数据仓库表 225

11.3.4  Sqoop数据导入与导出 230

11.3.5  数据可视化开发 232

六、🛒 链接直达

在这里插入图片描述

有兴趣的朋友可以前往查看。 JD搜索关键词:

✨ Hadoop大数据分析技术,Hadoop ✨

🛒 链接直达: https://item.jd.com/13536921.html)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/597891.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

明星中药企业系列洞察(四)丨从超级单品到健康医药集团,云南白药如何打造自己的多元宇宙?

前不久,云南白药发布的2023年年报显示,报告期内,云南白药实现营业收入391.11亿元,同比增长7.19%,创同期历史新高。同时,公司计划每10股派发现金红利20.77元(含税),分红总…

17.Blender RC大佬EEVEE皮肤节点预设导入

如何添加节点预设 在底下的左下角打开Geometry Node Editor 选中正方体,点击新建 当鼠标指针在两个模块之间,是十字的样子时 可以拖出一个新的板块 然后打开文件浏览器 找到节点预设然后拖入到底下的节点编辑界面就可以了或者是blend文件&#xf…

Go Web 开发 Demo【用户登录、注册、验证】

前言 这篇文章主要是学习怎么用 Go 语言(Gin)开发Web程序,前端太弱了,得好好补补课,完了再来更新。 1、环境准备 新建项目,生成 go.mod 文件: 出现报错:go: modules disabled by G…

vue cli 自定义项目架子,vue自定义项目架子,超详细

脚手架Vue CLI基本介绍: Vue CLI 是Vue官方提供的一个全局命令工具 可以帮助我们快速创建一个开发Vue项目的标准化基础架子【集成了webpack配置】 脚手架优点: 开箱即用,零配置内置babel等工具标准化的webpack配置 脚手架 VueCLI相关命令…

一种由RSOA和PIC集成的宽可调激光器

----翻译自Nouman Zia, Samu-Pekka Ojanen, Jukka Viheriala, Eero Koivusalo, Joonas Hilska, Heidi Tuorila, and Mircea Guina在optics letter上发的文章vol.48, Issue 5, pp. 1319-1322(2023) 摘要:通过光子集成方式实现的2-3μm波长的可调激光器,在…

如何选择最佳的机器学习分类模型?基于使用贝叶斯和异步连续减半算法(ASHA)优化的最佳分类模型自动选择方法

目录 一、主要内容: 二、贝叶斯优化算法: 三、异步连续减半优化算法: 四、代码运行效果: 五、代码下载: 一、主要内容: 对于分类问题,不同机器学习模型分类的效果不同,而且在同…

Azure AKS日志查询KQL表达式

背景需求 Azure(Global) AKS集群中,需要查询部署服务的历史日志,例如:我部署了服务A,但服务A的上一个版本Pod已经被杀掉由于版本的更新迭代,而我在命令行中只能看到当前版本的pod日志&#xff…

2024年最新 CKA 导航页

1. Dokcer 基础相关 Docker 、 Docker-Compose 安装教程Docker基础知识、相关概念以及基本使用命令Docker 一句话删除所有镜像/容器 2. CKA 相关学习 CKA(Certified Kubernetes Administrator)是由 Cloud Native Computing Foundation(CNC…

c#实现音乐的“vip播放功能”

文章目录 前言1. c#窗体2. 功能3. 具体实现3.1 添加文件3.2 音乐播放3.3 其他功能 4. 整体代码和窗口5. 依赖的第三方库 前言 最近在QQ音乐里重温周杰伦的歌,觉得好听到耳朵怀孕,兴起想要下载下来反复听,发现QQ音乐VIP歌曲下载下来的格式居然…

C++初阶之list的使用和模拟以及反向迭代器的模拟实现

个人主页:点我进入主页 专栏分类:C语言初阶 C语言进阶 数据结构初阶 Linux C初阶 算法 欢迎大家点赞,评论,收藏。 一起努力,一起奔赴大厂 一.list简介 list是一个带头双向链表,在数据结构的时候…

44 网络基础

本章重点 了解网络发展背景,对局域网/广域网的概念有基本认识 了解网络协议的意义,重点理解TCP/IP五层结构模型 学习网络传输的基本流程,理解封装和分用 目录 1.网络发展 2.协议 3.OSI七层模型 4.TCP/IP五层模型 5.网络传输流程图 6.网络中…

VMP 简单源码分析(.net)

虚拟机 获取CPU的型号 实现了一个指令集解释器,每个操作码对应一个特定的处理函数,用于执行相应的指令操作。在执行字节码时,解释器会根据操作码查找并调用相应的处理函数来执行指令。 截获异常 先由虚拟机处理 处理不了再抛出异常 priva…

开源投票系统源码及搭建 在线投票活动创建系统的设计与开发

在当今数字化时代,在线投票活动已成为各类组织、企业和个人不可或缺的一部分。无论是选举、问卷调查、产品评选还是其他需要收集公众意见的场景,一个高效、稳定且易于使用的在线投票系统都至关重要。 分享一款基于开源投票系统源码的在线投票活动创建系…

设计模式Java实现-建造者模式

楔子 小七在2019年的时候,就想写一个关于设计模式的专栏,但是最终却半途而废了。粗略一想,如果做完一件事要100分钟,小七用3分钟热情做的事,最少也能完成10件事情了。所以这一次,一定要把他做完&#xff0…

ICode国际青少年编程竞赛- Python-1级训练场-综合训练1

ICode国际青少年编程竞赛- Python-1级训练场-综合训练1 1、 Spaceship.turnLeft() for i in range(2):Spaceship.turnLeft()Spaceship.step(3) Dev.step(-1) Spaceship.step(4) Spaceship.turnLeft() Spaceship.step(3)2、 Spaceship.step() Spaceship.turnLeft() Spaceship.…

学QT的第一天~

#include "mywidget.h" MyWidget::MyWidget(QWidget *parent) : QWidget(parent) { //窗口相关设置// this->resize(427,330); this->setFixedSize(427,330); //设置图标 this->setWindowIcon(QIcon("C:\\Users\\Admin\\Desktop\\pictrue\\dahz.jpg&q…

【面试经典 150 | 分治】建立四叉树

文章目录 写在前面Tag题目来源解题思路方法一:递归 写在最后 写在前面 本专栏专注于分析与讲解【面试经典150】算法,两到三天更新一篇文章,欢迎催更…… 专栏内容以分析题目为主,并附带一些对于本题涉及到的数据结构等内容进行回顾…

C语言写的LLM训练

特斯拉前 AI 总监、OpenAI 创始团队成员 Andrej Karpathy 用 C 代码完成了 GPT-2 大模型训练过程:karpathy/llm.c: LLM training in simple, raw C/CUDA (github.com) 下载源码 git clone --recursive https://github.com/karpathy/llm.c.git下载模型 从HF-Mirro…

JavaScript中的RegExp和Cookie

个人主页:学习前端的小z 个人专栏:JavaScript 精粹 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结,欢迎大家在评论区交流讨论! 文章目录 🔆RegExp 🎲 1 什么是正则表达式 🎲2 创建…

组件化开发根组件

目录 一、组件化开发介绍 二、根组件 一、组件化开发介绍 组件化:一个页面可以拆分成一个个组件,每个组件有着自己独立的结构、样式、行为。 好处:便于维护,利于复用,提升开发效率。 二、根组件 组件分类&#xff…
最新文章