
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
随着互联网的不断发展,越来越多的人都在学习大数据相关的技术知识等内容,而本文我们就通过案例分析来简单了解一下,大数据思维培养都有哪些类型。
GFS思想
分布式文件系统有两个基本的组成部分,一个是客户端,一个是服务端。我们发现服务端的硬盘和安全性不够明显,这个时候我们的GFS就解决了这个问题。我们会增加一个管理节点,去管理这些存放数据的主机。存放数据的主机我们称之为数据节点,而上传的文件会按照固定的大小进行分块。数据节点上保存的数据块,而非独立的文件。数据块的冗余默认为3.
上传文件时,客户端会先连接管理节点,管理节点会生成数据块的信息,包括文件名,大小,上传时间,数据块的位置信息等。这些信息成为文件的元数据,它会保存在管理节点。客户端获取了这些元数据之后,就会开始把数据块一个一个的上传。客户端把数据块先上传到一个数据节点,然后在管理节点的管理下,通过水平复制,复制和分配到其他节点(主机),终就达到了,冗余度的要求。
元数据查看fsimage整个文件系统命名空间(包括块到文件和文件系统属性的映射)hdfsoiv-i要查看的文件名-o输出的文件名-pXML查看edites文件系统元数据发生的每个更改hdfsoev-i要查看的文件名-o输出的文件名namenode启动过程加载fsimage加载edites进行检查点保存等待datanode汇报块信息datanode启动后扫描本地块的信息汇报给namenode
MapReduce思想
主要介绍它的“分而治之”的思想,先我们介绍一个网页级别,对于多个网页(几亿份),作为一个矩阵的运算已经无法满足了,那么怎么办了,我们就采用对每个小的矩阵块进行计算,之后这样的不断的叠加,后的运算和汇总结果。其实这个思想比较的具有时代化的超越性,不管是在计算机的运用里面,还是在我们日常的学习和生活中“分散任务,汇总结果”是实用的。
BigTable思想
igTable基本的思想是把所有的数据都存入一张表。BigTable的思想,利于海量数据的检索,在大数据时代可以显著提高数据的查询效率,但是对数据的新增,修改,删除是不利的。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。