Hadoop 和 SQL 的区别

原文:https://www . geeksforgeeks . org/Hadoop 和 sql 的区别/

Hadoop: 是将大数据存储在分布式系统中,然后并行处理的框架。Hadoop 的四个主要组件是 Hadoop 分布式文件系统(HDFS)、纱、MapReduce 和库。它不仅涉及大数据,还涉及结构化、半结构化和非结构化信息的混合。亚马逊、IBM、微软、Cloudera、ScienceSoft、Pivotal、Hortonworks 等都是使用 Hadoop 技术的公司。

SQL: 结构化查询语言是一种特定于领域的语言,用于计算和处理关系数据库管理系统中的数据管理,它也处理关系数据流管理系统中的数据流。简而言之,SQL 是一种标准的数据库语言,用于从关系数据库中创建、存储和提取数据,如 MySQL、Oracle、SQL Server 等。

以下是 Hadoop 和 SQL 之间的差异表:

T42

特征 Hadoop SQL
技术 现代 传统
通常以千兆字节 通常以千兆字节
操作 从数据中存储、处理、检索和模式提取 存储、处理、 数据的检索和模式挖掘
Hadoop 具有很高的容错性 SQL 具有很好的容错性
在分布式系统中以键值对、表、哈希表等形式存储数据。 将结构化数据以具有固定模式的表格格式存储在云中
缩放 线性 非线性
提供者 Cloudera、Horton work、AWS 等。提供 Hadoop 系统。 知名的 SQL 系统行业领导者有微软、SAP、Oracle 等。
数据访问 面向批量的数据访问 交互式和面向批量的数据访问
成本 它是开源的,系统可以经济高效地扩展 它是许可的,购买一台 SQL server 要花一大笔钱, 此外,如果系统耗尽存储空间,额外的费用也会出现
时间 语句执行非常快 SQL 语法在数百万行中执行时很慢
优化 它将数据存储在 HDFS,并通过巨大的优化技术处理 Map Reduce。 它没有任何先进的优化技术
结构 动态模式,能够存储和处理日志数据、实时数据、图像、视频、传感器数据等。(结构化和非结构化) 静态 Schema,只能以表格格式(结构化)存储数据(固定模式)
数据更新 写入数据一次, 多次读取数据 多次读写数据
完整性
交互 Hadoop 使用 JDBC(Java 数据库连接) 与 SQL 系统通信发送和接收数据 SQL 系统可以向 Hadoop 系统读写数据
硬件 使用商品硬件 使用专有硬件
训练 学习 Hadoop 也适用于入门级