Hadoop 和 SQL 的区别
Hadoop: 是将大数据存储在分布式系统中,然后并行处理的框架。Hadoop 的四个主要组件是 Hadoop 分布式文件系统(HDFS)、纱、MapReduce 和库。它不仅涉及大数据,还涉及结构化、半结构化和非结构化信息的混合。亚马逊、IBM、微软、Cloudera、ScienceSoft、Pivotal、Hortonworks 等都是使用 Hadoop 技术的公司。
SQL: 结构化查询语言是一种特定于领域的语言,用于计算和处理关系数据库管理系统中的数据管理,它也处理关系数据流管理系统中的数据流。简而言之,SQL 是一种标准的数据库语言,用于从关系数据库中创建、存储和提取数据,如 MySQL、Oracle、SQL Server 等。
以下是 Hadoop 和 SQL 之间的差异表:
T42
特征 | Hadoop | SQL |
---|---|---|
技术 | 现代 | 传统 |
卷 | 通常以千兆字节 | 通常以千兆字节 |
操作 | 从数据中存储、处理、检索和模式提取 | 存储、处理、 数据的检索和模式挖掘 |
Hadoop 具有很高的容错性 | SQL 具有很好的容错性 | |
在分布式系统中以键值对、表、哈希表等形式存储数据。 | 将结构化数据以具有固定模式的表格格式存储在云中 | |
缩放 | 线性 | 非线性 |
提供者 | Cloudera、Horton work、AWS 等。提供 Hadoop 系统。 | 知名的 SQL 系统行业领导者有微软、SAP、Oracle 等。 |
数据访问 | 面向批量的数据访问 | 交互式和面向批量的数据访问 |
成本 | 它是开源的,系统可以经济高效地扩展 | 它是许可的,购买一台 SQL server 要花一大笔钱, 此外,如果系统耗尽存储空间,额外的费用也会出现 |
时间 | 语句执行非常快 | SQL 语法在数百万行中执行时很慢 |
优化 | 它将数据存储在 HDFS,并通过巨大的优化技术处理 Map Reduce。 | 它没有任何先进的优化技术 |
结构 | 动态模式,能够存储和处理日志数据、实时数据、图像、视频、传感器数据等。(结构化和非结构化) | 静态 Schema,只能以表格格式(结构化)存储数据(固定模式) |
数据更新 | 写入数据一次, 多次读取数据 | 多次读写数据 |
完整性 | 低 | 高 |
交互 | Hadoop 使用 JDBC(Java 数据库连接) 与 SQL 系统通信发送和接收数据 | SQL 系统可以向 Hadoop 系统读写数据 |
硬件 | 使用商品硬件 | 使用专有硬件 |
训练 | 学习 Hadoop 也适用于入门级 |
版权属于:月萌API www.moonapi.com,转载请注明出处