什么是Doris?_的五大优势_架构精简Doris系统只有两个模块FE和BE
什么是Doris?
Doris是一个由前端(FE)和后端(BE)组成的数据库系统。FE负责处理用户请求,BE负责执行任务和存储数据。
Doris的五大优势
一、性能优异
Doris拥有高效的列式存储引擎,减少了数据扫描量,同时实现了超高的数据压缩比。它还提供了丰富的索引结构来加速数据读取与过滤,并且支持在线服务业务的超高并发,单节点可支持上千QPS。Doris结合了向量化执行引擎和智能物化视图技术,通过查询优化器实现极致的查询性能。
二、简单易用
Doris支持标准ANSI SQL语法,包括单表聚合、排序、过滤和多表Join等。用户可以通过UDF和UDAF等自定义函数来拓展系统功能。此外,它还实现了MySQL协议兼容,支持与BI工具的无缝对接。
三、架构精简
Doris系统只有两个模块:FE和BE。FE节点负责用户请求的接入、查询计划的解析、元数据存储及集群管理等工作;BE节点负责数据存储和查询计划的执行。Doris是一个完备的分布式数据库管理系统,部署和升级过程都非常简易,支持横向拓展,集群可以拓展到数百个节点,支持存储超过10PB的超大规模数据。
四、稳定可靠
Doris支持数据多副本存储,集群具备自愈功能,可以自动管理数据副本的分布、修复和均衡。节点扩容时,只需一条SQL命令即可完成,数据分片会自动在节点间均衡。无论是扩容、缩容、单节点故障还是在升级过程中,系统都无需停止运行,可正常提供稳定可靠的在线服务。
五、生态丰富
Doris提供丰富的数据同步方式,支持快速加载来自本地、Hadoop、Flink、Spark、Kafka、SeaTunnel等系统中的数据。同时,Doris中的数据也可以被Spark、Flink读取,并输出给上游数据应用进行展示分析。
信息对比
功能 | 描述 |
---|---|
列式存储 | 减少数据扫描量,实现超高的数据压缩比 |
索引结构 | 加速数据读取与过滤 |
向量化执行引擎 | 充分发挥现代化CPU并行计算能力 |
智能物化视图技术 | 实现预聚合加速 |
查询优化器 | 基于规划和基于代价的查询优化 |
延伸阅读
OLAP数据库评测标准:
- TPC-H:模拟商务采购应用,性能评测基准定义了22个复杂查询语句和2个更新数据语句。
- TPC-DS:定义了3个主要度量和4个辅助度量,主要度量包括查询吞吐率、查询数的性价比等。
- JOB:用于连接顺序的选择,对数据库系统的查询效率有重要影响。