StarRocks

StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。用户数据无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。

StarRocks 架构简洁,采用了全面向量化引擎,并配备全新设计的 CBO (Cost Based Optimizer) 优化器,查询速度(尤其是多表关联查询)远超同类产品

StarRocks 能很好地支持实时数据分析,并能实现对实时更新数据的高效查询。StarRocks 还支持现代化物化视图,进一步加速查询。

使用 StarRocks,用户可以灵活构建包括大宽表、星型模型、雪花模型在内的各类模型。

StarRocks 兼容 MySQL 协议,支持标准 SQL 语法,易于对接使用,全系统无外部依赖,高可用,易于运维管理。StarRocks 还兼容多种主流 BI 产品,包括 Tableau、Power BI、FineBI 和 Smartbi。

StarRocks 采用 Apache 2.0 许可证,可在 StarRocks GitHub 存储库中找到(请参阅StarRocks许可证)。

StarRocks 使用的数据分析场景主要有:

  1. OLAP 多维分析。包括:用户行为分析、用户画像与标签分析、业务报表生成、跨主题业务分析以及系统监控分析等。
  2. 实时数据仓库。包括:电商数据分析、物流运单分析、金融绩效指标分析、直播质量分析和广告投放分析等实时分析场景。
  3. 高并发查询。StarRocks 可以通过高效的数据组织分布,灵活的索引设计以及物化视图特性来实现高效的查询。
  4. 数据湖分析。可以使用 StarRocks 统一管理外部数据湖和数据仓库,外部支持更加灵活,同时可以将性能要求很高的业务放到 StarRocks 中来实现加速。

StarRocks 默认 3.0 之前是存算一体架构,从 3.0 开始支持存算分离架构。

存算一体

存算一体架构下,主要包括 FE 和 BE 两大角色,BE 同时负责数据存储和计算,数据存储、访问和计算都在本地进行,可以提供更加极速的体验。

存算分离

存算分离的架构下将数据存储功能从原来的 BE 中抽离,BE 节点转为无状态的 CN 节点。数据存储可以持久在远端的分布式存储系统上,例如对象存储 S3 或者 HDFS,CN 本地硬盘和内存用于对热数据进行缓存和加速,系统具有更好的弹性。存算分离架构下支持动态增删计算节点,可以实现秒级扩容。

参考链接:

  1. StarRocks 官网
  2. StarRocks 文档