谷歌云推出Bigtable分层存储

来源: InfoQ - 云计算

原文

最近,谷歌云推出了Bigtable分层存储的预览版。这项新功能允许开发人员在单个Bigtable实例中管理热数据和冷数据,在保证保所有数据可访问的同时优化成本。

借助Bigtable的这项新功能,开发人员可以为表设置基于年龄的分层策略,最低年龄阈值为30天。该服务会自动在SSD和非频繁访问层之间移动数据,无需手动导出不常访问的数据。

谷歌高级产品经理Anton Gething和软件工程师Derek Lee解释了分层存储如何减少运维开销并避免手动数据迁移。他们写道

搭配Bigtable的自动扩展,这个功能可以优化Bigtable实例的资源利用率。此外,开发人员仍然可以通过相同的Bigtable API访问非频繁访问存储层中的数据与现有的SSD存储。

开发人员可以配置年龄阈值,使数据根据基于年龄的分层策略移动到非频繁访问层。当一个单元格的时间戳超过配置好的年龄时,它就从SSD层移动到非频繁访问层。数据移动仅依据单元格的时间戳,不受数据读取频率的影响。

Bigtable是谷歌云提供的一项键值和宽列存储服务,提供托管的低延迟NoSQL数据库,可兼容Cassandra和HBase。该服务旨在实现结构化、半结构化或非结构化数据的快速访问。在该服务的常见用例中,云服务提供商建议用它处理制造和汽车等行业中传感器、设备及操作活动产生的时序数据。

这项新功能的文档强调,为了实现最佳的SSD性能并充分利用分层存储,在仅访问SSD数据的查询中,开发人员应使用时间戳范围过滤器。

由于Bigtable的目标是在单个数据库中支持操作型和分析型工作负载,Gething和Lee解释了新推出的分层存储如何简化分析和报告数据的可访问性:

使用Bigtable SQL查询不常使用的数据。然后,你可以构建Bigtable逻辑视图,将数据以可以按需查询的格式呈现。该功能有助于为特定用户提供报告所需的历史数据访问权限,同时避免授予其对表的完全访问权限。

此外,新功能增加了Bigtable节点的存储容量,分层存储节点提供的容量比常规SSD节点多540%。德意志银行首席DevOps工程师和副总裁Florin Lungu评论道

Bigtable分层存储提供了一种管理数据成本的解决方案,而又不必牺牲数据。(...)这可能会显著影响组织优化数据存储策略的方式。

要将数据移回SSD,开发人员可以增加分层策略的年龄阈值使SSD包含较早的数据,也可以禁用分层存储,或者用新的时间戳重写数据并删除旧副本。

Bigtable的定价基于计算能力、数据库存储、备份存储和网络使用情况,冷存储比SSD存储便宜高达85%。Bigtable HDD实例不支持分层存储。此外,它也不支持Bigtable Data Boost和热备份。

今年早些时候,谷歌在Spanner上引入了分层存储。InfoQ之前报道过,这是一个托管的分布式SQL数据库。

声明:本文为InfoQ翻译,未经许可禁止转载。

原文链接:https://www.infoq.com/news/2025/11/google-bigtable-tiered-storage/