本文介绍云原生数据仓库AnalyticDB MySQL版的基本概念。1、地域地域指数据中心所在的地理区域通常按照数据中心所在的城市划分。例如华北2北京地域表示数据中心所在的城市是北京。2、可用区可用区是指在同一地域内电力和网络互相独立的物理区域。例如华北2北京地域支持12个可用区包括北京 可用区A和北京 可用区B等。同一可用区内实例之间的网络延时更小其用户访问速度更快。3、集群集群是数据库之上的物理概念。不同集群之间是物理隔离的。一个集群可以有一个物理数据库和多个逻辑数据库。4、物理库物理库是数据库在物理存储设备上的物理表示和存储方式包括数据文件、日志文件、索引文件等。创建AnalyticDB for MySQL集群时会自动创建一个物理库。每一个物理库被切分为若干个分片Shard。这些分片分布到若干个节点组Worker Group上。每个分片都由一个独立的Raft组管理。5、逻辑库数据库逻辑库是数据库在逻辑上的组织结构包括表、视图、索引等。CREATE DATABASE创建的就是逻辑数据库。一个AnalyticDB for MySQL集群最多可创建2048个逻辑数据库。AnalyticDB for MySQL文档中提到的数据库都是指逻辑库。6、分片Shard根据分布键将表数据水平分割后得到的子表称为分片英文名称为Shard。这些分片分散在若干个存储节点组Worker Group上每个存储节点组维护一部分数据有利于提高系统的可伸缩性和性能。每个分片都由一个独立的Raft组管理。同一个Raft组的多副本部署在同一个存储节点组的多个节点通过Raft协议保证多副本的数据一致性。AnalyticDB for MySQL集群的分片数量不受配置变更的影响。查询集群的分片数SELECTCOUNT(1)FROMinformation_schema.kepler_meta_shards;7、分区Partition分片可按分区键拆分为分区。分区键通常为日期时间列以实现数据的生命周期管理。8、表AnalyticDB for MySQL的表分为分区表和复制表。建表语法请参见创建表。9、分区表分区表又称普通表根据分布键将表的数据拆分为多个分片分片分散在各个存储节点上。再根据分区键将每个分片拆分为不同的分区。分区表能够利用分布式系统的查询优势查询效率高。分区表可存储的数据量较大通常可以存储千万条甚至千亿条数据。10、复制表集群的每个Shard都会存储一份复制表的全量数据。因此复制表中的数据量不宜过大最好不超过2万行。由于复制表的变更会广播到集群的所有Shard确保所有Shard的数据一致性影响写入性能因此不建议频繁增删改复制表的数据。11、EIUEIU全称为Elastic IO Unit中文名称为弹性IO资源是AnalyticDB for MySQL弹性模式集群版新版的存储节点负责数据存储还提供数据写入、数据查找和数据扫描等能力。一组EIU也就是一个存储节点组其中包含三个存储节点。您可以在创建集群时购买EIU也可以在高吞吐写入或大数据量扫描时购买或扩容EIU。EIU的性能指标请参见EIU详解。12、ACUACU全称为AnalyticDB Compute Unit是AnalyticDB for MySQL企业版及湖仓版计算资源和存储资源的最小单位。一个ACU约等于1核4 GB。13、资源组资源组是对计算资源的划分用于满足同一集群内部多租户、混合负载的需求。AnalyticDB for MySQL数仓版弹性模式集群版新版和企业版及湖仓版实例支持配置多个资源组。每个资源组拥有独立的计算资源不同资源组间的计算资源在物理上完全隔离。不同的任务被分配到不同的资源组上执行例如离线分析和在线分析被分配到不同的资源组避免资源争夺和性能下降。