涉及索引列的查询时,首先会去索引表中查找索引列的值在HDFS对应的数据文件路径以及索引列的值在数据文件中的偏移量,通过数据文件路径和偏移量去扫描全表的部分数据,从而避免全表扫描。
查看答案
若数据表中的数据发生变化,则数据表会自动重建索引.
A. 对
B. 错
Hive事务的特性基于ACID原则,包括原子性、一致性、隔离性和持久性。
A. 对
B. 错
为了在Hive上支持文件修改以及数据一致性等一系列事务问题,HDFS以增量的形式去记录数据的更新和删除。
A. 对
B. 错
每一个事务处理数据的结果都会单独创建一个增量文件夹用来存储数据。当用户读取事务表的数据时,会将基础文件和增量文件都读取到内存中进行合并,合并的过程会判断原始数据中的哪些数据进行了修改或删除等操作,最终将合并后的结果返回给查询。
A. 对
B. 错