HBase从入门到精通系列：误删数据如何抢救？

有时候我们操作数据库的时候不小心误删数据，这时候如何找回?mysql里有binlog可以帮助我们恢复数据，但是没有开binlog也没有备份就尴尬了。如果是HBase，你没有做备份误删了又如何恢复呢?

数据保护

当误删数据发生时候，不管三七二十一，第一要务是进入hbase shell，执行如下命令：

如果误删一张表的有多个family里的数据，需要都执行一下：

alter 'tt', { NAME => 'f1', KEEP_DELETED_CELLS => TRUE }, { NAME => 'f2', KEEP_DELETED_CELLS => TRUE }

设置 KEEP_DELETED_CELLS 为 True 的目的在于防止数据被物理删除。这里有必要解释一下HBase清理数据的原理：

首先HBase是一个LSM架构，不断发生着数据文件的写入和合并

当删除操作发生时，不会去清理数据文件中的数据，而是写入一个删除标记到新文件中。

当某一刻major compaction发生时，在合并文件的同时会根据删除标记清理数据，新合并出来的数据文件不会再有旧数据。

KEEP_DELETED_CELLS 的作用就是在major compaction发生的时候，决定要不要清理旧数据。这里需要注意一点，即便 KEEP_DELETED_CELLS 设置为True，数据仍然会因为过期而被清理(HBsae表中的TTL属性)。这个设定无可厚非，既然过期了，误删不误删也无所谓了。

数据恢复

数据恢复的前提数据没有被物理删除，也就是上文提及的。你只需要在查询(Scan)的时候，指定raw模式来搜索数据，就能看到被删除的数据，之后你要做就是把数据再写入一次。我们来看一个简单的例子，还是以hbase shell为例子：

1.首先我们准备几行数据