kafka-磁盘损坏导致的一个问题

我搭建的kafka集群目标是高可用.
整个集群有3台zookeeper服务器+10台kafka机器, 构成一个高可用集群
但是昨天还是有半小时不可用, 这是一件很严重的事情.
原因是因为其中有一台机器的硬盘坏了, 然后我点了公司提供的一件修复,
但是修复完之后, kafka问题节点却无法自动识别修复好的磁盘,只能通过杀死进程从新启动才恢复集群

那么问题来了, 磁盘损坏是一个不可控的情况, 怎样才能保证数据不会丢失呢?