Распределенные вычисления применяются повсеместно, в том числе в жизненно важных областях - медицине, энергетике, военном деле. Распределенные системы могут стать гораздо более надежными, если смогут самостоятельно восстанавливаться после сбоев. Значительной проблемой является восстановление после сбоев, вызванных программными ошибками. Как правило эти сбои обнаруживаются достаточно поздно, когда нарушена работа большого количества узлов. При этом исходная программная ошибка может быть не найдена вовсе. В данной работе предлагается адаптивная методика возвратного восстановления с использованием накапливаемых данных о работе системы и предыдущих сбоях. Важное практическое преимущество данной методики в том, что она мало зависит от конкретных особенностей целевого программно-аппаратного комплекса. Методика была реализована на классе многоагентных систем. Это и многое другое вы найдете в книге Отказоустойчивые вычислительные системы (Миногин Андрей Владимирович)