Кластерная непрерывная репликация обеспечивает полную избыточность данных и служб, обеспечивающих доступ к данным. Полная избыточность обеспечивает быстрое восстановление в случаях, когда предоставленная в общий доступ копия данных почтового ящика не дает возможности выполнить быстрое восстановление.
Поведение при восстановлении с помощью кластера с непрерывной репликацией может быть двух видов в зависимости от типа отключения.
- Запланированные отключения. Запланированные отключения
выполняются администратором. Запланированное отключение можно
использовать для восстановления после сбоя, обнаруженного системой
наблюдения, или для выполнения некоторых задач администрирования,
например технического обслуживания оборудования, установки
программного обеспечения или обновлений.
- Незапланированные отключения. Незапланированные
отключения запускаются системой в качестве действий по
восстановлению после обнаруженного сбоя. Эти отключения
обнаруживаются и их восстановление активируется службой кластеров
Windows.
В следующей таблице описываются ожидаемые действия восстановления для различных видов неполадок. В некоторых случаях запустить восстановление должен администратор, другие виды неполадок автоматически обрабатываются решением кластеризации Exchange.
Действия восстановления после сбоев
Описание | Действие | Комментарии |
---|---|---|
Неустранимая ошибка операционной системы; операционная система не отвечает на запросы; полный отказ питания узла; неустранимый сбой микросхемы процессора, системной или объединительной платы; полный сбой связи на узле |
Автоматический переход на пассивный узел, если он доступен. Если восстановление не произошло в течение настроенного времени, администратор также может инициировать автоматическое подключение, независимо от потерь данных. Если ни одна из баз данных не подключена после перехода на другой ресурс при сбое и возвращения исходного активного узла в оперативный режим с работоспособным хранилищем, недостающие журналы копируются, и база данных автоматически подключается. |
Чтобы был доступен пассивный узел, должна существовать возможность установить кворум после сбоя. Это означает, что оставшийся узел должен иметь доступ к кворуму общего файлового ресурса. Кроме того, большинство узлов в кластере должны быть действующими и способными взаимодействовать друг с другом. |
Общий сбой хранилища на активном сервере |
Сбои хранилища регистрируются системой наблюдения. Администратор может восстановить хранилище или инициировать запланированное отключение пассивного узла. |
Этот сбой будет зарегистрирован как сбой всех баз данных. |
Сбой центра данных |
Если происходит сбой активного узла в основном центре обработки данных, выполняется автоматический переход кластерного сервера почтовых ящиков на пассивный узел во втором центре обработки данных. |
Другие Exchange, службы каталогов, сетевые службы и серверы должны быть восстановлены для обеспечения доступа к почте. Почтовые данные доступны и являются текущими в течение нескольких минут. |
Сбой диска с операционной системой |
Автоматических действий по восстановлению не предпринимается. Не обнаруживается Exchange, если только не происходит сбой операционной системы. Обнаруживается скорее не из-за общих причин, а при появлении явных сбоев. |
Сбой диска с операционной системой регистрируется службами наблюдения операционной системы и может вызвать сбой в самой операционной системе. |
Недостаточно места на диске с операционной системой |
Автоматический переход при сбое на пассивный узел, если он доступен. |
Этот сбой обнаруживается службами наблюдения. Если не удается выполнить автоматический переход на другой ресурс при сбое, действия по восстановлению для этого сценария определяются администратором. |
Полный сбой общедоступной сети кластера |
Автоматических действий по восстановлению не предпринимается. |
Если разорвано подключение к общедоступной сети, происходит сбой ресурсов IP-адреса. После устранения неполадки с общедоступной сетью можно снова подключить ресурсы. |
Потеря кворума кластера |
Кластерные серверы почтовых ящиков и кворум кластера отключены. |
Если не удается сформировать кворум, этот сценарий приведет к недоступности службы. |
Отказ банка данных. |
Автоматическая перезагрузка ресурса банка данных. Если сбой ресурса банка данных происходит во время перезагрузки, выполняется переход на другой ресурс. |
При повторяющихся сбоях администратор может попытаться подключить кластерный сервер почтовых ящиков, переместив его вручную на пассивный узел. |
Сбой диска с приложениями (исполняемыми модулями) |
Автоматических действий по восстановлению не предпринимается. |
Обычно этот сценарий приводит к другим сбоям, которые регистрируются службами наблюдения и требуют действий администратора. Действия по восстановлению для этого сценария определяются администратором. |
Недостаточно места на диске с приложениями (двоичными файлами) |
Автоматических действий по восстановлению не предпринимается. |
Эта ситуация обнаруживается службами наблюдения. Действия по восстановлению для этого сценария определяются администратором. |
Полная потеря базы данных или группы хранения либо полный сбой базы данных |
Автоматическая попытка повторного подключения баз данных. Если попытка завершится неудачно, база данных останется в состоянии сбоя, но переход кластерного сервера почтовых ящиков на другой ресурс не произойдет. |
Группа хранения или база данных может быть отключена по причине сбоя или повреждения программного обеспечения либо стать недоступной из-за отказа оборудования. Например, если становится недоступен журнал каталога группы хранения, она инициирует принудительное отключение всех баз данных. Администратор определяет способ устранения неполадки. |
Частичный отказ группы хранения или базы данных, некоторые данные недоступны, сбой начального подключения базы данных |
Автоматических действий по восстановлению не предпринимается. |
Частичный сбой означает, что было зарегистрировано некоторое повреждение, которое, однако, не вызвало отключения группы хранения или базы данных. Если база данных не подключается при запуске, никаких действий не предпринимается, и служба наблюдения регистрирует сбой. Сервер почтовых ящиков формирует события, если определяет, что эти события могут регистрироваться службами наблюдения. Службы наблюдения также обнаруживают и регистрируют отключенные базы данных. |
Обнаружен поврежденный журнал для группы хранения |
Автоматических действий по восстановлению не предпринимается. Копия переходит в поврежденное состояние и требует повторного заполнения. |
Служба наблюдения регистрирует это состояние. |
Недостаточно места на диске для базы данных или журнала транзакций |
Автоматических действий по восстановлению не предпринимается. Базы данных в группе хранения отключаются. |
Нехватка свободного места на диске регистрируется системой наблюдения. Администратор определяет способ устранения неполадки. |
Администратор может управлять конфигурацией восстановления после сбоя, вызванного незапланированным отключением. Дополнительные сведения о запланированных и незапланированных отключениях см. в разделе Запланированные и незапланированные отключения.