В этом разделе представлен расширенный обзор высокого уровня доступности в Microsoft Exchange Server 2007, а также описана рекомендуемая процедура принятия решения при выборе подходящего для организации решения для обеспечения высокого уровня доступности.

Термины доступность и высокая доступность могут иметь различные значения в зависимости от контекста использования и целевой аудитории. Их можно использовать для описания различных производственных задач и технических требований, начиная с задач обеспечения доступности, относящихся исключительно к оборудованию, и заканчивая очень важными целями, которые относятся к доступности всей системы обмена сообщениями.

В целом, ожидания организаций относительно целей доступности достаточно часто бывают необоснованными. Также организации, не получив общего представления о стоимости, зачастую начинают требовать более высокого уровня доступности, чем могут себе в действительности позволить.

Стоимость большинства решений по обеспечению высокого уровня доступности включает в себя в том числе следующие компоненты:

Под удобством обслуживания подразумевается наличие договоров со сторонними поставщиками услуг или соглашений об эксплуатации с отделом информационных технологий внутри организации о предоставлении или обслуживании служб или компонентов информационной инфраструктуры.

Доступность

Доступность — это уровень обслуживания, предоставляемый приложениями, службами или системами. Простои высокодоступных систем минимальны, независимо от того, являются они запланированными или незапланированными. Доступность часто выражается в процентном соотношении времени доступности службы или системы, например: 99,9 % для службы, которая недоступна только 8,75 часов в году.

Для повышения уровня доступности необходимо внедрить механизмы повышения отказоустойчивости для маскировки или снижения влияния сбоев компонентов и зависимостей службы. Повышение отказоустойчивости достигается путем внедрения избыточности для подверженных сбоям компонентов без дублирования.

При планировании доступности Microsoft Exchange учтите все компоненты, которые являются частью инфраструктуры системы обмена сообщениями. Некоторые компоненты могут также быть другими службами со своими подкомпонентами. Доступность службы обмена сообщениями определяется доступностью каждого компонента, являющегося частью инфраструктуры.

Определения требований к доступности

Доступность службы является сложным вопросом, охватывающим несколько дисциплин. Существует множество различных подходов к обеспечению требуемых уровней доступности, каждый со своей собственной стоимостью.

Однако требования к доступности могут быть выражены клиентом с помощью относительно простых терминов без необходимости полного понимания последствий. Подобная ситуация может привести к отсутствию понимания между клиентом и организацией, работающей в области информационных технологий, ошибочному уровню инвестиций, а также к неудовлетворенности от полученного результата.

Одно требование к доступности, равной 99.5 %, может отличаться от другого требования к доступности, равного 99.5 %. В одном требовании может обсуждаться доступность отдельной платформы оборудования, а в другом — доступность полнофункциональной службы. Даже определение доступности полнофункциональной службы может сильно различаться. Очень важно понимать способы измерения любых требований к доступности. Например:

  • Если все оборудование и программное обеспечение на основном сервере функционирует нормально и приложение готово принимать пользовательские подключения, можно ли считать это решение доступным на 100 %?

  • Если имеется 100 пользователей, но 25 % из них не могут подключиться из-за сбоев в локальной сети, можно ли все равно считать уровень доступности этого решения равным 100 %?

  • Если только один пользователь из 100 может подключиться и начать работу, считается ли доступность этого решения равной 1 %?

  • Если все 100 пользователей могут подключиться, но работоспособность службы была снижена: доступны только две или три транзакции клиентов, снизилась производительность, — как это повлияет на измерения доступности?

Период, во время которого измеряется доступность, может также значительно повлиять на определение доступности. Требование к 99,9 % доступности в течение одного года означает 8,75 часов простоя. Требование к 99,9 % доступности во время четырехнедельного интервала означает 40 минут простоя в течение каждого периода.

Также необходимо определить и согласовать периоды простоя для запланированной поддержки, обновлений с помощью пакетов обновления и обновлений программного обеспечения. Количество запланированного допустимого времени простоя имеет большое значения для определения требований к доступности.

Окончательная первоначальная версия (RTM) сервера Microsoft Exchange Server 2007 включает в себя новые возможности, позволяющие снизить затраты и увеличить время бесперебойной работы.

  • Локальная непрерывная репликация. Локальная непрерывная репликация представляет собой односерверное решение, в котором с помощью встроенной технологии создается и поддерживается копия группы хранения на втором наборе дисков, подключенных к тому же серверу, на котором находится производственная группа хранения. Локальная непрерывная репликация обеспечивает асинхронную доставку и преобразование журналов, а также быстрое ручное переключение на дополнительную копию данных. Дополнительные сведения о локальной непрерывной репликации см. в разделе Локальная непрерывная репликация.

  • Кластер с непрерывной репликацией. Кластер с непрерывной репликацией сочетает возможности репликации и преобразования в Exchange 2007 с функциями отказоустойчивости в службах кластера Microsoft. Кластер с непрерывной репликацией — это решение без единой точки отказа, которое можно развернуть в одном центре данных или между двумя центрами данных. Дополнительные сведения о кластере с непрерывной репликацией см. в разделе Непрерывная репликация кластера. Кластер с непрерывной репликацией имеет ряд преимуществ по сравнению с кластеризацией в предыдущих версиях сервера Exchange Server и кластерами единой копии в сервере Exchange 2007. Дополнительные сведения об этих преимуществах см. в разделе Преимущества непрерывной репликации кластера по сравнению с кластерами единой копии.

  • Кластеры единой копии. В Exchange 2007 доступны кластеры единой копии, которые были перенесены с рядом существенных изменений и улучшений из предыдущих версий Exchange Server, где они назывались кластерами общего хранилища. Дополнительные сведения о кластерах единой копии см. в разделе Кластеры единой копии.

В Microsoft Exchange Server 2007 с пакетом обновления 1 (SP1) добавлены дополнительные возможности для обеспечения устойчивости сайтов.

  • Пассивная непрерывная репликация. Пассивная непрерывная репликация — это новая возможность, реализованная в Exchange 2007 с пакетом обновления 1 (SP1). Как следует из названия, пассивная непрерывная репликация предназначена для сценариев, предусматривающих использование или включение резервных серверов восстановления. Пассивная непрерывная репликация расширяет существующие возможности непрерывной репликации и позволяет реализовывать новые сценарии доступности данных для серверов почтовых ящиков Exchange 2007. Для обеспечения дополнительных конфигураций и возможностей развертывания в пассивной непрерывной репликации используется та же технология доставки и преобразования журналов, что и в локальной непрерывной репликации и кластере с непрерывной репликацией. Пассивную непрерывную репликацию можно использовать для репликации данных отдельных серверов почтовых ящиков и кластерных серверов почтовых ящиков. Дополнительные сведения о пассивной непрерывной репликации см. в разделе Резервная непрерывная репликация.

Данные возможности обеспечивают улучшенные способы аварийного восстановления, соответствующие различным требованиям к доступности. В приведенной ниже таблице перечисляются возможные требования к доступности, а также приводятся сравнения решений Exchange 2007 с решениями по аварийному восстановлению, реализованными в Exchange Server 2003. Дополнительные сведения о конфигурациях с высоким уровнем доступности для сервера Exchange 2007 см. в разделе Развертывания высокой доступности.

Сравнение решений для обеспечения высокого уровня доступности на основе требований к доступности

Требование к доступности Решение Exchange 2003 Окончательная первоначальная версия (RTM) сервера Exchange 2007 Сервер Exchange 2007 с пакетом обновления 1 (SP1)

Долгосрочное архивирование

Ежедневное полное резервное копирование. Восстановление резервных копий на сервере, восстановленном идентично исходному.

Еженедельное полное резервное копирование и ежедневное добавочное резервное копирование. Восстановление резервных копий на любом сервере.

Еженедельное полное резервное копирование и ежедневное добавочное резервное копирование. Восстановление резервных копий на любом сервере.

Отклик на ошибки пользователей

Хранение в мусорном контейнере в течение семи дней по умолчанию. По истечении 7 дней восстановление резервных копий на сервере, восстановленном идентично исходному.

Хранение в мусорном контейнере в течение четырнадцати дней по умолчанию. По истечении 14 дней восстановление резервных копий на любом сервере

Хранение в мусорном контейнере в течение четырнадцати дней по умолчанию. По истечении 14 дней восстановление резервных копий на любом сервере

Устойчивость к отказам:

  • Диск

  • Оборудование

  • Общее хранилище

Восстановление резервных копий на сервере, восстановленном идентично исходному.

Непрерывная репликация. Восстановление не требуется

Изолированный сбой или двойной сбой кластера с непрерывной репликацией: Постоянная готовность по другому местоположению или переносимость базы данных.

Непрерывная репликация. Восстановление не требуется

Изолированный сбой или двойной сбой кластера с непрерывной репликацией: Постоянная готовность по другому местоположению или переносимость базы данных.

Устойчивость к сбоям на уровне всего сайта

Восстановление резервных копий на сервере, восстановленном идентично исходному.

Непрерывная репликация на другой сайт. Восстановление не требуется

Изолированный сбой или двойной сбой кластера с непрерывной репликацией: Постоянная готовность по другому местоположению или переносимость базы данных.

Пассивная непрерывная репликация на второй сайт. Восстановление не требуется

Переносимость базы данных или активация резервного сервера.

Выбор решения, обеспечивающего необходимый уровень доступности

Существует несколько конфигураций, которые могут повысить уровень доступности установленного сервера Exchange 2007. Чтобы значительно продвинуться вперед в вопросе выбора решения, обеспечивающего необходимый уровень доступности, нужно проанализировать предлагаемые варианты и определить, какое из решений лучше всего соответствует задачам компании и требованиями к доступности. Одним из способов такого анализа является построение таблицы, разделенной на сектора. Каждому типу сбоя соответствует один сектор. В каждом секторе таблицы в строках записываются решения, предлагающие стратегию восстановления после сбоя, соответствующую требованиями к уровню доступности. Значимые факторы решения записываются в столбцах. Типичные факторы:

  • Время восстановления

  • Влияние восстановления на данные

  • Затраты на оборудование и программное обеспечение

  • Затраты на ресурсы

  • Вероятность возникновения события

  • Последствия для компании

  • Риски от увеличения сложности

  • Решения сторонних производителей

  • За

  • Против

Заполнив эти таблицы, выберите несколько решения для проведения анализа затрат. Для каждого из выбранных решений необходимо вычислить расчетные затраты на один почтовый ящик (их также можно занести в таблицу). В таблицу затрат обязательно следует включить строку, характеризующую соответствие качества решения задачам компании. Оцените несколько вариантов и выберите хотя бы одно решение, удовлетворяющее требованиям, но отличающееся от типичного для организации решения.

Чтобы выбрать определенное решение, изучите задачи компании, требования к доступности, возможные решения и результаты анализа затрат. В процессе выбора нужного решения следует учитывать приведенные ниже важные моменты.

  • Составьте четкий список задач компании, расположив их в соответствии с приоритетом. Во избежание конфликтов между задачами очень важно расставить приоритеты.

  • Откажитесь от стереотипов, которые вполне могли устареть. Используйте весь потенциал сервера Exchange 2007 на этапе проектирования и оценки. Опыт показывает, что наиболее рентабельные решения могут потребовать новых подходов к резервному копированию, хранению и эксплуатации.

  • Выполните анализ недублированных точек отказа в системе обмена сообщениями. Единственная копия данных почтового ящика, хранящаяся в одной сети хранения данных (SAN), не обеспечивает полной защиты от повреждений и сбоев. Независимо от избыточности сети хранения данных (SAN) всегда существует вероятность потери или повреждения этой единственной копии данных. В случае кластера единой копии сбой сети SAN может привести к потере данных за многие часы и неработоспособности на многие дни. При использовании для обеспечения высокого уровня доступности кластера с непрерывной репликацией может произойти потеря данных при сбое в работе сервера, но в этом решении используется две копии данных. Кластер с непрерывной репликацией снижает вероятность потери большого количества данных за счет возможности транспортного сервера-концентратора, называемой корзина транспорта. Этим обеспечивается сохранность данных почтового ящика при возникновении большинства серьезных ошибок.

  • Изучите возможности хранения, предоставляемые каждым решением. Кластер с непрерывной репликацией позволяет организациям использовать более широкий спектр решений в области хранения, например, подключаемое напрямую хранилище. Кластер с непрерывной репликацией не требует наличия канала сети SAN, использование которого приводит к увеличению сложности и затрат. Развертывать хранилище, подключаемое напрямую (сеть SAN или дешевое решение в области хранения), и управлять им гораздо проще.

  • Следует иметь в виду, что кластер с непрерывной репликацией и локальная непрерывная репликация позволяют отказаться от обычного ежедневного полного резервного копирования в пользу стратегии, сочетающей более редкое полное резервное копирование и ежедневное добавочное копирование. Кластер с непрерывной репликацией и локальная непрерывная репликация также поддерживают более быстрое восстановление после первого сбоя (в рамках соглашения об условиях обслуживания). Предусмотренный соглашением об условиях обслуживания срок восстановления после двойного сбоя (ошибки в обеих копиях или повреждение обеих копий) может быть продолжительнее, чем предусмотрено текущим соглашением об условиях обслуживания для восстановления. Такие изменения могут значительно снизить общую стоимость владения, поскольку затраты на резервное копирование обычно составляют значительную долю общей стоимости владения. Кроме того, переход на стратегию резервного копирования на диски также может снизить затраты.

  • Исследуйте возможность использования технологий непрерывной репликации, поддерживаемых сервером Exchange Server 2007, для создания решения. Кластер с непрерывной репликацией избавляет от необходимости использовать сторонние технологии репликации. На данный момент кластер с непрерывной репликацией поддерживает двухузловые кластеры (каждый узел обслуживает одну копию данных). Ниже перечислены преимущества решения по обеспечению устойчивости сайта на основе этой технологии.

    • Обеспечивается доступность данных почтового ящика в резервном центре обработки данных для клиентов.

    • Непрерывная репликация связана с переносом меньшего объема данных, чем в большинстве решений сторонних производителей.

    • Для создания решения требуется незначительная интеграция.

  • Составьте для каждого из вариантов таблицы, определяющие поведение при восстановлении и затраты. Обязательно включите в таблицу затрат несколько вариантов, которые требуют пересмотра существующего порядка вещей. С помощью этих таблиц выберите решение, отвечающее перечисленным ниже требованиям.

    • Обеспечивает наилучшее соответствие требованиям компании.

    • Удовлетворяет требованиям к затратам.

    • Не превышает уровень сложности развертывания и эксплуатации, который можно реализовать в организации.

Основные продукты и компоненты

Развертывание продуктов и компонентов должно основываться на их способности удовлетворять жестким требованиям к доступности и надежности. Данные требования должны считаться краеугольным камнем проекта доступности. Дополнительное инвестирование, необходимое для достижения еще более высоких уровней доступности, бесполезно, а требования к уровням доступности не могут быть удовлетворены, если основные продукты и компоненты ненадежны и склонны к отказам.

Процессы управления службами

Свой вклад в повышение уровней доступности дают эффективные процессы управления службами. Такие процессы, как управление доступностью, особыми ситуациями, проблемами и изменениями, играют важную роль в общем управлении службой обмена сообщениями.

Управление системой

Управление системами должно поддерживать мониторинг, диагностику и автоматическое восстановление после ошибок, чтобы обеспечить быстрое обнаружение и разрешение возможных и фактических отказов.

Специальные решения с полной избыточностью

Чтобы добиться непрерывною доступности на уровне 100 процентов, необходимы дорогостоящие решения, в число которых входит полная избыточность. Избыточность – методика улучшения доступности с помощью дублирующих компонентов. Для удовлетворения строгих требований к доступности такие компоненты должны работать автономно и параллельно.

Определение целей доступности и требований соглашения об уровне обслуживания

Достижение высоких уровней доступности начинается с развертывания высококачественных продуктов и компонентов. Однако данные продукты и компоненты сами по себе вряд ли обеспечат необходимые стабильные уровни доступности. В процессе проектирования целевые показатели доступности следует учитывать на самых ранних этапах разработки. При таком подходе удается избежать возможного роста расходов, связанных с переделками, внеплановыми обновлениями, необходимыми для обеспечения требуемой доступности, использованием внеплановых средств для отслеживания инфраструктуры, незапланированными затратами на устранение единственных точек отказа в инфраструктуре, а также с обеспечением удобства эксплуатации и обслуживания.

Одним из первых действия на пути к достижению высокого уровня доступности является анализ соглашения об уровне обслуживания, принятого в организации. На основе соглашения об уровне обслуживания можно определить развертывание Exchange 2007 и конфигурации сервера, которые наилучшим образом подходят данному соглашению.

Далее перечислены основные особенности высокой доступности в отношении их связи с аварийным восстановлением.

  • Разрешенное время бездействия Продумайте максимальное разрешенное время бездействия, доступное для вашей организации в соответствии с определением службы доступности Exchange вашей организации. В зависимости от принятого в организации определения допустимого времени простоя стратегия аварийного восстановления обмена сообщениями будет соответствовать соглашению об уровне обслуживания организации. Стратегия аварийного восстановления обмена сообщениями предполагает использование пользователями временного почтового ящика с тем, чтобы они могли отправлять и получать сообщения сразу после аварийного сбоя. В результате применения этой стратегии служба электронной почты быстро восстанавливается, еще до восстановления данных журнала почтового ящика. Как правило, восстановление быстро завершается в результате слияния данных журнала и временного почтового ящика.

  • Разрешенное время восстановления Продумайте максимальное время, разрешенное для каждого типа операции по аварийному восстановлению. Например, можно указать приблизительный период времени, необходимого для восстановления почтового ящика, отдельной базы данных или всего сервера Exchange 2007.

  • Допустимые потери данных Продумайте допустимые для организации временные или постоянные потери данных Exchange. Например, организация может допускать временную потерю данных почтового ящика, начиная с предыдущего резервного сохранения, сроком на 24 часа, пока пользователи могут отправлять и получать сообщения за 4-часовой период времени. В других случаях можно применять более строгое требование, например, требование, что восстанавливаются все данные Exchange за 4 часа перед точкой сбоя.

После того как было подумано допустимое для организации время простоя и принято решение об уровне для безотказной работы, необходимой в среде обмена сообщениями, можно задать соглашение об уровне обслуживания. Соглашение об уровне обслуживания определяет для организации порядок работы с такими компонентами как хранение, кластеризация, архивирование и восстановление.

При оценке соглашений об уровне обслуживания следует начинать с определения часов непрерывной работы и ожиданий в отношении простоя. Затем следует определить ожидания компании в отношении уровня готовности, производительности и возможности восстановления, включая время доставки сообщения, процента безотказной работы сервера, объема требуемого хранилища и времени на восстановление базы данных Exchange.

Дополнительно необходимо указать расчетные затраты на незапланированный простоя, чтобы можно было правильно определить степень отказоустойчивости системы обмена сообщениями.

Возможности сервера Exchange 2007 и Windows Server 2003 могут влиять на построение схемы организации в соответствии с соглашениями об уровне обслуживания. Например, такие возможности, как локальная непрерывная репликация, кластеры с непрерывной репликацией, кластеры с единым хранилищем, служба теневого копирования томов, группы хранения для восстановления, переносимость баз данных и аварийный перенос позволяют пересмотреть ограничения, установленные ранее в соответствии с соглашениями об уровне обслуживания.

В приведенной ниже таблице перечислены некоторые категории и отдельные элементы, которые можно включить в соглашения об уровне обслуживания.

Категории и элементы типового корпоративного соглашения об уровне обслуживания

Категории соглашения об уровне обслуживания Примеры элементов соглашения об уровне обслуживания

Часы работы

  • Часы, когда служба обмена сообщениями доступна пользователям

  • Часы, зарезервированные для запланированного простоя (техническое обслуживание)

  • Число предварительных уведомлений об изменениях в сети или других изменениях, которые могут повлиять на работу пользователей.

Служба доступности

  • Процент времени работы служб Exchange

  • Процент времени, когда хранилища почтовых ящиков подключены

  • Процент времени, когда службы контроллера домена запущены

Производительность системы

  • Количество внутренних пользователей, постоянно поддерживаемых системой обмена сообщениями

  • Количество удаленно подключенных пользователей, постоянно поддерживаемых системой обмена сообщениями

  • Количество транзакций обмена сообщениями, поддерживаемых в единицу времени

  • Допустимый уровень производительности, такой как задержка, ощущаемая пользователями

Аварийное восстановление

  • Допустимое время восстановления для каждого типа ошибки, например, ошибки личной базы данных, ошибки сервера почтовых ящиков, ошибки контроллера домена и ошибки узла.

  • Время, необходимое для архивирования почты, чтобы пользователи могли отправлять и получать сообщения электронной почты без доступа к данным журнала (называемое временным обеспечением обмена сообщениями)

  • Время, необходимое на восстановление данных до состояния перед точкой сбоя

Справочная служба и поддержка

  • Конкретные методы, используемые пользователями для обращения в справочную службу

  • Время отклика справочной службы на различные классы проблем

  • Процедуры справочной службы относительно процедур нарастания проблемы

Другой

  • Объем хранилища, требуемый в расчете на каждого пользователя

  • Количество пользователей, запрашивающих специальные функции, такие как удаленный доступ к системе обмена сообщениями

При включении различных показателей производительности в справку соглашений об уровне обслуживания убедитесь, что они соответствуют специальным требованиям пользователей, предъявляемым к производительности системы. Например, при большой задержке или низкой полосе пропускания соединения между клиентами и серверами почтовых ящиков пользователи могут просматривать уровень производительности независимо от администраторов системы. В некоторых случаях пользователи могут считать производительность системы недостаточной, хотя администраторы полагают ее приемлемой. Поэтому необходимо обязательно отслеживать уровни задержки дискового ввода-вывода.

Примечание.
Для каждого элемента соглашения об уровне обслуживания можно также определить специальные эталонные тесты производительности, которые будут использоваться для измерения производительности совместно с параметрами доступности. Кроме того, необходимо задать частоту предоставления статистики руководству ИТ-отдела и других подразделений.

Заключение соглашений об уровне обслуживания с поставщиками

Многие предприятия, придающие большое значение решениям с высоким уровнем доступности, используют службы сторонних поставщиков для достижения своих в отношении уровня доступности. В этих случаях система обмена сообщениями с высоким уровнем доступности требует применения служб, предоставляемых сторонними производителями аппаратного и программного обеспечения. Поставщики с низкой скоростью отклика и плохо обученным персоналом могут понизить уровень доступности системы обмена сообщениями.

Убедитесь в заключении соглашение об уровне обслуживания с каждым своим главным поставщиком. Заключение соглашений об уровне обслуживания с поставщиками помогает гарантировать соответствие производительности системы обмена сообщениями спецификациям, росту требованиям к поддержке, а также уровень доступности в соответствии с определенным стандартом. Отсутствие соглашения об уровне обслуживания может значительно увеличить время, в течение которого система обмена сообщениями недоступна пользователям.

Важно!
Убедитесь, что персонал знаком с условиями каждого соглашения об уровне обслуживания. Например, зачастую соглашения об уровне обслуживания поставщиков аппаратных средств содержат пункты, в соответствии с которыми корпус сервера разрешается вскрывать только персоналу поддержки поставщика или специально аттестованным для этого сотрудникам вашей организации. Несоблюдение этих требований может привести к нарушению соглашения об уровне обслуживания и возможному аннулированию гарантий или обязательств поставщика.

Кроме заключения соглашений об уровне обслуживания с основными поставщиками необходимо регулярно проверять эскалационные процедуры, проводя тренировки по обслуживанию запросов о поддержке. Чтобы убедиться в наличии самой последней контактной информации, также необходимо проверять номера пейджеров и деревья телефонов.

Учет требований к доступности

Рекомендуется проанализировать следующие аспекты, чтобы определить требования к доступности:

  • Проанализируйте восприимчивость к отказам предложенного проекта инфраструктуры. Необходимо удостовериться, что в ней нет единственных точек отказа. Единственной точкой отказа является любой компонент инфраструктуры обмена сообщениями, не имеющий возможности резервирования и отказ которого может повлиять на пользователя. Предлагаемый технический проект решения должен охватывать всю сквозную конфигурацию.

  • Рассмотрите минимальные уровни доступности, необходимые для службы обмена сообщениями, и минимальные уровни надежности, удобства эксплуатации и обслуживания для каждого компонента инфраструктуры обмена сообщениями.

  • Рассмотрите возможности тестирования или моделирования новых компонентов, чтобы удостовериться, что они соответствуют указанным требованиям. Чтобы оценить, могут ли новые компоненты проекта соответствовать установленным требованиям, важно, чтобы выбранным режимом тестирования удостоверялась возможность достижения ожидаемого уровня доступности. Тестирование должно также выполняться при обслуживании компонентов. Должны быть предусмотрены средства моделирования для формулировки предполагаемых требований пользователей к новой информационно-технологической службе, чтобы удостовериться, что компоненты продолжают работать в полном объеме и в условиях нагрузки.

Учет требований к постоянной доступности

Решение для обмена сообщениями с высоким уровнем доступности требует материальных вложений и развертывания решения для мониторинга, процессов управления услугами, средств управления системой и резервирования. Для развертывания систем с высокой доступностью важно не иметь в такой сквозной конфигурации никаких единственных точек отказа. Проект высокой доступности должен обеспечивать устранение единственных точек отказа и резерв альтернативных компонентов, чтобы в случае отказа компонента перерыв в рабочих операциях был бы минимален. В проекте также должно исключаться или минимизироваться влияние плановых простоев на рабочие операции, что обычно требует согласование действий по обслуживанию, например, реализации изменений в инфраструктуре. Критерии восстановления должны определять быстрое восстановление и восстановление обслуживания как ключевую цель проектирования на этапе восстановления.

При разработке плана развертывания решения для обмена сообщениями необходимо определить, какие задачи должно выполнять это решение. Этот момент является чрезвычайно важным при проектировании характеристик доступности решения. Задачи компании нередко противоречат одна другой. Например, может требоваться 100-процентная доступность и в то же время установка последних обновлений для системы безопасности в течение недели после их выхода. Затраты являются еще одним проблемным фактором разработки планов развертывания. Наилучшим подходом к определению нужного решения для компании будет воспользоваться методологией планирования, согласно которой нужно определить все требования компании и оценить возможные варианты удовлетворения этих требований.

Для успешного достижения высокой доступности необходимо постоянно и непрерывно следить за эксплуатационной практикой в организации. Необходимо разбираться в причинах всех простоев. Необходимо изменять процесс соответствующим образом, если это поможет устранить причины простоев.

Другим важным фактором максимизации доступности является упреждающее наблюдение за средой Exchange. С помощью упреждающего наблюдения можно выявить проблемные области системы до того, как они приведут к сбою или выходу из строя. Кроме того, наблюдение позволяет обслуживающему персоналу получать сведения о проблемах, которые система не устраняет автоматически. В таких ситуациях быстрое реагирование может сократить время простоя, повышая уровень доступности.

Сервер Exchange 2007 зависит по ряду параметров от инфраструктуры центра данных. В результате доступность сервера Exchange ограничивается доступностью, которая обеспечивается этими зависимостями. Рекомендуется заключать соглашения об уровне обслуживания для каждой зависимости. В соглашении об уровне обслуживания должен указываться уровень доступности предоставляемых услуг и время восстановления после сбоя. Например, служба каталогов Active Directory является одним из ключевых элементов, от которых зависит работа сервера Exchange. Если доступность Active Directory ниже необходимой доступности сервера Exchange, невозможно добиться необходимой доступности сервера Exchange.

Доступность сервера Exchange 2007 зависит от доступности других служб ИТ-инфраструктуры. Для работы сервера Exchange необходима нормальная работа службы Active Directory и сети. Доступность этих служб непосредственно влияет на доступность сервера Exchange. Это означает, что необходимо следить за тем, чтобы требования к доступности сервера Exchange были не выше требований к доступности элементов, от которых он зависит. Как правило, в число этих элементов входят следующие:

  • Active Directory

  • служба доменных имен

  • сеть TCP/IP

  • подсистема хранилища;

  • службы архивации

  • службы наблюдения

  • инфраструктура центра данных (питание и кондиционирование воздуха)

После определения задач компании и разработки соглашений об уровне обслуживания для компонентов от которых зависит работа сервера Exchange рекомендуется разработать начальный список требований к доступности служб обмена сообщениями. В этот список нужно включить все основные классы сбоев и ожидаемое время восстановления. Список должен содержать сведения о влиянии на данные сбоев, касающихся данных. Их можно указать в виде задачи, которая должна быть выполнена в ходе восстановления. Задачи, выполняемые при восстановлении, определяют влияние на данные, задавая время, определяющее данные, которые будут доступны после восстановления. Ниже перечислены сбои, которые необходимо учесть.

  • Утрата одного элемента электронной почты

  • Утрата одного почтового ящика

  • Утрата или повреждение базы данных

  • Отказ диска

  • Отказ или повреждение тома диска

  • Сбой запоминающего устройства

  • Сбой сервера

  • Отключение от сети

  • Сбой центра данных

Многие компании устанавливают различные требования к доступности для разных типов пользователей. Например, некоторые пользователи могут использовать систему обмена сообщениями для отслеживания поставок или продаж, а другие — для передачи сообщений, не обладающих высокой степенью важности. Время восстановления и время на выполнение задач по восстановлению для пользователей, которые используют систему обмена сообщениями для важных задач, должны быть как можно меньше. А для пользователей, использующих систему обмена сообщениями для задач меньшей важности, оба этих значения могут быть больше.

Дополнительные сведения

Дополнительные сведения об устойчивости сайтов Exchange 2007 см. в разделе Site Resilience Configurations.