Применимо к: Exchange Server 2010 SP1

Последнее изменение раздела: 2011-04-20

В единой системе обмена сообщениями Microsoft Exchange Server 2010 один кодек используется для хранения сообщений голосовой почты. Другой кодек используется между IP-шлюзом или УАТС и сервером единой системы обмена сообщениями. Единая система обмена сообщениями Exchange 2010 может использовать любые из следующих четырех аудиокодеков для создания и хранения голосовых сообщений:

Однако кодеки G.711 (PCMA и PCMU) и G.723.1 являются кодеками VoIP и используются для обмена данными между шлюзом IP и сервером единой системы обмена сообщениями.

Частью планирования единой системы обмена сообщениями является выбор необходимого аудиокодека, соответствующего требованиям организации. В этом разделе описываются аудиокодеки, которые могут использоваться единой системой обмена сообщениями. Эти сведения помогут правильно спланировать развертывание данной системы.

Кодеки

В единой системе обмена сообщениями используются два типа кодеков: кодек, который используется для обмена данными между шлюзами IP и сервером единой системы обмена сообщениями или между УАТС и шлюзом IP, в зависимости от типа УАТС; а также кодек, который используется для кодирования и хранения голосовых сообщений для пользователей.

Термин кодек, относящийся к цифровым аудиоданным, состоит из слов «кодирование» и «декодирование». Кодек — это программа, которая преобразует цифровые данные в формат звукового файла или звукового потока. Кодеки используются для преобразования аналогового голосового сигнала в его цифровую версию. Они различаются по качеству звука, пропускной способности, которая необходима для их использования, и требованиям к системе, соблюдение которых необходимо для выполнения кодирования.

При использовании обычного телефона в коммутируемой телефонной сети общего пользования (PSTN) голос передается по телефонной линии в аналоговом формате. Но при использовании протокола VoIP голос необходимо преобразовать в цифровые сигналы. Этот процесс преобразования называется кодированием. Кодирование выполняется с помощью кодека. После того как оцифрованный голос достигает места назначения, его необходимо декодировать обратно в аналоговый формат, чтобы абонент мог слышать и понимать звонящего.

Кодек VoIP

В единой системе обмена сообщениями между шлюзами IP или IP-УАТС и сервером единой системы обмена сообщениями могут использоваться три типа кодеков. Серверы единой системы обмена сообщениями используют перечисленные ниже кодеки VoIP для обмена данными со шлюзом IP или УАТС, работающей по протоколу IP:

  • G.711 µ-law

  • G.711 A-law

  • G.723.1

G.711 — это стандарт, разработанный для использования с аудиокодеками. Существует два основных алгоритма, определенных в стандарте для G.711: Алгоритм «µ-law», используемый в Северной Америке и Японии, и алгоритм «A-law», который используется в Европе и других странах. В приложениях VoIP чаще всего используется аудиокодек G.723.1. Для использования этого кодека требуется получение лицензии. Аудиокодек G.723.1 обеспечивает высокое качество при высокой степени сжатия.

Сервер единой системы обмена сообщениями и поддерживаемый шлюз IP или IP-УАТС могут использовать как кодек G.711, так и кодек G.723.1. По умолчанию первым необходимо использовать кодек G.723.1. Если требуется использовать другой кодек вместо G.723.1 между сервером единой системы обмена сообщениями и шлюзом IP или IP-УАТС, рекомендуется изменить конфигурацию шлюза IP или IP-УАТС. В приведенной ниже таблице содержатся сведения о наиболее распространенных кодеках VoIP.

Кодеки VoIP

Кодек VoIP Пропускная способность (Кбит/с) Описание

G.711

64

Данный кодек требует очень мало обработки. Для установки двусторонней связи необходима пропускная способность не менее 128 килобит в секунду (Кбит/с).

G.723.1

5.3/6.3

Данный кодек обеспечивает высокую степень сжатия при высоком качестве аудиосигнала. Он требует больше обработки по сравнению с кодеком G.711. Кодек G.723.1 требует меньшей пропускной способности, но качество аудиосигнала при этом хуже.

Кодек хранилища голосовых сообщений единой системы обмена сообщениями

Абонентские группы единой системы обмена сообщениями являются ее неотъемлемой частью. При создании абонентской группы единой системы обмена сообщениями эта группа по умолчанию использует аудиокодек WMA. Однако после создания абонентской группы можно настроить ее на использование аудиокодеков GSM 06.10 или G.711 PCM Linear.

Каждый аудиокодек имеет преимущества и недостатки. Аудиокодек WMA был выбран кодеком по умолчанию из-за качества звука и сжатия. Аудиокодеки GSM 06.10 и G.711 PCM Linear были выбраны из-за их способности поддерживать другие типы систем обмена сообщениями.

При планировании единой системы обмена сообщениями необходимо сбалансировать размер и относительное качество аудиофайла, который будет создаваться для голосовых сообщений. В общем, чем выше скорость передачи в аудиофайле, тем выше качество. Необходимо учитывать, сжат ли аудиофайл. Ниже приведены примерная скорость передачи (бит/с) и свойства сжатия для каждого аудиокодека единой системы обмена сообщениями:

Кодеки хранилища голосовых сообщений единой системы обмена сообщениями по умолчанию

Кодек хранилища голосовых сообщений Биты Сжатие

MP3

16 бит

Да

WMA

16 бит

Да

G.711 PCM

16 бит

Нет

GSM 06.10

8 бит

Да

В единой системе обмена сообщениями аудиокодеки MP3, WMA, G.711 PCM Linear и GSM 06.10 используются для создания звуковых файлов голосовых сообщений в формате MP3, WMA и WAV. Однако типы создаваемых файлов зависят от аудиокодека, используемого для создания аудиофайла голосового сообщения. В единой системе обмена сообщениями с помощью аудиокодека MP3 создаются аудиофайлы MP3, путем применения кодека WMA — файлы WMA, а с использованием кодеков GSM 06.10 и G.711 PCM Linear — файлы WAV. Оба вида звуковых файлов отправляются вместе с сообщением электронной почты получателю голосового сообщения.

Часто, но не всегда в кодировании и декодировании цифровых данных используются сжатие и распаковка. Сжатие аудиопотока — это форма сжатия данных, уменьшающая размер аудиофайлов. Алгоритм сжатия аудио, используемый аудиокодеком, сжимает аудиофайлы WMA и WAV. В единой системе обмена сообщениями тип используемого алгоритма сжатия основан на типе аудиокодека, выбранного в свойствах абонентской группы системы. После создания и сжатия звуковой файл вкладывается в голосовое сообщение.

Иногда во время сжатия или распаковки теряются некоторые данные. Чем выше степень сжатия звукового файла, тем больше теряется данных во время преобразования. Тем не менее, используется меньшее количество дискового пространства вследствие меньшего размера звукового файла. Наоборот, более низкая степень сжатия приведет к меньшей потере данных. Однако будет задействовано больше дискового пространства вследствие увеличившегося размера звукового файла.

Также доступен широкополосный кодек RTAudio для записи голосовых сообщений с высоким качеством звука. Однако данная возможность становится доступна только после интеграции единой системы обмена сообщениями Exchange 2007 с сервером Office Communications Server 2007 R2 или Microsoft Lync Server 2010 (новое поколение Office Communications Server). Чтобы включить кодек RTAudio, необходимо настроить абонентскую группу единой системы обмена сообщениями в качестве абонентской группы SIP с универсальным кодом ресурса (URI), а в качестве кодека автоответчика для данной абонентской группы установить кодек WMA.

Важно!
Кодек RTAudio недоступен в средах, где не развернут сервер Office Communications Server 2007 либо R2 или Lync Server 2010. Это связано с тем, что в таких средах для абонентской группы можно настроить добавочный телефонный номер, а не универсальный код ресурса (URI) протокола SIP.

Для каждого входящего вызова существует два потока мультимедиа: входящий на сервер единой системы обмена сообщениями и исходящий с данного сервера. Если в качестве типа абонентской группы установлен универсальный код ресурса (URI) протокола SIP, а в качестве кодека автоответчика для данной абонентской группы выбран кодек WMA, сервер единой системы обмена сообщениями пытается выбрать для входящего потока мультимедиа кодек RTAudio VoIP. Если согласование осуществляется успешно, кодек RTAudio для входящего потока будет использоваться для вызовов по автоответчику или вызовов с Office Communicator 2007.

Примечание.
Кодек RTAudio не используется для вызовов с помощью возможности воспроизведения на телефоне. Во входящем потоке для вызовов с помощью возможности воспроизведения на телефоне используется кодек G.711 или G.723.1.

При использовании кодека RTAudio голосовое сообщение записывается с высоким качеством звука и сохраняется как звуковой файл в формате WMA. Для пользователей Office Outlook 2007 или Outlook Web Access голосовое сообщение будет воспроизводиться с высоким качеством звука. Если согласование не выполнено, используется кодек G.711 или G.723.1 Кодеки G.711 и G.723.1 — узкополосные кодеки. Если эти кодеки используются в качестве кодека VoIP, голосовое сообщение записывается и сохраняется как узкополосный звуковой файл в формате WMA.

Для исходящего потока мультимедиа всегда используется кодек G.711 или G.723.1. Это означает, что звонящий всегда слышит по телефону узкополосный звук. Это верно и для тех случаев, когда вызов совершается с помощью приложения Office Communicator.

Звуковой формат и кодек, используемые серверами единой системы обмена сообщениями для хранения звука в голосовых сообщениях, зависят не только от аудиокодека, настроенного в абонентской группе, но также от скорости потока звуковых данных, которая согласовывается единой системой обмена сообщениями с одноранговым узлом SIP. Если в среду входят серверы Office Communications Server 2007 R2, Lync Server 2010 или конечные точки SIP, то сервер единой системы обмена сообщениями также согласует используемый аудиокодек с одноранговым узлом SIP. Например, если широкополосный кодек RTAudio согласован в качестве сетевого кодека, сервер единой системы обмена сообщениями будет использовать формат MP3 со скоростью 32 кбит/с или WMA 9.2 при создании голосовых сообщений, в зависимости от настройки абонентской группы. В таблице ниже показана взаимосвязь между аудиокодеком для хранения голосовых сообщений и используемым протоколом VoIP или сетевым аудиокодеком.

Связь между аудиокодеком хранения и протоколом VoIP или сетевым аудиокодеком

Аудиокодек, настроенный в абонентской группе единой системы обмена сообщениями VoIP или сетевой кодек (узкополосный) — G.723, G.711 или RTAudio (8 кГц) VoIP или сетевой кодек (широкополосный) — RTAudio (16 кГц)

G.711

G.711

Неприменимо. Сервер единой системы обмена сообщениями не согласовывает широкополосное аудио, если абонентская группа настроена на G.711.

WMA

WMA 9 Voice

WMA 9.2

GSM

GSM 6.10

Неприменимо. Сервер единой системы обмена сообщениями не согласовывает широкополосное аудио, если абонентская группа настроена на G.711.

MP3

MP3 (16 кбит/с)

MP3 (32 кбит/с)

Кодеки

Изменение размера сообщения единой системы обмена сообщениями

Единую систему обмена сообщениями можно настроить на использование одного из четырех аудиокодеков для создания голосовых сообщений: MP3, WMA, GSM 06.10 и G.711 PCM Linear. По умолчанию выбран формат MP3. Формат MP3 — это распространенный формат аудиофайлов, используемый для значительного уменьшения размера аудиофайлов и чаще других применяемый в персональных аудиоустройствах и MP3-плеерах. MP3 — это межплатформенный тип аудиокодека, используемый для совместимости со многими мобильными телефонами и устройствами, а также с различными компьютерными операционными системами.

Аудиокодек WMA всегда сохраняет данные в формате Windows Media, а вложением является файл с расширением WMA. Аудиофайлы, кодированные с помощью аудиокодеков GSM или G.711 PCM Linear, всегда сохраняются в формате RIFF или WAV, а вложением будет являться файл с расширением WAV.

Размер голосовых сообщений единой системы обмена сообщениями зависит от размера вложений, содержащих голосовые данные. В свою очередь размер вложений зависит от следующих факторов:

  • продолжительности записи голосовой почты;

  • используемого аудиокодека;

  • формата хранения звукового файла.

На приведенном ниже рисунке показано, как размер звукового файла зависит от продолжительности записи голосовой почты в случае каждого из трех аудиокодеков, используемых в единой системе обмена сообщениями.

Примечание.
На данном рисунке показано, что средняя длина голосового сообщения автоответчика примерно равна 30 секундам.

UM_Message_Sizing

MP3

По умолчанию выбран формат MP3, он также является форматом аудиофайлов по умолчанию для сообщений голосовой почты. Формат MP3 — это распространенный формат аудиофайлов, используемый для значительного уменьшения размера аудиофайлов и чаще других применяемый в персональных аудиоустройствах и MP3-плеерах. MP3 — это межплатформенный тип аудиокодека, используемый для совместимости со многими мобильными телефонами и устройствами, а также с различными компьютерными операционными системами.

WMA

WMA является аудиокодеком с наибольшим уровнем сжатия из всех трех типов кодеков. Сжатие составляет примерно 11 000 байт на каждые 10 секунд аудиопотока. Однако формат WMA имеет гораздо больший заголовок, чем формат WAV. Раздел заголовка WMA-файла составляет примерно 7 килобайт (КБ), тогда как раздел заголовка WAV-файла занимает менее 100 байт. Несмотря на то что аудиозаписи в формате WMA записываются дольше 15 секунд, они становятся меньше аудиозаписей в формате GSM. Поэтому для получения аудиофайлов наименьшего размера с самым высоким качеством используйте аудиокодек WMA.

G.711 PCM Linear

Аудиокодек G.711 PCM Linear создает несжатые WAV-файлы. Поэтому звуковые файлы WAV, созданные с помощью кодека G.711 PCM Linear, занимают наибольшее количество дискового пространства по сравнению с аудиокодеками GSM и WMA. WAV-файлы G.711 PCM Linear занимают более 160 000 байт на каждые 10 секунд звучания. WAV-файлы G.711 PCM Linear обеспечивают наивысшее качество аудио из всех трех кодеков единой системы обмена сообщениями. Однако качество сравниваемых аудиофайлов, созданных с помощью аудиокодеков WMA и GSM, подходит для большинства пользователей, прослушивающих голосовые сообщения.

GSM

Аудиокодек GSM создает сжатые WAV-файлы. WAV-файлы GSM занимают более 16 000 байт на каждые 10 секунд звучания. Однако с помощью GSM создается аудиофайл, который занимает больше места, чем файл, созданный с помощью аудиокодека WMA. Поэтому при попытке сбалансировать качество и размер голосового сообщения этот кодек может и не являться наилучшим выбором.

Кодеки



Размер звукового файла