Процесс передачи голоса по IP-сети состоит из нескольких этапов. Передача голоса: подходы, проблемы, решения Передача голоса между различными сетями

Алексей Шереметьев, Александр Непомнящий, Алексей Любимов

Традиционные подходы к построению телекоммуникационных сетей для передачи голоса и данных не подразумевают тесной взаимосвязи этих процессов. Управление двумя этими различными системами, естественно, связано со значительными вложениями в оборудование и обслуживающий персонал. В последние годы для решения этой проблемы было предложено несколько основополагающих вариантов реализации единой сетевой инфраструктуры для передачи разнородного трафика.

В 80-е годы территориально-распределенные корпоративные сети строились на основе выделенных каналов E1/T1. Для уплотнения каналов применялись мультиплексоры, ставшие, пожалуй, самыми первыми аппаратными платформами для интеграции голоса и данных в частных и публичных сетях и являющиеся наиболее распространенным способом передачи разнородного трафика по единой сети в настоящее время. В то же время принципы построения телефонных сетей кардинально не менялись. В таких сетях телефонные соединения устанавливаются по предопределенным маршрутам (основным и альтернативным) и страдают множеством ограничений: высокая стоимость поддержки большого количества маршрутных таблиц каждой УАТС (PBX) и их реконфигурации при изменении телефонных потоков, неэффективное использование полосы пропускания, ухудшение качества речи при применении механизмов сжатия в сетях с множеством АТС и др.

В течение последних лет были разработаны устройства, обеспечивающие передачу голоса по сетям, изначально нацеленным на передачу данных, таким, как frame relay (FR) и IP-сети. Движущей силой при этом является стремление сократить расходы на использование арендуемых линий связи и повысить эффективность применения выделенных корпоративных коммуникаций.

Новый импульс развитию телефонных сетей дало появление механизмов, обеспечивающих передачу голоса по АТМ-сетям, которые предусматривают возможность подключения АТС к АТМ-коммутаторам, способным коммутировать как потоки данных, так и голоса.

Изначально ориентированный на передачу данных, протокол frame relay довольно-таки быстро стал основой для передачи смешанного трафика: данных вычислительных сетей, речевых и факсимильных сообщений, обеспечивая при этом высокое качество и приемлемую стоимость решений. Широкое распространение frame relay объясняется малыми потерями при инкапсуляции (3 - 4%), возможностью выделения гарантированной полосы пропускания (CIR - Committed Information Rate), а также предсказуемостью и минимальными задержками передачи информации. Использование frame relay позволяет строить сети с интеграцией не только на выделенных каналах, но и на базе существующих глобальных сетей. Передача голоса по frame relay строится, как правило, на основе частных протоколов, например Voice Relay компании Motorola.

Известно, что для передачи одного голосового канала требуется пропускная способность 64 кбит/с (СТК). Однако это значение может быть снижено с помощью механизмов сжатия голосовой информации и технологии подавления пауз. Алгоритмы, реализованные в специализированных процессорах для обработки цифрового сигнала (Digital Signal Processor - DSP), обеспечивают сжатие цифрового голосового сигнала до уровня 32, 16, 8 кбит/с и менее. Как правило, телефонный разговор состоит из речи всего лишь на 40 - 50%, поэтому если выделять паузы и не передавать молчание по линиям связи, а использовать высвобождающееся время для передачи данных, то можно достичь еще большей экономии пропускной способности.

Для того чтобы обеспечить необходимое качество передачи голоса, нужно, согласно рекомендациям МСЭ-Т, чтобы задержки при передаче речи по международным линиям связи не превышали 150 мс. Это возможно, во-первых, при использовании системы приоритетов, во-вторых, при фрагментации пакетов данных, в-третьих, при снижении числа процедур компрессии/декомпрессии. При этом пакеты, содержащие голосовой сигнал, должны передаваться раньше пакетов с данными, а сетевой трафик из пакетов переменной длины, приводящий к появлению значительных пауз в восстановленной речи и низкому качеству ее звучания, должен разбиваться на небольшие пакеты фиксированной длины, с тем чтобы время передачи каждого пакета составляло от 5 до 10 мс. Допустимое число процедур компрессии/декомпрессии зависит от используемого алгоритма сжатия, длины линий и других факторов. Как будет показано далее, для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз.

Для успешной передачи голоса по frame relay необходимо решить проблему правильной обработки заторов. Как известно, при передаче пакетов данных по этим сетям подтверждений о получении пакетов не посылается, а проверка целостности данных производится только средствами протоколов более высоких уровней. Поскольку надежность передачи пакетов в современных сетях достаточно высока, то такой подход не приводит к существенным потерям, одновременно позволяя значительно снизить накладные расходы на пересылку данных. При передаче голосовых данных потеря пакетов вызывает нарушение воспроизведения голоса на приемной стороне, поэтому следует приложить максимум усилий для решения этой проблемы. Одной из ситуаций, которая может привести к потере пакетов, является затор, возникающий, когда тот или иной коммутатор оказывается не в состоянии пропустить по исходящим от него каналам весь поступающий на него трафик. При возникновении затора коммутатор посылает специальное сообщение всем устройствам доступа, от которых исходит трафик, вызвавший затор. Реакцией на это сообщение должно являться снижение скорости передачи данных в сеть, однако не все устройства доступа обладают такой способностью. Для корректной передачи голоса эффективная обработка заторов является абсолютно необходимой, в противном случае трудно ожидать, что вся пересылаемая голосовая информация дойдет по назначению в случае возникновения затора.

Посмотрим, как вышеперечисленные проблемы решаются компанией Motorola в уже упомянутой технологии Voice Relay.

Когда маршрутизатор MPR 6520/6560 обнаруживает на одном из своих голосовых портов вызов, то, во-первых, он фиксирует длину всех пакетов, передаваемых через вызываемый канал FR, как голосовых, так и пакетов с данными, а во-вторых, для качественной передачи голоса присваивает голосовым пакетам более высокий приоритет при передаче, причем между двумя голосовыми пакетами может быть передано не более двух пакетов с данными.

В оборудовании Motorola применяется механизм под названием smoothing delay (плавная задержка), сущность которого состоит в том, что если источником послана последовательность пакетов VDDVX (где V - голосовой пакет, D - пакет с данными, а стрелка указывает порядок передачи пакетов), то на стороне приемника первый голосовой пакет “придерживается” для устранения задержки и последовательность пакетов выглядит как VVDDX. Motorola “умеет” восстанавливать потерянные пакеты. Как уже отмечалось, frame relay - это протокол, в котором проверка данных на правильность при передаче отсутствует. Проверку осуществляют протоколы верхних уровней. Для голосовых пакетов (с целью уменьшения задержек) проверка не осуществляется, но при получении сбойного пакета или же при потере пакета MPR 6520/6560 интерполирует утерянный пакет в силу аналоговой природы голоса.

Voice Relay имеет в своем составе механизм подавления эха (echo cancellation) и использует паузы в разговоре для передачи данных. По окончании разговора MPR 6520/6560 ждет в течение 30 с, не начнется ли разговор снова, и отменяет фиксацию длины пакета, переходя вновь к переменной длине. Соответственно, отключаются все функции передачи голосовой информации, т. е. передаются только данные.

Несмотря на все перечисленные трудности, технология передачи голоса по сетям frame relay имеет много сторонников и достаточно широко применяется для связи между штаб-квартирой компании и ее филиалами.

Однако сети FR ограничены полосой пропускания T1/E1, что может быть недостаточно при передаче быстро растущего объема голосового трафика и данных.

IP-телефония

IP становится стандартным протоколом для магистральных сетей корпораций при построении интра- и экстрасетей, а также при подключении предприятий к Интернету. Решения VoIP, т. е. передача голоса поверх IP-протокола, становятся все более и более plug and play, что определяет легкость их установки и обучения пользователей. Однако если вы используете программное решение, то соответствующее обеспечение должно быть установлено на каждом ПК, с которым требуется установить связь; необходимо также обучение каждого пользователя применению VoIP-программы. В качестве более сложного VoIP-решения может быть использован шлюз, устанавливаемый на единственном сервере (персональном компьютере) в центральном офисе и филиалах. Этот сервер может выполнять и другие функции. При использовании шлюза VoIP-функция прозрачна для пользователя, работающего с обычным телефоном и факс-аппаратом.

1. Функция поиска. Когда исходящий IP-шлюз размещает телефонный вызов через IP-сеть, он принимает номер вызывающего абонента и конвертирует его в IP-адрес шлюза назначения на основе данных таблицы в исходящем шлюзе или централизованном сервере. Просмотр таблицы в исходящем шлюзе часто требует меньше времени, чем просмотр в централизованном сервере: время соединения - 1 - 2 секунды, а не 4 - 5, как во втором случае.

2. Функция связи. Исходящий шлюз устанавливает соединение со шлюзом назначения, обмениваясь информацией о параметрах соединения и совместимости устройств.

3. Функция оцифровки. Аналоговые сигналы телефонной связи, входящие в шлюз, оцифровываются шлюзом и преобразуются обычно в 64 кбит/с ИКМ-сигнал. Эта функция требует от шлюза поддержки разнообразных интерфейсов телефонной связи.

4. Функция демодуляции. Некоторые шлюзы могут принимать только голосовой сигнал или сигнал факса, но не оба вместе, поэтому должны быть заранее определены магистральные каналы к модулям обработки голоса или факса. Более сложные шлюзы могут обрабатывать данные обоих типов, автоматически определяя, является ли цифровой сигнал звуковым или факсимильным, и производя обработку сигнала в соответствии с его типом. Если сигнал факсимильный, то он демодулируется сигнальным процессором (DSP) обратно в цифровой формат 2,4 - 14,4 кбит/с. Этот демодулированный сигнал затем помещается в IP-пакеты для передачи к шлюзу назначения. После этого демодулированная информация перемодулируется обратно в аналоговый факс-сигнал шлюзом назначения для доставки к факс-аппарату.

Передача факса может быть осуществлена с использованием или UDP/IP-, или TCP/IP-форматов. UDP/IP в отличие от TCP/IP не требует исправления ошибок в передаче пакетов. Казалось бы, что формат UDP/IP предпочтительнее, так как поврежденный пакет факса мог бы затронуть только одну линию факса. Однако, если потери пакетов происходят во время обработки страницы negotiation, передача факса может быть закончена. При использовании TCP/IP программное обеспечение хоста скрывает повторную передачу TCP-пакетов с данными факса, не оказывая на документ никакого воздействия.

5. Функция компрессии. После определения того, что сигнал является голосовым, он обычно сжимается сигнальным процессором (DSP) с использованием одного из методов компрессии/декомпрессии (табл. 1) и помещается в IP-пакеты. При этом важно обеспечение хорошего качества речи и малой задержки при оцифровке.

Таблица 1. Методы компрессииречи

Звуковые пакеты передаются как пакеты UDP/IP, а не TCP/IP во избежание довольно-таки больших задержек, возникающих при повторной передаче последних. Если используется режим FEC (непосредственное исправление ошибок), то искаженный или отсутствующий звуковой пакет может быть восстановлен на основе данных предыдущего звукового пакета. Если механизм FEC не применяется, то искаженный пакет просто отвергается и шлюз использует предыдущий пакет. Этот механизм работает незаметно для пользователя в случае низкого процента искажения/потерь пакетов (<5%), в противном случае действует хорошо отработанная техника коррекции звука: “А? Не слышу+ Громче+”.

Данные, оцифровываемые КОДЕКом, не содержат адрес IP-пакета и управляющую информацию, или “заголовок”, которые обычно составляют дополнительные 7 кбит/с, если IP-маршрутизатор отдельно не компрессирует заголовок, в противном случае - 2 - 3 кбит/с.

Сложность обработки определяется мощностью необходимого DSP-процессора, требуемой для обработки голосового сигнала, исключая функции компенсации эха и подавления молчания, и измеряемой в миллионах операций в секунду (MIPS). Более низкая сложность подразумевает меньшие затраты DSP на обработку.

6. Функция декомпрессии/перемодуляции. Шлюз, исполняя шаги 1 - 4, описанные выше, в то же самое время принимает пакеты от других IP-шлюзов и декомпрессирует пакеты, вновь придавая им форму, “понятную” соответствующим устройствам аналоговой телефонной связи, цифровой сети с интеграцией служб или с интерфейсами T1/E1. Он также может осуществлять перемодуляцию цифрового факса обратно к первоначальному виду, а затем - в соответствующий интерфейс телефонной связи.

Кроме того, шлюз может выполнять функции согласования интерфейсов инициатора звонка и принимающего вызов, делая необходимые преобразования.

Описанный выше процесс передачи голоса через VoIP-шлюз отличается от механизма передачи голоса по сетям frame relay, используемого маршрутизаторами голоса/факса и устройствами доступа frame relay, (FRAD). VoIP-шлюз является устройством локальной вычислительной сети, которое способно сократить затраты при передаче речи и факсов по региональной сети связи, причем соединения по сети связи осуществляются маршрутизатором, а не шлюзом. Маршрутизатор голоса/факса или FRAD, однако, являются устройствами региональной сети связи, соединяющими локальную вычислительную сеть с региональной сетью связи, что во многом определяет их функции, повышает сложность их исполнения, а также предъявляет более высокие требования к их отказоустойчивости и управляемости по сравнению со шлюзом.

При передаче голоса через IP-сеть возникает, как и в случае с frame relay, проблема задержки голосовых пакетов, причем в отличие от frame relay возникающие в Интернете непредсказуемые заторы и задержки, кардинально понижающие качество передачи голоса, пользователь никак не может контролировать.

При этом пользователям не стоит забывать, что технология передачи голоса через IP-сети еще не устоялась. Если у инициатора вызова и его адресата не установлено идентичное ПО голосового обмена через IP, то поговорить им, скорее всего, не удастся.

Для того чтобы программное обеспечение различных производителей было способно к взаимодействию, необходима поддержка стандартов, таких, например, как H.323.

Пользователи надеются, что массовое внедрение Интернета поможет решить проблему пропускной способности и тем самым избежать задержек при передаче голоса. Однако контролировать этот процесс невозможно, поэтому производители работают и над другими проблемами.

Большие надежды возлагаются на протокол резервирования ресурсов (Resource Reservation Protocol - RSVP), благодаря которому оказывается возможным сквозное резервирование пропускной способности Интернета для передачи чувствительного к задержкам трафика. RSVP был разработан для передачи мультимедийного трафика по IP-сетям, однако он может быть использован и для передачи голоса. Согласно этому протоколу маршрутизаторы обмениваются сигналами, запрашивая свободный путь по сети. Главный недостаток такого подхода заключается в том, что запросов может быть столько, что маршрутизаторы окажутся не в состоянии все их обслужить.

ATM имеет все предпосылки к тому, чтобы стать единой магистралью для разнотипного трафика. Эта технология позволяет гибко использовать пропускную способность сети. Одним приложениям может быть дан более высокий приоритет по сравнению с другими. С помощью ATM имеющаяся пропускная способность может динамически распределяться между различными приложениями, причем пользователи даже не будут знать, каким образом они обмениваются телефонными звонками или как данные добираются из одного места в другое.

Почему многие предпочитают ATM, а не IP? Одна из причин этого - очень малая задержка (порядка 20 мс) при передаче голоса по этим сетям. При передаче же голоса по IP задержка возрастает до 300 мс, в результате чего голос на выходе звучит иначе, чем в случае обычной телефонной связи.

С 1997 г. ATM Forum ратифицировал шесть новых спецификаций, призванных обеспечить совместимость продуктов различных производителей и упростить переход конечных пользователей к ATM. Среди них - Multiprotocol over ATM (MPOA), LAN Emulation (LANE) 2.0, инверсное мультиплексирование для ATM, динамическое использование пропускной способности, интерфейс “пользователь - сеть” на базе кадров FUNI 2.0.

Одной из наиболее ожидаемых была спецификация “Голос и телефония по ATM до настольных систем” (Voice and Telephone over ATM - VTOA - to the Desktop Specification), описывающая коммутируемые голосовые службы по сети ATM для обычных телефонов. Аналогично тому, как MPOA и LANE задействуют имеющиеся протоколы и услуги, VTOA поддерживает передачу традиционного голосового трафика с помощью протоколов ATM.

VTOA открывает доступ к частным и общедоступным сетевым голосовым услугам и имеет функции поддержки широкополосных терминалов. Эти терминалы могут быть подключены к любому телефону в сети, использующему импульсно-кодовую модуляцию G.711 для кодирования голосовых каналов на 64 кбит/с. G.711 принят институтом ITU-T и является в настоящее время наиболее распространенной голосовой службой для настольных систем.

Для поддержки таких функций, как предупреждение и сообщение о продвижении вызова, VTOA to the Desktop Specification предусматривает использование интерфейса “пользователь - сеть” версии 4.0 (User-Network Interface - UNI), определяющего связь между конечными пользователями или конечной станцией и локальным коммутатором, либо интерфейса “сеть - сеть” (Private Network-to-Network Interface - PNNI) 1.0, определяющего взаимодействие между двумя коммутаторами.

В случае предъявления высоких требований к эффективности использования полосы пропускания голосовой трафик лучше передавать с применением службы переменной скорости передачи битов (Variable Bit Rate - VBR).

Там же, где эффективность использования полосы пропускания не является доминирующим фактором, применение CBR-службы будет более дешевым и простым решением.

Механизмы адаптации - ATM Adaptation Layer, AAL (табл. 2) - обеспечивают передачу различного типа трафика, в том числе голоса между PBX. Так, уровень AAL0 поддерживает нестандартные алгоритмы адаптации голоса, уровень AAL1 - передачу голоса в режиме CBR (выделяется полоса пропускания соответствующей ширины). Ячейки AAL1 форматов SDT и UDT дают возможность передавать по сети информацию о синхронизации (time stamp), частично заполненные ячейки данных для уменьшения задержек, а также значение счетчика ячеек для обнаружения потерь ячеек. Работа на уровне AAL5 - наиболее дешевый способ доведения голоса по ATM до рабочего места с использованием режима CBR. Однако он не подходит для сетей, использующих AAL1.

Таблица 2. Механизмы адаптации АТМ

В общем случае механизм адаптации AAL принимает пакеты от протоколов верхнего уровня, разбивает их на 48-байтовые сегменты и формирует поле полезной нагрузки ячеек АТМ.

Стремление к более эффективному использованию полосы пропускания стимулирует развитие механизмов сжатия речи. Стандартный ИКМ-сигнал (РСМ) для передачи речи требует, как уже отмечалось, выделения полосы пропускания 64 кбит/с (рекомендация МСЭ-Т G.711), что является явно избыточным.

Один из старейших алгоритмов сжатия речи - ADPCM (Adaptive Differential Pulse Code Modulation; стандарт G.726 был принят в 1984 г.). Этот алгоритм дает практически такое же качество воспроизведения речи, как и ИКМ, однако для передачи информации при его использовании требуется полоса всего в 16 - 32 кбит/с. Метод основан на том, что в аналоговом сигнале, передающем речь, невозможны резкие скачки интенсивности. Поэтому если кодировать не саму амплитуду сигнала, а ее изменение по сравнению с предыдущим значением, то можно обойтись меньшим числом разрядов. В ADPCM изменение уровня сигнала кодируется четырехразрядным числом, при этом частота измерения амплитуды сигнала сохраняется неизменной.

Все методы кодирования, основанные на определенных предположениях о форме сигнала, не подходят при передаче сигнала с резкими скачками амплитуды. Именно такой вид имеет сигнал, генерируемый модемами или факсимильными аппаратами, поэтому аппаратура, поддерживающая сжатие, должна автоматически распознавать сигналы факс-аппаратов и модемов и обрабатывать их иначе, чем голосовой трафик.

Многие методы кодирования берут свое начало от метода LPC (Linear Predicative Coding). В качестве входного сигнала в LPC используется последовательность цифровых значений амплитуды, но алгоритм кодирования применяется не к отдельным цифровым значениям, а к определенным их блокам. Для каждого такого блока значений вычисляются его характерные параметры: частота, амплитуда и ряд других. Именно эти значения и передаются по сети. При таком подходе к кодированию речи, во-первых, возрастают требования к вычислительным мощностям специализированных процессоров, используемых для обработки сигнала, а во-вторых, увеличивается задержка при передаче, поскольку кодирование применяется не к отдельным значениям, а к некоторому их набору, который перед началом преобразования следует накопить в определенном буфере. Важно, что задержка в передаче речи связана не только с необходимостью обработки цифрового сигнала (эту задержку можно уменьшать, увеличивая мощность процессора), но и непосредственно с характером метода сжатия. Этот метод позволяет достигать очень больших степеней сжатия, которым соответствует полоса пропускания 2,4 или 4,8 кбит/с, однако качество звука здесь сильно страдает. Поэтому в коммерческих приложениях он не используется, а применяется в основном для ведения служебных переговоров.

Более сложные методы сжатия речи основаны на применении LPC в сочетании с элементами кодирования формы сигнала. В этих алгоритмах используется кодирование с обратной связью, когда при передаче сигнала осуществляется оптимизация кода. Закодировав сигнал, процессор пытается восстановить его форму и сличает результат с исходным сигналом, после чего начинает варьировать параметры кодировки, добиваясь наилучшего совпадения. Достигнув такого совпадения, аппаратура передает полученный код по линиям связи; на противоположном конце происходит восстановление звукового сигнала. Ясно, что для использования такого метода требуются еще более серьезные вычислительные мощности.

Одной из самых распространенных разновидностей описанного метода кодирования является метод LD-CELP (Low-Delay Code-Excited Linear Prediction). Он позволяет достичь удовлетворительного качества воспроизведения при пропускной способности 16 кбит/с. Этот метод был стандартизован Международным союзом электросвязи (International Telecommunications Union - ITU) в 1992 г. как алгоритм кодирования речи G.728. Алгоритм применяется к последовательности цифр, получаемых в результате аналого-цифрового преобразования голосового сигнала с 16-разрядным разрешением.

Пять последовательных цифровых значений кодируются одним 10-битовым блоком - это и дает те самые 16 кбит/с. Для применения этого метода требуются большие вычислительные мощности; в частности, для прямолинейной реализации G.728 необходим процессор с быстродействием 44 MIPS.

В марте 1995 г. ITU принял новый стандарт - G.723, который предполагается использовать при сжатии речи для организации видеоконференций по телефонным сетям. Этот стандарт представляет собой часть более общего стандарта H.324, описывающего подход к организации таких видеоконференций. Цель - организация видеоконференций с использованием обычных модемов. Основой G.723 является метод сжатия речи MP-MLQ (Multipulse Maximum Likelihood Quantization). Он позволяет добиться весьма существенного сжатия речи при сохранении достаточно высокого качества звучания.

В основе метода лежит описанная выше процедура оптимизации; с помощью различных усовершенствований можно сжимать речь до уровня 4,8; 6,4; 7,2 и 8,0 кбит/с. Структура алгоритма позволяет на основе программного обеспечения изменять степень сжатия голоса в ходе передачи. Вносимая кодированием задержка не превышает 20 мс.

Повышая эффективность использования полосы пропускания, механизмы сжатия речи в то же время могут привести к ухудшению ее качества и увеличению задержек. Некоторые основные алгоритмы сжатия речи и создаваемые при этом задержки приведены в табл. 1.

Количественными характеристиками ухудшения качества речи являются единицы QDU (Quantization Distortion Units): 1 QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры ИКМ; значения QDU для основных методов компрессии приведены в табл. 3. Дополнительная обработка речи ведет к дальнейшей потере качества. Согласно рекомендациям МСЭ-Т, для международных вызовов величина QDU не должна превышать 14, причем передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU.

Таблица 3. Ухудшение качества речи при использовании

различных алгоритмов сжатия

Следовательно, при передаче разговора по национальным сетям должно теряться не более 5 QDU. Поэтому для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является обязательным требованием регулирующих органов по отношению к корпоративным сетям, подключенным к сетям общего пользования.

Подавление пауз (silence suppression) - важная функция АТМ-коммутаторов. Суть технологии подавления пауз заключается в определении различия между моментами активной речи и молчания в период соединения. В результате применения этой технологии генерация ячеек происходит только в моменты активного разговора. Поскольку в процессе типичного разговора по телефону тишина составляет до 60% времени, происходит двукратная оптимизация по количеству данных, которые должны быть переданы по линии. Объединение технологии сжатия речи и подавления пауз речи в коммутаторах приводит к уменьшению потока данных в канале до восьми раз.

Технологии Newbridge

Модернизированные устройства серии MainStreet, например MainStreet 3600+, позволяют определять различные классы обслуживания для голосового трафика. Они поддерживают алгоритмы HCV (High Capacity Voice) 8,16 кбит/с, LD-CELP (16 кбит/с) и A-CELP (8 кбит/с), основанные на стандартах ITU. Поддерживаются разнообразные голосовые интерфейсы: E&M (Type I, II, III, IV, V), LS/GS Subscriber (FXS), LS/GS Exchange (FXO), T1 D4 and ESF (Extended Superframe) formats, E1 CAS and CCS, R2D (E&M), MRD Channel Unit.

Помимо этого в соответствии с недавно опубликованной спецификацией Frame Relay Forum FRF.11 Implementation Agreement в них реализована технология Voice over Frame Relay (VoFR). Этот метод позволяет осуществлять компрессию голосового трафика и разбиение его на пакеты для передачи в режиме переменной скорости (VBR).

По словам представителей Newbridge, эти продукты позволят телекоммуникационным компаниям предоставлять самые современные услуги телефонной связи и одновременно снизить расходы на эксплуатацию сетей. Если пользователь считает необходимым изменить драйверы прикладных программ, конфигурация сети может быть легко изменена путем загрузки соответствующего программного обеспечения таким образом, чтобы предоставлять услуги другого класса. Комплексные решения Newbridge дают возможность осуществлять централизованное управление всей сетью из любой ее точки.

Технология VoFR, разработанная Newbridge Networks совместно с ее дочерней компанией Castleton Network Systems, позволяет снизить стоимость эксплуатации сетей благодаря уменьшению средней полосы пропускания и использованию полосы, выделенной для сети frame relay, для одновременной передачи голоса и данных. Данный метод обеспечивает более эффективное распределение полосы пропускания в узкополосных периферийных сетях, где объемы голосового трафика и данных сильно варьируются, а эффективность использования имеющейся полосы играет решающую роль. Помимо этого пакеты VoFR могут легко передаваться по АТМ-магистралям как обычный трафик frame relay. Общая стратегия компании Newbridge предусматривает использование в своих устройствах технологии AssuredVoice - передачи голоса по сетям FR, ATM и IP компании Castleton.

В продукции Newbridge Networks также реализованы усовершенствованные механизмы для обеспечения качества обслуживания (QoS), определенные Frame Relay Forum, на транспортном уровне frame relay. Эти механизмы предоставляют приоритет трафику, чувствительному ко времени задержки (например, голосовому). Они контролируют время задержки пакетов и управляют передачей голосового трафика в условиях перегрузок сети, что гарантирует качество звука, передаваемого по сетям frame relay.

В этом году компания представила мультиплексор 3608 MainStreet Packet Access Mux, обеспечивающий экономное выделение полосы пропускания по требованию для приложений, обеспечивающих голосовую связь в сетях frame relay. Этот мультиплексор позволяет объединить качественную телефонную связь с передачей факсов и данных из удаленного офиса по одному соединению frame relay. В данном устройстве также реализована технология сжатия голоса A-CELP.

Оборудование Cisco Systems

Cisco Systems провозгласила пятиэтапную стратегию открытых систем и технологий, призванную помочь пользователям интегрировать данные, голос и видео “от и до”: от более мелких узлов доступа до крупных магистральных узлов. В этой стратегии используется ПО Cisco IOS, обеспечивающее передачу голоса по IP, frame relay и ATM через мультисервисную сетевую среду.

Третья фаза стратегии интеграции данных, голоса и видео делает основной упор на шлюзы между различными средами в условиях сосуществования разнообразных служб и технологий. Сюда входят шлюзы от сетевых протоколов к протоколам телефонных станций, а затем к протоколам телефонных сетей общего пользования и ISDN, шлюзы от средств низкоскоростного доступа к средствам широкополосной магистральной коммутации и шлюзы от среды коммутации цепей к среде коммутации пакетов (IP, FR) и ячеек (ATM).

Некоторые устройства, например новый многофункциональный концентратор доступа Cisco MC3810, используют режим переменной скорости передачи данных в реальном масштабе времени (VBR-rt) АТМ или сеть frame relay для передачи сжатого голоса. Благодаря применению статистических методов мультиплексирования и алгоритмов компрессии повышается эффективность использования ширины полосы пропускания. Аналогичными возможностями, но в мире IP-сетей обладают маршрутизаторы Cisco серий 3600 и 2600.

Другие продукты типа модулей эмуляции соединений (Circuit Emulation) для маршрутизатора Cisco 7200, АТМ-коммутатора LightStream 1010 и коммутатора для кампусных сетей Catalyst 5500 используют для передачи голоса по АТМ-сетям постоянную скорость передачи данных (CBR). Этот подход обеспечивает возможность взаимодействия в сетях АТМ-оборудования от различных поставщиков и позволяет применять системы, не поддерживающие протоколы УАТС, для передачи телефонного трафика по единой сетевой инфраструктуре предприятия.

Многофункциональный концентратор доступа Cisco МС3810, представленный компанией Cisco Systems, объединяет передачу данных по локальным сетям, синхронную передачу данных, видео, речевых и факсимильных сообщений для транспортировки через общедоступные или частные сети frame relay, ATM или сети с временным разделением каналов (TDM).

Устройство MC3810 программно поддерживает АТМ и frame relay. Голос, факс и данные транспортируются через ATM с использованием AAL5 (VBR).

К устройству Cisco MC3810 можно подсоединить любую телефонную станцию (PBX) или телефон. Оно обеспечивает сжатие речевых сообщений до 8 кбит/с при применении ACELP - стандартного алгоритма G.729 CS. Устройства используют технологию подавления пауз Voice Activity Detection (VAD) для сокращения речевого трафика во время пауз с целью снижения стоимости функционирования канала при повременной оплате.

Семейство многофункциональных модульных маршрутизаторов серий Cisco 3600 и 2600 предназначено для объединения удаленных небольших офисов в составе корпоративных систем, а также для подключения таких офисов к глобальным сетям общего пользования.

Модульная архитектура маршрутизаторов предоставляет возможность их адаптации к реальным условиям сетей заказчиков. Интерфейсные модули для доступа к глобальным сетям (WAN-модули), предназначенные для семейств Cisco 1600, 2600 и 3600, поддерживают большое количество последовательных интерфейсов, интерфейс ISDN BRI, а также набор канальных интерфейсов CSU/DSU для основных и резервных каналов связи. Голосовой модуль для маршрутизаторов серий Cisco 3600 и 2600 позволяет осуществлять интегрированную передачу голоса, факсимильных сообщений и данных, имеет интерфейс с существующими телефонными аппаратами, факс-машинами, офисными PBX (FXO, FXS, E&M). Качество передаваемого голоса обеспечивается за счет применения механизма компрессии и технологий QoS (Quality of Service) Cisco IOS, таких, как RSVP и механизм взвешенного сокращения очередей WFQ (Weighted Fair Queuing). Каждый голосовой модуль поддерживает два или четыре голосовых канала, а также стандарт H.323 и несколько протоколов компрессии, включая G.711 и G.729.

Для построения многосервисных глобальных сетей используются коммутаторы серии Cisco IGX 8400 с интерфейсами для транспортировки данных АТМ, frame relay, синхронных и асинхронных систем передачи данных, Интернета, а также видеосигнала и речевого трафика.

Коммутатор IGX использует для передачи ячеек АТМ внутреннюю шину с пропускной способностью 1,2 Гбит/с для связи интерфейсных и магистральных модулей в составе системы и обеспечивает передачу голосовых сообщений с реализацией интерфейсов Е1, Т1 и Y1, функций определения активности голосового канала, подавление пауз и коммутации звонков, а также механизмов компрессии речи ADPCM-32К, 24К и 16К, LD-CELP-16К.

Применение технологии Voice Network Switching (VNS) предоставляет коммутируемые виртуальные каналы (SVC) для передачи голоса и данных по мультисервисной сети (IGX, BPX). Для пользователей учрежденческих телефонных станций (PBX), использующих сигнальные протоколы Digital Private Network Signaling System (DPNSS), QSIG или Q931A (Japanese ISDN), появляется возможность поддерживать между собой голосовую связь по требованию, так же как если бы они (пользователи) звонили на PSTN. При одновременном применении VNS с установленным в IGX модулем Universal Voice Module Model C (UVM-C), выполняющим преобразование CAS-to-QSIG, VNS также коммутирует звонки от PBX, используя Channel Associated Signaling (CAS). Поддерживаемые сигнальные протоколы являются вариантами Integrated Services Digital Network (ISDN). VNS обеспечивает прямое соединение PBX, устраняя необходимость тандемных соединений. Другими словами, использование VNS в сети позволяет уменьшить количество транков E1, требуемых для взаимного объединения PBX, и предоставляет замену тандемным PBX.

За последние годы было предложено несколько решений по созданию универсальной инфраструктуры для передачи разнородного трафика. В условиях повышенных требований к качеству сервиса и ширине полосы пропускания необходимы сети с услугами высокого качества и повышенной скоростью передачи.

IP играет ключевую роль в обеспечении гибкости обслуживания. Для того чтобы увеличить общую рентабельность сети, поставщики должны предоставить услуги, основанные на IP или способные «понимать» IP, так как большинство приложений, требующих предоставления услуг глобальных сетей, использует IP. А поскольку потребители продолжают требовать от своих поставщиков предоставления дополнительных функциональных возможностей, поставщики должны постоянно искать все новые и новые услуги, которые смогут дополнить и усилить приложения потребителей. Можно с уверенностью говорить о том, что эти услуги должны быть основаны на IP.

IP становится стандартным протоколом для корпоративных, intranet- и extranet-сетей. В 80-е годы территориально-распределенные корпоративные сети строились на основе выделенных каналов E1/T1. Для уплотнения каналов применялись мультиплексоры, используемые для интеграции голоса и данных в сетях общего пользования и в частных сетях. В то же время принципы построения телефонных сетей кардинально не менялись. В таких сетях телефонные соединения устанавливаются по предопределенным маршрутам (основным и альтернативным) и «страдают» множеством ограничений: высокая стоимость поддержания большого количества маршрутных таблиц каждой УАТС (PBX) и их реконфигурации при изменении телефонных потоков, неэффективное использование полосы пропускания, ухудшение качества речи при применении механизмов сжатия в сетях с множеством АТС и другие.

В последние годы были разработаны устройства, обеспечивающие передачу голоса по сетям, изначально нацеленным на передачу данных, таким как Frame Relay и IP-сети. Движущей силой при этом является стремление сократить расходы на использование арендуемых линий связи и повысить эффективность применения выделенных корпоративных коммуникаций.

Новый стимул развитию телефонных сетей дало появление технологии передачи голоса по АТМ-сетям, которая предусматривает возможность подключения АТС к АТМ-коммутаторам, способным обрабатывать как потоки данных, так и телефонные сигналы.

В данной статье описываются:

  • технологии передачи голоса и данных по IP-сетям;
  • проблемы построения интегрированных сетей;
  • механизмы, обеспечивающие повышение эффективности полосы пропускания и гибкости управления потоками (компрессии, подавления пауз речи);
  • оборудование ведущих производителей.

Что такое IP-телефония

Телефонная связь по IP - сравнительно молодая служба, использующая, как правило, управляемую IP-сеть для передачи телефонного трафика.

В течение следующих пяти лет ожидаются феноменальные темпы роста рынка услуг VoIP (голос поверх IP). Согласно данным Killen & Associates, в компаниях, входящих в список Fortune 1000, по IP-сетям сейчас проходит менее 1% голосового трафика; к 2002 году эта доля должна достигнуть 18%, а к 2005-му - 33%.

Пользователей и поставщиков услуг привлекают экономические выгоды применения IP для передачи телефонного трафика, проведения конференц-связи с одновременным обменом информацией, IP-центры обслуживания звонков, прозрачная маршрутизация запросов пользователей.

Сравнение качества стандартной телефонной связи по сетям общего пользования с первым поколением устройств VoIP оказывается не в пользу последних, в первую очередь из-за низкой надежности и невысокого качества обслуживания. Однако появление сложных современных приложений и устройств - высокопроизводительных коммутаторов и маршрутизаторов, использующих развитые механизмы управления качеством обслуживания (QoS) процессоров цифровых сигналов (DSP), - устраняет многие проблемы VoIP-систем второго поколения.

Под IP-телефонией понимается технология использования IP- сети (Internet или любой другой) в качестве средства организации и ведения телефонных разговоров и передачи факсов в режиме реального времени. IP-телефония является одним из наиболее сложных приложений компьютерной телефонии.

В общих чертах передача голоса в IP-сети происходит следующим образом. Входящий звонок и сигнальная информация из телефонной сети передаются на пограничное сетевое устройство, называемое телефонным шлюзом, и обрабатываются специальной картой устройства голосового обслуживания. Шлюз, используя управляющие протоколы семейства H.323, перенаправляет сигнальную информацию другому шлюзу, находящемуся на приемной стороне IP-сети. Приемный шлюз обеспечивает передачу сигнальной информации на приемное телефонное оборудование согласно плану номеров, гарантируя сквозное соединение. После установления соединения голос на входном сетевом устройстве оцифровывается (если он не был цифровым), кодируется в соответствии со стандартными алгоритмами ITU, такими как G.711 или G.729, сжимается, инкапсулируется в пакеты и отправляется по назначению на удаленное устройство с использованием стека протоколов TCP/IP.

Таким образом, используя IP-сеть, можно обмениваться цифровой информацией для пересылки голосовых или факсимильных сообщений между двумя компьютерами в режиме реального времени. Применение Internet позволит реализовать данную службу в глобальном масштабе.

Основными проблемами построения IP-сети для передачи телефонного трафика являются механизмы управления задержками и поддержание достаточной ширины полосы пропускания. Кроме того, важны способы установления тарифов на услуги и выставления счета за их использование, а также варианты оплаты в IP-сети дополнительных услуг, таких как переадресация вызова, определение номера абонента, маршрутизация в зависимости от времени суток и др.

Немаловажной является проблема оценки прибыльности новой технологии. Действительно ли объединение средств связи на базе IP-сетей сулит значительную экономию? Ответ на этот вопрос можно получить только при комплексном рассмотрении проблемы. Возможно, все обстоит именно так. Если стоимость передачи информации по сети составляет лишь 15-20% от всех затрат на поддержку сетевой инфраструктуры, то 70-процентная экономия сетевых расходов может показаться не столь привлекательной по сравнению с объемом работы, который необходимо будет проделать для перевода всех функций на универсальную основу, а также по сравнению с количеством затрачиваемых средств на создание универсальной инфраструктуры и возможностью использования имеющегося оборудования.

И это лишь малая часть всех проблем, связанных с внедрением универсальных линий связи. Поэтому, как правило, предложение поставщиками услуг интегрированных сетей начинается с создания небольших специализированных сетей, на которых происходит обкатка интеграционных технологий, поиск ответов на вопросы, возникающие при объединении различных видов связи. Однако уже сейчас можно говорить о реальности построения интегрированной инфраструктуры.

Общий подход к построению IP-сети для передачи телефонного трафика

  • «компьютер - компьютер»

    Данный вариант не является примером IP-телефонии, так как голос передается только по сети передачи данных, без выхода в телефонную сеть. Для организации передачи трафика пользователь приобретает необходимое оборудование и программное обеспечение, а также платит провайдеру за эксплуатацию канала связи. Достоинство этого варианта заключается в максимальной экономии средств. Недостаток - минимальное качество связи.

  • «телефон - телефон»

    Для организации такой связи необходимо наличие определенных сетевых устройств и механизмов взаимодействия. Голосовой трафик передается через IP-сеть, как правило, на отдельном дорогостоящем участке. Устройствами, организующими взаимодействие, являются шлюзы, состыкованные, с одной стороны, с телефонной сетью общего пользования, а с другой - с IP-сетью. Голосовая связь в таком режиме, по сравнению с вариантом «компьютер - компьютер», стоит дороже, однако качество ее значительно выше и пользоваться ею удобнее. Для того чтобы воспользоваться этой услугой, надо позвонить провайдеру, обслуживающему шлюз, ввести с телефонного аппарата код и номер вызываемого абонента и разговаривать так же, как при обычной телефонной связи. Все необходимые операции по маршрутизации вызова выполнит шлюз.

  • «компьютер - телефон»

    Здесь открывается больше возможностей использования для корпоративных пользователей, так как чаще всего применяется корпоративная сеть, обслуживающая вызовы от компьютеров до шлюза, которые уже затем передаются по телефонной сети общего пользования. Корпоративные решения с использованием связи «компьютер - телефон» могут помочь сэкономить деньги, а необходимое для этого оборудование будет рассмотрено ниже.

Итак, очевидно, что для построения сети IP-телефонии необходимы два основных элемента (рис. 1).

Первый - шлюз (gateway), обеспечивающий функции преобразования между пакетно-коммутируемой IP-сетью и телефонной сетью общего пользования, аналого-цифровое преобразование, управление форматами передачи и процедурами VoIP-вызовов. Возможно использование множества шлюзов в сети.

Второй основной элемент - устройство управления (gatekeeper), обеспечивающее ряд функций по управлению доступом в IP-сеть и из IP-сети, шириной полосы пропускания и адресацией. Кроме того, устройство управления осуществляет контроль всех шлюзов и терминалов, исполняет функции службы каталогов, контролирует счета пользователей.

Шлюз может поставляться в виде отдельного сетевого устройства или устанавливаться на персональном компьютере. При использовании шлюза VoIP-функция прозрачна для пользователя, использующего обычный телефон или факсимильный аппарат. Рассмотрим более подробно основные функции шлюза при передаче голоса через IP-сеть.

1. Функция поиска. Когда исходящий IP-шлюз размещает телефонный вызов через IP-сеть, он принимает номер вызывающего абонента и конвертирует его в IP-адрес шлюза назначения, исходя или из таблицы в исходящем шлюзе, или из данных централизованного сервера. Просмотр таблицы в исходящем шлюзе часто требует меньше времени, чем в централизованном сервере, и сокращает время соединения с 4-5 секунд до 1-2 секунд.

2. Функция связи. Исходящий шлюз устанавливает соединение со шлюзом назначения, обмениваясь информацией о параметрах соединения и совместимости устройств.

3. Оцифровка. Аналоговые сигналы телефонной связи оцифровываются шлюзом и преобразуются обычно в 64 Kбит/c ИКМ (импульсно-кодовая модуляция)-сигнал. Эта функция требует от шлюза поддержки разнообразных интерфейсов аналоговой телефонной связи.

Во многих случаях требуется также поддержка цифровой сети с интеграцией служб и интерфейсов T1/E1. Цифровая сеть с интеграцией служб и интерфейсы T1/E1 работают в формате ИКМ, так что аналого-цифровое преобразование в этом случае не требуется. Цифровая сеть с интеграцией служб BRI имеет один или два ИКМ-канала, T1 - до 24 каналов ИКМ и E1 - до 30 ИКМ-каналов. Цифровая сеть с интеграцией служб PRI может иметь до 24 или 30 каналов ИКМ.

4. Демодуляция. Поскольку некоторые шлюзы могут принимать только голосовой или только факсимильный сигнал, должны быть заранее определены магистральные каналы к модулям обработки голоса или факса. Более сложные шлюзы могут обрабатывать данные обоих типов, автоматически определяя, является ли цифровой сигнал звуковым или факсимильным, и производя обработку сигнала в зависимости от его типа. Факсимильный сигнал демодулируется сигнальным процессором (DSP) обратно в цифровой формат 2,4-14,4 Kбит/c, то есть в первоначальное представление до выдачи из факс-аппарата (факс-аппарат представляет выходной сигнал в аналоговом виде). Этот демодулированный сигнал затем помещается в IP-пакеты для передачи шлюзу назначения (рис. 2).

Демодулированная информация затем снова преобразуется шлюзом назначения в аналоговый факс-сигнал для доставки факс-аппарату.

Передача факса может быть осуществлена с использованием UDP/IP- или TCP/IP-протоколов. UDP/IP, в отличие от TCP/IP, не требует исправления ошибок, возникающих при передаче пакетов.

5. Компрессия. После того как определено, что сигнал является голосовым, он обычно сжимается сигнальным процессором с использованием одного из методов компрессии/декомпрессии (КОДЕК) (табл. 1) и помещается в IP-пакеты. При этом важно обеспечить хорошее качество речи и низкую задержку при оцифровывании сигнала.

Таблица 1. Методы компрессии (сжатия) речи

Метод компрессии Сложность Качество Задержка
G.726, G.727, ADPCM 40, 32, 24 Кбит/с низкая (8 MIPS) хорошее (40К), плохое (16К) очень низкая (10-17 мс)
G.729 CS-ACELP 8 Кбит/с высокая (30 MIPS) хорошее низкая
G.729A CA-ACELP 8 Кбит/с умеренная среднее низкая
G.723.1 MP-MLQ 6,4/5,3 Кбит/с умеренно высокая (20 MIPS) хорошее (6,4), среднее (5,3) высокая
G.728 LD-CELP 16 Кбит/с очень высокая (40 MIPS) хорошее низкая

Звуковой пакет передается как пакет UDP/IP, а не TCP/ IP для избежания довольно больших задержек, возникающих при повторной передаче TCP/IP-пакетов. Если используется режим FEC (непосредственное исправление ошибок), то искаженный или отсутствующий звуковой пакет может быть восстановлен на основе данных предыдущего звукового пакета. Если механизм FEC не применяется, то искаженный пакет просто отвергается и шлюз использует предыдущий хороший пакет. Этот механизм работает незаметно для пользователя в случае низкого процента искажения/потерь пакетов (< 5%).

Данные, оцифровываемые КОДЕКом, не содержат адрес IP-пакета и управляющую информацию («заголовок») (рис. 3), которые обычно составляют дополнительные 7 Кбит/с, если IP-маршрутизатор отдельно не компрессирует заголовок, в противном случае - 2-3 Кбит/с.

Сложность реализации КОДЕКа определяет мощность требуемого сигнального процессора, измеряемую в миллионах операций в секунду (MIPS), для обработки голосового сигнала, исключая функции компенсации эхо-сигнала и подавления молчания.

6. Декомпрессия/демодуляция. Шлюз, исполняя шаги 1-4, описанные выше, в то же самое время принимает пакеты от других IP-шлюзов и декомпрессирует пакеты в форму, понятную соответствующим устройствам аналоговой телефонной связи, цифровой сети с интеграцией служб или с интерфейсами T1/E1. Шлюз также осуществляет демодуляцию цифрового факсимильного сигнала в первоначальную форму, а затем в соответствующий интерфейс телефонной связи.

Кроме того, шлюз может выполнять функции согласования интерфейсов инициатора звонка и принимающего вызов.

Качество IP-речи

Для обеспечения высокого качества речи VoIP-шлюз должен использовать кодек с хорошим качеством речи и низкой задержкой. Кроме того, имеется несколько дополнительных технологий, необходимых для того, чтобы гарантировать хорошее качество речи: две из них - система приоритетов пакетов и компенсация эха. Компенсация эха - функция сигнального процессора, система приоритетов пакета - функция маршрутизатора и шлюза.

Когда двухпроводный телефонный кабель соединяется с четырехпроводным интерфейсом УАТС (PBX) или telco-интерфейсом центральной станции (СО), используется специальное электрическое соединение, называемое гибридной схемой, для согласования двухпроводного и четырехпроводного соединения. Хотя гибридные схемы очень эффективны для выполнения функций согласования, небольшой процент энергии телефонного сигнала не конвертируется, а отражается обратно к вызывающему абоненту. Этот сигнал называется «эхо-сигналом».

Если вызывающий абонент находится около УАТС или центрального коммутатора, эхо-сигнал возвращается достаточно быстро и для человека неразличим. Однако если задержка составляет более 10 мс, вызывающий абонент может услышать отраженный сигнал. Чтобы предотвратить появление эхо-сигнала, поставщики шлюзов включают специальный код в сигнальные процессоры, которые прослушивают эхо-сигнал и удаляют его из аудиосигнала. Компенсация эха особенно важна для поставщиков шлюзов, потому что задержка в IP-сети может легко превысить 40-50 миллисекунд, так что эхо-сигнал будет явно ощущаться на ближнем конце. Компенсация эхо-сигнала, идущего от дальнего конца линии, позволяет существенно повлиять на качество сигнала.

Основными источниками снижения качества речи являются сетевая задержка и флуктуация пакетов. Сетевая задержка представляет собой среднее значение времени передачи пакета по сети. Флуктуация - отклонение от среднего времени передачи пакета. Оба параметра важны для определения качества речи.

Поскольку время передачи по сети (полное время, включая время обработки кодеком) часто превышает 150 мс, общение двух абонентов будет все более и более напоминать режим полудуплексной связи с установлением нужной паузы при разговоре. Если паузы фиксируются плохо, то речь одного собеседника как бы «набегает» на речь другого.

Одним из основных средств борьбы с перегруженностью сети должно стать обеспечение качества сервиса (Quality of Service - QoS).

В чем смысл QoS? QoS означает динамическое предоставление гарантированной полосы пропускания для различных приложений и передачу данных в соответствии с требованиями, определяемыми пользователем. До сих пор не существует принимаемой всеми трактовки термина «QoS»; чаще всего под QoS понимают установку трафику приоритетов без гарантий на ширину полосы пропускания, обеспечение полосы пропускания фиксированной ширины при передаче данных между двумя заданными узлами сети на основе постоянных или коммутируемых виртуальных каналов, гарантированную поставщиками услуг Internet общую ширину полосы пропускания.

Хорошее качество речи, передаваемой через IP-сеть, объясняется в основном небольшой флуктуацией пакетов, а не низкими значениями сетевой задержки. Значения флуктуации пакетов сети поддерживаются интеллектуальными возможностями маршрутизаторов, которые могут управлять приоритетами голосовых пакетов в IP-сети. Маршрутизатор настраивается на поиск голосовых IP-пакетов и размещение их перед пакетами данных, ожидающими передачи. Система приоритетов голосовых пакетов особенно важна в региональных сетях связи со скоростями от 56 до 512 Кбит/с. При скоростях, характерных для линий T1/E1, это может не потребоваться.

Таким образом, в настоящее время требуемое качество обслуживания обеспечивается в основном средствами управления приоритетом трафика. Отметим, что в IP-сетях возможны и более сложные процедуры управления качеством.

Сегментация IP-пакетов является еще одним важным механизмом управления задержкой VoIP, позволяющим гарантировать, что очень длинный пакет данных не задержит пакет с речевой информацией на выходе из маршрутизатора. Это достигается настройкой маршрутизатора на сегментирование всех исходящих пакетов данных в соответствии с быстродействием сети связи. Комбинация системы приоритетов голоса/факсов и механизмов сегментации пакета создает хорошие предпосылки для построения VoIP-сети.

Другая технология, используемая некоторыми шлюзами для обеспечения хорошего качества речи, - непосредственное исправление ошибок (FEC).

Управление полосой пропускания

Как уже отмечалось, второй важной проблемой внедрения технологий передачи речи по IP-сети является минимизация используемой полосы пропускания канала связи. Здесь важную роль играют механизмы компрессии и подавления пауз. Механизмы, использующие технологию подавления пауз, определяют периоды молчания абонентов в течение сеанса связи или факсимильной передачи и останавливают посылку IP-пакетов в течение этих периодов.

Стремление к более эффективному использованию полосы пропускания стимулирует развитие механизмов сжатия речи. Стандартный ИКМ-сигнал для передачи речи, как уже отмечалось, требует выделения полосы пропускания шириной 64 Кбит/с (рекомендация МСЭ-Т G.711), что на самом деле слишком много.

Один из давно используемых алгоритмов сжатия речи называется АДИКМ (ADPCM, Adaptive Differential Pulse Code Modulation; стандарт G.726 был принят в 1984 году). Этот алгоритм дает практически такое же качество воспроизведения речи, как и ИКМ, однако для передачи информации при его использовании требуется полоса всего в 16 Кбит/с. Метод основан на кодировании не самой амплитуды сигнала, а ее изменения по сравнению с предыдущим значением; поэтому можно обойтись меньшим числом разрядов. В АДИКМ изменение уровня сигнала кодируется четырехразрядным числом, при этом частота измерения амплитуды сигнала сохраняется неизменной.

Все методы кодирования, основанные на определенных предположениях о форме сигнала, не подходят для передачи сигнала с резкими скачками амплитуды. Именно такой вид имеет сигнал, генерируемый модемами или факсимильными аппаратами, поэтому аппаратура, поддерживающая сжатие, должна автоматически распознавать сигналы факс-аппаратов и модемов и обрабатывать их иначе, чем голосовой трафик.

Многие методы кодирования берут свое начало от метода кодирования с линейным предсказанием (LPC, Linear Predictive Coding). В качестве входного сигнала в LPC используется последовательность цифровых значений амплитуды, но кодирование применяется не к отдельным цифровым значениям, а к определенным их блокам. Для каждого такого блока значений вычисляются его характерные параметры: частота, амплитуда и ряд других. Именно эти значения и передаются по сети. При таком подходе к кодированию речи, во-первых, возрастают требования к вычислительным мощностям специализированных процессоров, используемых для обработки сигнала, а во-вторых, увеличивается задержка при передаче, поскольку кодирование применяется не к отдельным значениям, а к некоторому их набору, который перед началом преобразования следует накопить в определенном буфере. Важно, что задержка в передаче речи не только связана с необходимостью обработки цифрового сигнала (эту задержку можно уменьшить, увеличив мощность процессора), но и определяется методом сжатия. Этот метод позволяет достигать очень больших степеней сжатия с полосой пропускания 2,4 или 4,8 Кбит/с, однако качество звука сильно страдает. Поэтому в коммерческих приложениях он не используется, а применяется в основном для ведения служебных переговоров.

Более сложные методы сжатия речи основаны на применении ЛКП в сочетании с элементами кодирования формы сигнала. В этих алгоритмах используется кодирование с обратной связью, когда при передаче сигнала осуществляется оптимизация кода. Закодировав сигнал, процессор пытается восстановить его форму и сравнивает результат с исходным сигналом, после чего начинает варьировать параметры кодировки, добиваясь наилучшего совпадения. Добившись совпадения, аппаратура передает полученный код по линиям связи; на противоположном конце происходит восстановление звукового сигнала. Ясно, что для использования такого метода требуются еще более серьезные вычислительные мощности.

Одной из наиболее распространенных разновидностей описанного метода кодирования является метод LD-CELP (Low-Delay Code-Excited Linear Prediction). Этот метод позволяет достичь удовлетворительного качества воспроизведения при пропускной способности 16 Кбит/с; он был стандартизован Международным союзом электросвязи (International Telecommunications Union - ITU) в 1992 году как алгоритм кодирования речи G.728. Алгоритм применяется к последовательности цифр, получаемых в результате аналого-цифрового преобразования голосового сигнала с 16-разрядным разрешением. Пять последовательных цифровых значений кодируются одним 10-битным блоком - это и дает 16 Кбит/с. Для применения этого метода требуются большие вычислительные мощности: в частности, для непосредственной реализации G.728 необходим процессор с быстродействием 44 MIPS.

В марте 1995 года ITU принял новый стандарт G.723, который предполагается использовать при сжатии речи для организации видеоконференций по телефонным сетям. Этот стандарт является частью более общего стандарта H.324, описывающего подход к организации таких видеоконференций. Целью его принятия является обеспечение видеоконференций с использованием обычных модемов. Основой G.723 является метод сжатия речи MP-MLQ (Multipulse Maximum Likelihood Quantization). Он позволяет добиться весьма существенного сжатия речи при сохранении достаточно высокого качества звучания. В основе метода лежит описанная выше процедура оптимизации; с помощью различных усовершенствований можно сжимать речь до уровня 4,8; 6,4; 7,2 и 8,0 Кбит/с. Структура алгоритма позволяет изменять степень сжатия голоса в ходе передачи. Вносимая кодированием задержка не превышает 20 мс.

Повышая эффективность использования полосы пропускания, механизмы сжатия речи в то же время могут привести к снижению качества речи и увеличению задержек. Некоторые основные алгоритмы сжатия речи и создаваемые при этом задержки приведены в табл. 1.

Количественными характеристиками ухудшения качества речи являются параметры ухудшения качества сигнала при квантовании (QDU, Quantization Distortion Units). Один QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры ИКМ; значения QDU для основных методов компрессии приведены в табл. 2. Дополнительная обработка речи ведет к дальнейшей потере качества. Согласно рекомендациям МСЭ-Т, для международных вызовов величина QDU не должна превышать 14. Отметим, что передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU.

Таблица 2. Ухудшение качества речи при использовании различных алгоритмов компрессии

Методы компрессии QDU
ADPCM 32 Кбит/с 3,5
ADPCM 24 Кбит/с 7
LD-CELP 16 Кбит/с 3,5
CS-CELP 8 Кбит/с 3,5

Следовательно, при передаче разговора по национальным сетям должно теряться не более 5 QDU. Поэтому для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является обязательным требованием регулирующих органов, предъявляемым к сетям, подключенным к сетям общего пользования.

Подавление пауз - важная функция оборудования, обеспечивающего передачу голоса по IP-сетям. Суть технологии подавления пауз заключается в определении различия между моментами активной речи и молчания в период соединения. В результате применения этой технологии генерация пакетов происходит только в моменты активного разговора. Поскольку при типичном разговоре по телефону паузы составляют до 60% времени, возможна двукратная оптимизация количества передаваемых по линии данных. Объединение технологии сжатия речи и подавления пауз речи в коммутаторах приводит к уменьшению потока данных в канале в восемь раз.

Продолжение следует

КомпьютерПресс 5"1999

Допускается к защите.

«___»___________________ 2007 г.

Заведующий кафедрой ИС

д. т. н., проф.

Петрова И.Ю.

Д ипломный проект

Текстовая документация ДП 230201.007.2007

Астрахань – 2007 г.


ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО образованию

Государственное образовательное учреждение высшего профессионального образования

«Астраханский государственный университет»

Факультет математики и информационных технологий

Специальность «Информационные системы и технологии»

Кафедра «Информационные системы»

Утверждаю

Завкафедрой __________________

«____» ___________________20__ г.

по дипломному проекту студента

Кутепова Петра Викторовича

1. Тема проекта Организация сети передачи голоса по IP протоколу на базе распределённой локальной вычислительной сети АГУ

утверждена приказом по университету от«___» ____________2006г. № __________

2. Дата выдачи задания по дипломному проекту «_____»________________20__г.

3. Исходные данные к проекту.

Общий подход к построению IP-сети для передачи телефонного трафика на безе распределенной сети АГУ. Механизмы управления и решения проблем передачи голоса по IP. Обеспечение качества IP-речи. Управление полосой пропускания. Конфигурирование сетевого оборудования. Создание схемы IP сети для передачи голоса.

4. Функции, реализуемые системой:

· функции, связанные с протоколами передачи данных;

· Обследование предметной области

· Постановка задачи формирования исходных данных с последующим внедрением IP технологии.

· Разработка рабочего проекта - настройка сетевого оборудования, отладка, тестирование, создание документации по использованию

· Расчет экономической и социальной эффективности от внедрения разрабатываемой подсистемы

· Определение эргономических условий для рабочего места сотрудника учебной части

6. Перечень графического материала

Структура IP сети АГУ

1) Схема подключения в корпоративную сеть

2) Структура сети главного корпуса АГУ

3) Структура телефонной сети АГУ

5) Схема интеграции с корпоративной структурой и текущей телефонной системой

6) Структура сети АГУ с технологией IP телефонии

7) Структура сети главного корпуса АГУ с технологией IP телефонии

Руководитель ________________________________________

Задание принял к исполнению ___________________________________________

КАЛЕНДАРНЫЙ ПЛАН

Наименование этапов дипломного проекта Срок выполнения этапов проекта Отметка о выполнении, подпись руководителя
1 Представление проекта задания на дипломный проект до 01.10.2006
2 Согласование задания на дипломный проект с руководителем диплома и заведующим кафедрой до 10.11.2006
3 Введение. Обследование предметной области и подготовка 1-й главы дипломного проекта (10%) до 01.12.2006
4 Технический проект. Глава 2. Подробное описание функций проектируемой системы (25 %) до 10.01.2007
5 Отчет по преддипломной практике с демонстрацией работы созданного программного продукта (60%) до 07.04.2007
6 Глава 3. Разработка рабочего проекта (80%) до 28.04.2007
7 Глава 4. Расчет экономического и социального эффекта (90%) до 12.05.2007
8 Глава 5. Обеспечение эргономики рабочего места (100%) до 25.05.2007
9 Оформление пояснительной записки до 25.05.2007
10 Подготовка презентационного ролика до 25.05.2007
11 Предварительная защита дипломного проекта до 30.05.2007

Студент ___________________________________________

Руководитель ________________________________________

КОНСУЛЬТАНТЫ ПО ПРОЕКТУ

Руководитель _________________________

(подпись)

Задание принял к исполнению _________________________

(подпись)

1 РЕФЕРАТ

Локальная вычислительная сеть, телефония, цифровая автоматическая телефонная станция, маршрутизатор Cisco 3845, IP – телефон, передача голоса, междугородная связь.

Пояснительная записка представлена на 92 страницах и включает 7 таблиц и 30 схем и изображений. Было использовано 28 источников литературы.

Объектом работы является Астараханский государственный университет.

Цель проекта – снизить затраты на междугородные и международные звонки используя технологию IP телефонии, на основе локальной вычислительной сети Астраханского государственного университета.

Данный проект предназначен для:

· сокращения затрат на услуги связи

· повышения качества телефонной связи.

Обычные телефонные звонки требуют разветвлённой сети связи телефонных станций, связанных закреплёнными телефонными линиями. Высокие затраты телефонных компаний приводят к дорогим междугородним разговорам.

В связи с повышением абонентской платы за использование телефонной сети, IP телефония становится более актуальным и выгодным вариантом передачи голоса и факсимильных данных.

В Астраханском государственном университете существует хорошо организованная IP сеть. Она построена с использованием маршрутизатора Cisco 3845 и коммутаторов Cisco Systems серии Catalyst 2950. Использование этого оборудования дает возможность организовать сеть передачи голоса и факсимильных данных по IP протоколу.

Проведен расчет экономической эффективности от внедрения проекта, и рассчитаны следующие показатели:

· Капитальные затраты - 101160 руб

· Амортизация - 860 руб

· Экономия - 34879 руб

· Окупаемость проекта - 4 месяца

.

Разработана структурная схема внедрения IP телефонии в сеть АГУ, схема соединения цифровой АТС ТОС 120 с маршрутизатором Cisco 3845, выбрано оборудование для реализации проекта, выбран провайдер услуг IP телефонии.

Введение. 9

1. Описание предметной области.. 10

1.1. Основные понятия IP телефонии и виды строения сетей IP телефонии. 10

1.2. Структура сети АГУ.. 14

1.3. Решения Cisco Systems для IP-телефонии. 15

1.4. Маршрутизаторы Cisco Systems. 16

1.5. Коммутатор серии Catalyst 2950. 18

1.6. IP телефон. 18

1.7. Функции IP телефонов. 19

1.8. Настройка VPN сети. 20

1.9. Способы и средства защиты информации. 21

2. Технический проект. 23

2.1. Структура сети главного корпуса АГУ.. 23

2.2. Структура телефонной сети АГУ.. 23

2.3. Описание организации сети IP телефонии. 26

2.4. Параметры качества связи. 27

3. Рабочий проект. 29

3.1. Исследование рынка IP телефонии. 29

3.2. Компании представляющие решения IP-телефонии. 31

3.3. Поиск оптимального по требованиям IP – провайдера. 36

3.4. Cisco Call Manager 40

3.5. Модуль Cisco Unity Express. 41

3.6. Модуль Cisco Systems VWIC-2MFT-E1 на 60 голосовых каналов. 42

3.7. Подключение цифровой АТС АГУ к маршрутизатору Cisco 3845. 43

3.9. Настройка Cisco CallManager 46

3.10. Виды соединений при использовании IP-телефонии. 48

3.11. Выбор операторов услуг IP телефонии. 49

3.12. Принципы работы SIPNET. 51

3.13. Настройка маршрутизации SIPNET. 52

3.14. Протокол SIP. Общие сведения. 53

3.15. Принципы протокола SIP. 55

3.16. Интеграция SIP с IP сетями. 56

3.17. Принцип работы VPN.. 59

4. Экономический и социальный эффект от внедрения проекта 61

4.1. Технико-экономическое обоснование проекта. 61

4.2. Экономия на междугородных и международных разговорах. 61

4.3. Ускоренная окупаемость капитальных затрат. 62

4.4. Расчет текущих затрат. 64

4.5. Амортизация. 65

4.6. Расчет финансовых результатов реализации проекта. 65

4.7. Выводы.. 66

5. Обеспечение эргономики рабочего места.. 68

За последние годы было предложено несколько решений по созданию универсальной инфраструктуры для передачи разнородного трафика. В условиях повышенных требований к качеству сервиса и ширине полосы пропускания необходимы сети с услугами высокого качества и повышенной скоростью передачи.

IP играет ключевую роль в обеспечении гибкости обслуживания. Для того чтобы увеличить общую рентабельность сети, поставщики должны предоставить услуги, основанные на IP или способные «понимать» IP, так как большинство приложений, требующих предоставления услуг глобальных сетей, использует IP. А поскольку потребители продолжают требовать от своих поставщиков предоставления дополнительных функциональных возможностей, поставщики должны постоянно искать все новые и новые услуги, которые смогут дополнить и усилить приложения потребителей. Можно с уверенностью говорить о том, что эти услуги должны быть основаны на IP.

IP становится стандартным протоколом для корпоративных, intranet- и extranet-сетей. В 80-е годы территориально-распределенные корпоративные сети строились на основе выделенных каналов E1/T1. Для уплотнения каналов применялись мультиплексоры, используемые для интеграции голоса и данных в сетях общего пользования и в частных сетях. В то же время принципы построения телефонных сетей кардинально не менялись. В таких сетях телефонные соединения устанавливаются по предопределенным маршрутам (основным и альтернативным) и «страдают» множеством ограничений: высокая стоимость поддержания большого количества маршрутных таблиц каждой УАТС (PBX) и их реконфигурации при изменении телефонных потоков, неэффективное использование полосы пропускания, ухудшение качества речи при применении механизмов сжатия в сетях с множеством АТС и другие.

В последние годы были разработаны устройства, обеспечивающие передачу голоса по сетям, изначально нацеленным на передачу данных, таким как Frame Relay и IP-сети. Движущей силой при этом является стремление сократить расходы на использование арендуемых линий связи и повысить эффективность применения выделенных корпоративных коммуникаций.

Новый стимул развитию телефонных сетей дало появление технологии передачи голоса по АТМ-сетям, которая предусматривает возможность подключения АТС к АТМ-коммутаторам, способным обрабатывать как потоки данных, так и телефонные сигналы.

В данной статье описываются:

  • технологии передачи голоса и данных по IP-сетям;
  • проблемы построения интегрированных сетей;
  • механизмы, обеспечивающие повышение эффективности полосы пропускания и гибкости управления потоками (компрессии, подавления пауз речи);
  • оборудование ведущих производителей.

Что такое IP-телефония

Телефонная связь по IP - сравнительно молодая служба, использующая, как правило, управляемую IP-сеть для передачи телефонного трафика.

В течение следующих пяти лет ожидаются феноменальные темпы роста рынка услуг VoIP (голос поверх IP). Согласно данным Killen & Associates, в компаниях, входящих в список Fortune 1000, по IP-сетям сейчас проходит менее 1% голосового трафика; к 2002 году эта доля должна достигнуть 18%, а к 2005-му - 33%.

Пользователей и поставщиков услуг привлекают экономические выгоды применения IP для передачи телефонного трафика, проведения конференц-связи с одновременным обменом информацией, IP-центры обслуживания звонков, прозрачная маршрутизация запросов пользователей.

Сравнение качества стандартной телефонной связи по сетям общего пользования с первым поколением устройств VoIP оказывается не в пользу последних, в первую очередь из-за низкой надежности и невысокого качества обслуживания. Однако появление сложных современных приложений и устройств - высокопроизводительных коммутаторов и маршрутизаторов, использующих развитые механизмы управления качеством обслуживания (QoS) процессоров цифровых сигналов (DSP), - устраняет многие проблемы VoIP-систем второго поколения.

Под IP-телефонией понимается технология использования IP- сети (Internet или любой другой) в качестве средства организации и ведения телефонных разговоров и передачи факсов в режиме реального времени. IP-телефония является одним из наиболее сложных приложений компьютерной телефонии.

В общих чертах передача голоса в IP-сети происходит следующим образом. Входящий звонок и сигнальная информация из телефонной сети передаются на пограничное сетевое устройство, называемое телефонным шлюзом, и обрабатываются специальной картой устройства голосового обслуживания. Шлюз, используя управляющие протоколы семейства H.323, перенаправляет сигнальную информацию другому шлюзу, находящемуся на приемной стороне IP-сети. Приемный шлюз обеспечивает передачу сигнальной информации на приемное телефонное оборудование согласно плану номеров, гарантируя сквозное соединение. После установления соединения голос на входном сетевом устройстве оцифровывается (если он не был цифровым), кодируется в соответствии со стандартными алгоритмами ITU, такими как G.711 или G.729, сжимается, инкапсулируется в пакеты и отправляется по назначению на удаленное устройство с использованием стека протоколов TCP/IP.

Таким образом, используя IP-сеть, можно обмениваться цифровой информацией для пересылки голосовых или факсимильных сообщений между двумя компьютерами в режиме реального времени. Применение Internet позволит реализовать данную службу в глобальном масштабе.

Основными проблемами построения IP-сети для передачи телефонного трафика являются механизмы управления задержками и поддержание достаточной ширины полосы пропускания. Кроме того, важны способы установления тарифов на услуги и выставления счета за их использование, а также варианты оплаты в IP-сети дополнительных услуг, таких как переадресация вызова, определение номера абонента, маршрутизация в зависимости от времени суток и др.

Немаловажной является проблема оценки прибыльности новой технологии. Действительно ли объединение средств связи на базе IP-сетей сулит значительную экономию? Ответ на этот вопрос можно получить только при комплексном рассмотрении проблемы. Возможно, все обстоит именно так. Если стоимость передачи информации по сети составляет лишь 15-20% от всех затрат на поддержку сетевой инфраструктуры, то 70-процентная экономия сетевых расходов может показаться не столь привлекательной по сравнению с объемом работы, который необходимо будет проделать для перевода всех функций на универсальную основу, а также по сравнению с количеством затрачиваемых средств на создание универсальной инфраструктуры и возможностью использования имеющегося оборудования.

И это лишь малая часть всех проблем, связанных с внедрением универсальных линий связи. Поэтому, как правило, предложение поставщиками услуг интегрированных сетей начинается с создания небольших специализированных сетей, на которых происходит обкатка интеграционных технологий, поиск ответов на вопросы, возникающие при объединении различных видов связи. Однако уже сейчас можно говорить о реальности построения интегрированной инфраструктуры.

Общий подход к построению IP-сети для передачи телефонного трафика

  • «компьютер - компьютер»

    Данный вариант не является примером IP-телефонии, так как голос передается только по сети передачи данных, без выхода в телефонную сеть. Для организации передачи трафика пользователь приобретает необходимое оборудование и программное обеспечение, а также платит провайдеру за эксплуатацию канала связи. Достоинство этого варианта заключается в максимальной экономии средств. Недостаток - минимальное качество связи.

  • «телефон - телефон»

    Для организации такой связи необходимо наличие определенных сетевых устройств и механизмов взаимодействия. Голосовой трафик передается через IP-сеть, как правило, на отдельном дорогостоящем участке. Устройствами, организующими взаимодействие, являются шлюзы, состыкованные, с одной стороны, с телефонной сетью общего пользования, а с другой - с IP-сетью. Голосовая связь в таком режиме, по сравнению с вариантом «компьютер - компьютер», стоит дороже, однако качество ее значительно выше и пользоваться ею удобнее. Для того чтобы воспользоваться этой услугой, надо позвонить провайдеру, обслуживающему шлюз, ввести с телефонного аппарата код и номер вызываемого абонента и разговаривать так же, как при обычной телефонной связи. Все необходимые операции по маршрутизации вызова выполнит шлюз.

  • «компьютер - телефон»

    Здесь открывается больше возможностей использования для корпоративных пользователей, так как чаще всего применяется корпоративная сеть, обслуживающая вызовы от компьютеров до шлюза, которые уже затем передаются по телефонной сети общего пользования. Корпоративные решения с использованием связи «компьютер - телефон» могут помочь сэкономить деньги, а необходимое для этого оборудование будет рассмотрено ниже.

Итак, очевидно, что для построения сети IP-телефонии необходимы два основных элемента (рис. 1).

Первый - шлюз (gateway), обеспечивающий функции преобразования между пакетно-коммутируемой IP-сетью и телефонной сетью общего пользования, аналого-цифровое преобразование, управление форматами передачи и процедурами VoIP-вызовов. Возможно использование множества шлюзов в сети.

Второй основной элемент - устройство управления (gatekeeper), обеспечивающее ряд функций по управлению доступом в IP-сеть и из IP-сети, шириной полосы пропускания и адресацией. Кроме того, устройство управления осуществляет контроль всех шлюзов и терминалов, исполняет функции службы каталогов, контролирует счета пользователей.

Шлюз может поставляться в виде отдельного сетевого устройства или устанавливаться на персональном компьютере. При использовании шлюза VoIP-функция прозрачна для пользователя, использующего обычный телефон или факсимильный аппарат. Рассмотрим более подробно основные функции шлюза при передаче голоса через IP-сеть.

1. Функция поиска. Когда исходящий IP-шлюз размещает телефонный вызов через IP-сеть, он принимает номер вызывающего абонента и конвертирует его в IP-адрес шлюза назначения, исходя или из таблицы в исходящем шлюзе, или из данных централизованного сервера. Просмотр таблицы в исходящем шлюзе часто требует меньше времени, чем в централизованном сервере, и сокращает время соединения с 4-5 секунд до 1-2 секунд.

2. Функция связи. Исходящий шлюз устанавливает соединение со шлюзом назначения, обмениваясь информацией о параметрах соединения и совместимости устройств.

3. Оцифровка. Аналоговые сигналы телефонной связи оцифровываются шлюзом и преобразуются обычно в 64 Kбит/c ИКМ (импульсно-кодовая модуляция)-сигнал. Эта функция требует от шлюза поддержки разнообразных интерфейсов аналоговой телефонной связи.

Во многих случаях требуется также поддержка цифровой сети с интеграцией служб и интерфейсов T1/E1. Цифровая сеть с интеграцией служб и интерфейсы T1/E1 работают в формате ИКМ, так что аналого-цифровое преобразование в этом случае не требуется. Цифровая сеть с интеграцией служб BRI имеет один или два ИКМ-канала, T1 - до 24 каналов ИКМ и E1 - до 30 ИКМ-каналов. Цифровая сеть с интеграцией служб PRI может иметь до 24 или 30 каналов ИКМ.

4. Демодуляция. Поскольку некоторые шлюзы могут принимать только голосовой или только факсимильный сигнал, должны быть заранее определены магистральные каналы к модулям обработки голоса или факса. Более сложные шлюзы могут обрабатывать данные обоих типов, автоматически определяя, является ли цифровой сигнал звуковым или факсимильным, и производя обработку сигнала в зависимости от его типа. Факсимильный сигнал демодулируется сигнальным процессором (DSP) обратно в цифровой формат 2,4-14,4 Kбит/c, то есть в первоначальное представление до выдачи из факс-аппарата (факс-аппарат представляет выходной сигнал в аналоговом виде). Этот демодулированный сигнал затем помещается в IP-пакеты для передачи шлюзу назначения (рис. 2).

Демодулированная информация затем снова преобразуется шлюзом назначения в аналоговый факс-сигнал для доставки факс-аппарату.

Передача факса может быть осуществлена с использованием UDP/IP- или TCP/IP-протоколов. UDP/IP, в отличие от TCP/IP, не требует исправления ошибок, возникающих при передаче пакетов.

5. Компрессия. После того как определено, что сигнал является голосовым, он обычно сжимается сигнальным процессором с использованием одного из методов компрессии/декомпрессии (КОДЕК) (табл. 1) и помещается в IP-пакеты. При этом важно обеспечить хорошее качество речи и низкую задержку при оцифровывании сигнала.

Таблица 1. Методы компрессии (сжатия) речи

Метод компрессии Сложность Качество Задержка
G.726, G.727, ADPCM 40, 32, 24 Кбит/с низкая (8 MIPS) хорошее (40К), плохое (16К) очень низкая (10-17 мс)
G.729 CS-ACELP 8 Кбит/с высокая (30 MIPS) хорошее низкая
G.729A CA-ACELP 8 Кбит/с умеренная среднее низкая
G.723.1 MP-MLQ 6,4/5,3 Кбит/с умеренно высокая (20 MIPS) хорошее (6,4), среднее (5,3) высокая
G.728 LD-CELP 16 Кбит/с очень высокая (40 MIPS) хорошее низкая

Звуковой пакет передается как пакет UDP/IP, а не TCP/ IP для избежания довольно больших задержек, возникающих при повторной передаче TCP/IP-пакетов. Если используется режим FEC (непосредственное исправление ошибок), то искаженный или отсутствующий звуковой пакет может быть восстановлен на основе данных предыдущего звукового пакета. Если механизм FEC не применяется, то искаженный пакет просто отвергается и шлюз использует предыдущий хороший пакет. Этот механизм работает незаметно для пользователя в случае низкого процента искажения/потерь пакетов (< 5%).

Данные, оцифровываемые КОДЕКом, не содержат адрес IP-пакета и управляющую информацию («заголовок») (рис. 3), которые обычно составляют дополнительные 7 Кбит/с, если IP-маршрутизатор отдельно не компрессирует заголовок, в противном случае - 2-3 Кбит/с.

Сложность реализации КОДЕКа определяет мощность требуемого сигнального процессора, измеряемую в миллионах операций в секунду (MIPS), для обработки голосового сигнала, исключая функции компенсации эхо-сигнала и подавления молчания.

6. Декомпрессия/демодуляция. Шлюз, исполняя шаги 1-4, описанные выше, в то же самое время принимает пакеты от других IP-шлюзов и декомпрессирует пакеты в форму, понятную соответствующим устройствам аналоговой телефонной связи, цифровой сети с интеграцией служб или с интерфейсами T1/E1. Шлюз также осуществляет демодуляцию цифрового факсимильного сигнала в первоначальную форму, а затем в соответствующий интерфейс телефонной связи.

Кроме того, шлюз может выполнять функции согласования интерфейсов инициатора звонка и принимающего вызов.

Качество IP-речи

Для обеспечения высокого качества речи VoIP-шлюз должен использовать кодек с хорошим качеством речи и низкой задержкой. Кроме того, имеется несколько дополнительных технологий, необходимых для того, чтобы гарантировать хорошее качество речи: две из них - система приоритетов пакетов и компенсация эха. Компенсация эха - функция сигнального процессора, система приоритетов пакета - функция маршрутизатора и шлюза.

Когда двухпроводный телефонный кабель соединяется с четырехпроводным интерфейсом УАТС (PBX) или telco-интерфейсом центральной станции (СО), используется специальное электрическое соединение, называемое гибридной схемой, для согласования двухпроводного и четырехпроводного соединения. Хотя гибридные схемы очень эффективны для выполнения функций согласования, небольшой процент энергии телефонного сигнала не конвертируется, а отражается обратно к вызывающему абоненту. Этот сигнал называется «эхо-сигналом».

Если вызывающий абонент находится около УАТС или центрального коммутатора, эхо-сигнал возвращается достаточно быстро и для человека неразличим. Однако если задержка составляет более 10 мс, вызывающий абонент может услышать отраженный сигнал. Чтобы предотвратить появление эхо-сигнала, поставщики шлюзов включают специальный код в сигнальные процессоры, которые прослушивают эхо-сигнал и удаляют его из аудиосигнала. Компенсация эха особенно важна для поставщиков шлюзов, потому что задержка в IP-сети может легко превысить 40-50 миллисекунд, так что эхо-сигнал будет явно ощущаться на ближнем конце. Компенсация эхо-сигнала, идущего от дальнего конца линии, позволяет существенно повлиять на качество сигнала.

Основными источниками снижения качества речи являются сетевая задержка и флуктуация пакетов. Сетевая задержка представляет собой среднее значение времени передачи пакета по сети. Флуктуация - отклонение от среднего времени передачи пакета. Оба параметра важны для определения качества речи.

Поскольку время передачи по сети (полное время, включая время обработки кодеком) часто превышает 150 мс, общение двух абонентов будет все более и более напоминать режим полудуплексной связи с установлением нужной паузы при разговоре. Если паузы фиксируются плохо, то речь одного собеседника как бы «набегает» на речь другого.

Одним из основных средств борьбы с перегруженностью сети должно стать обеспечение качества сервиса (Quality of Service - QoS).

В чем смысл QoS? QoS означает динамическое предоставление гарантированной полосы пропускания для различных приложений и передачу данных в соответствии с требованиями, определяемыми пользователем. До сих пор не существует принимаемой всеми трактовки термина «QoS»; чаще всего под QoS понимают установку трафику приоритетов без гарантий на ширину полосы пропускания, обеспечение полосы пропускания фиксированной ширины при передаче данных между двумя заданными узлами сети на основе постоянных или коммутируемых виртуальных каналов, гарантированную поставщиками услуг Internet общую ширину полосы пропускания.

Хорошее качество речи, передаваемой через IP-сеть, объясняется в основном небольшой флуктуацией пакетов, а не низкими значениями сетевой задержки. Значения флуктуации пакетов сети поддерживаются интеллектуальными возможностями маршрутизаторов, которые могут управлять приоритетами голосовых пакетов в IP-сети. Маршрутизатор настраивается на поиск голосовых IP-пакетов и размещение их перед пакетами данных, ожидающими передачи. Система приоритетов голосовых пакетов особенно важна в региональных сетях связи со скоростями от 56 до 512 Кбит/с. При скоростях, характерных для линий T1/E1, это может не потребоваться.

Таким образом, в настоящее время требуемое качество обслуживания обеспечивается в основном средствами управления приоритетом трафика. Отметим, что в IP-сетях возможны и более сложные процедуры управления качеством.

Сегментация IP-пакетов является еще одним важным механизмом управления задержкой VoIP, позволяющим гарантировать, что очень длинный пакет данных не задержит пакет с речевой информацией на выходе из маршрутизатора. Это достигается настройкой маршрутизатора на сегментирование всех исходящих пакетов данных в соответствии с быстродействием сети связи. Комбинация системы приоритетов голоса/факсов и механизмов сегментации пакета создает хорошие предпосылки для построения VoIP-сети.

Другая технология, используемая некоторыми шлюзами для обеспечения хорошего качества речи, - непосредственное исправление ошибок (FEC).

Управление полосой пропускания

Как уже отмечалось, второй важной проблемой внедрения технологий передачи речи по IP-сети является минимизация используемой полосы пропускания канала связи. Здесь важную роль играют механизмы компрессии и подавления пауз. Механизмы, использующие технологию подавления пауз, определяют периоды молчания абонентов в течение сеанса связи или факсимильной передачи и останавливают посылку IP-пакетов в течение этих периодов.

Стремление к более эффективному использованию полосы пропускания стимулирует развитие механизмов сжатия речи. Стандартный ИКМ-сигнал для передачи речи, как уже отмечалось, требует выделения полосы пропускания шириной 64 Кбит/с (рекомендация МСЭ-Т G.711), что на самом деле слишком много.

Один из давно используемых алгоритмов сжатия речи называется АДИКМ (ADPCM, Adaptive Differential Pulse Code Modulation; стандарт G.726 был принят в 1984 году). Этот алгоритм дает практически такое же качество воспроизведения речи, как и ИКМ, однако для передачи информации при его использовании требуется полоса всего в 16 Кбит/с. Метод основан на кодировании не самой амплитуды сигнала, а ее изменения по сравнению с предыдущим значением; поэтому можно обойтись меньшим числом разрядов. В АДИКМ изменение уровня сигнала кодируется четырехразрядным числом, при этом частота измерения амплитуды сигнала сохраняется неизменной.

Все методы кодирования, основанные на определенных предположениях о форме сигнала, не подходят для передачи сигнала с резкими скачками амплитуды. Именно такой вид имеет сигнал, генерируемый модемами или факсимильными аппаратами, поэтому аппаратура, поддерживающая сжатие, должна автоматически распознавать сигналы факс-аппаратов и модемов и обрабатывать их иначе, чем голосовой трафик.

Многие методы кодирования берут свое начало от метода кодирования с линейным предсказанием (LPC, Linear Predictive Coding). В качестве входного сигнала в LPC используется последовательность цифровых значений амплитуды, но кодирование применяется не к отдельным цифровым значениям, а к определенным их блокам. Для каждого такого блока значений вычисляются его характерные параметры: частота, амплитуда и ряд других. Именно эти значения и передаются по сети. При таком подходе к кодированию речи, во-первых, возрастают требования к вычислительным мощностям специализированных процессоров, используемых для обработки сигнала, а во-вторых, увеличивается задержка при передаче, поскольку кодирование применяется не к отдельным значениям, а к некоторому их набору, который перед началом преобразования следует накопить в определенном буфере. Важно, что задержка в передаче речи не только связана с необходимостью обработки цифрового сигнала (эту задержку можно уменьшить, увеличив мощность процессора), но и определяется методом сжатия. Этот метод позволяет достигать очень больших степеней сжатия с полосой пропускания 2,4 или 4,8 Кбит/с, однако качество звука сильно страдает. Поэтому в коммерческих приложениях он не используется, а применяется в основном для ведения служебных переговоров.

Более сложные методы сжатия речи основаны на применении ЛКП в сочетании с элементами кодирования формы сигнала. В этих алгоритмах используется кодирование с обратной связью, когда при передаче сигнала осуществляется оптимизация кода. Закодировав сигнал, процессор пытается восстановить его форму и сравнивает результат с исходным сигналом, после чего начинает варьировать параметры кодировки, добиваясь наилучшего совпадения. Добившись совпадения, аппаратура передает полученный код по линиям связи; на противоположном конце происходит восстановление звукового сигнала. Ясно, что для использования такого метода требуются еще более серьезные вычислительные мощности.

Одной из наиболее распространенных разновидностей описанного метода кодирования является метод LD-CELP (Low-Delay Code-Excited Linear Prediction). Этот метод позволяет достичь удовлетворительного качества воспроизведения при пропускной способности 16 Кбит/с; он был стандартизован Международным союзом электросвязи (International Telecommunications Union - ITU) в 1992 году как алгоритм кодирования речи G.728. Алгоритм применяется к последовательности цифр, получаемых в результате аналого-цифрового преобразования голосового сигнала с 16-разрядным разрешением. Пять последовательных цифровых значений кодируются одним 10-битным блоком - это и дает 16 Кбит/с. Для применения этого метода требуются большие вычислительные мощности: в частности, для непосредственной реализации G.728 необходим процессор с быстродействием 44 MIPS.

В марте 1995 года ITU принял новый стандарт G.723, который предполагается использовать при сжатии речи для организации видеоконференций по телефонным сетям. Этот стандарт является частью более общего стандарта H.324, описывающего подход к организации таких видеоконференций. Целью его принятия является обеспечение видеоконференций с использованием обычных модемов. Основой G.723 является метод сжатия речи MP-MLQ (Multipulse Maximum Likelihood Quantization). Он позволяет добиться весьма существенного сжатия речи при сохранении достаточно высокого качества звучания. В основе метода лежит описанная выше процедура оптимизации; с помощью различных усовершенствований можно сжимать речь до уровня 4,8; 6,4; 7,2 и 8,0 Кбит/с. Структура алгоритма позволяет изменять степень сжатия голоса в ходе передачи. Вносимая кодированием задержка не превышает 20 мс.

Повышая эффективность использования полосы пропускания, механизмы сжатия речи в то же время могут привести к снижению качества речи и увеличению задержек. Некоторые основные алгоритмы сжатия речи и создаваемые при этом задержки приведены в табл. 1.

Количественными характеристиками ухудшения качества речи являются параметры ухудшения качества сигнала при квантовании (QDU, Quantization Distortion Units). Один QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры ИКМ; значения QDU для основных методов компрессии приведены в табл. 2. Дополнительная обработка речи ведет к дальнейшей потере качества. Согласно рекомендациям МСЭ-Т, для международных вызовов величина QDU не должна превышать 14. Отметим, что передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU.

Таблица 2. Ухудшение качества речи при использовании различных алгоритмов компрессии

Методы компрессии QDU
ADPCM 32 Кбит/с 3,5
ADPCM 24 Кбит/с 7
LD-CELP 16 Кбит/с 3,5
CS-CELP 8 Кбит/с 3,5

Следовательно, при передаче разговора по национальным сетям должно теряться не более 5 QDU. Поэтому для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является обязательным требованием регулирующих органов, предъявляемым к сетям, подключенным к сетям общего пользования.

Подавление пауз - важная функция оборудования, обеспечивающего передачу голоса по IP-сетям. Суть технологии подавления пауз заключается в определении различия между моментами активной речи и молчания в период соединения. В результате применения этой технологии генерация пакетов происходит только в моменты активного разговора. Поскольку при типичном разговоре по телефону паузы составляют до 60% времени, возможна двукратная оптимизация количества передаваемых по линии данных. Объединение технологии сжатия речи и подавления пауз речи в коммутаторах приводит к уменьшению потока данных в канале в восемь раз.

Продолжение следует

КомпьютерПресс 5"1999