Модель системы передачи информации
Рассмотрим структурную схему простейшей одноканальной системы передачи информации. Введем понятие канала связи.
Под “каналом связи” (communication link) в теории и технике электрической связи принято понимать совокупность различных средств, включая физическую среду, которая обеспечивает передачу сигналов от источника к получателю сообщений. Причем физической средой для передачи сигналов может быть кабель в проводной связи, атмосфера в наземной радиосвязи и т.д.
В самом общем виде структурная схема системы передачи информации показана на рис. 1.2.
На передающей стороне преобразование сообщения в сигнал осуществляется с помощью преобразователя. В телефонии для этой цели служит микрофон, который превращает акустические колебания в пропорционально изменяющееся электрическое напряжение. В телеграфии с помощью телеграфного аппарата (телетайпа) оператор заменяет последовательность знаков сообщения (букв, цифр) последовательностью двоичных кодовых символов (0 и 1). В телетайпе они преобразуются в электрические посылки постоянного тока. В телевидении при передаче изображения преобразователем является передающая телевизионная трубка.
Далее следует операция кодирования (coding), под которой понимают преобразование дискретного сообщения в последовательность кодовых символов, осуществляемое по определенному правилу.
При этом каждому элементу сообщения присваивается определенная совокупность кодовых символов, называемая “кодовой комбинацией” (“кодовым словом”), а совокупность всех кодовых комбинаций называется “кодом”. Правило кодирования принято задавать кодовой таблицей, в которой каждому сообщению соответствует определенная кодовая комбинация. Понятие кодирования применимо только к дискретным сообщениям, поэтому чтобы закодировать речевое сообщение, являющееся аналоговым, его необходимо сначала представить в дискретной форме.
Рис. 1.2. Структурная схема системы передачи информации
В телеграфии первичное кодирование осуществляется с помощью телетайпа, в котором каждая буква, каждая цифра и каждый служебный знак (точка, запятая, знак сложения и т.д.) кодируются первичным кодом. Например, это может быть международный телеграфный код № 2 (МТК-2), каждая комбинация которого содержит по пять двоичных символов. Число возможных комбинаций в этом коде составляет (Формула). Этого вполне достаточно для кодирования всех букв русского алфавита, а для кодирования остальных знаков следует использовать регистровый принцип. В этом случае одна и та же комбинация применяется три раза: в русском, латинском и цифровом регистрах. Общее число разных знаков (букв, цифр и др.), применяемых в коде МТК-2, равно 84.
В 1963 г. появился код ASCII (American Standard Code for Information Interchange) — стандартный американский код для обмена информацией, разработанный для использования в телеграфной связи.
При создании первых персональных ЭВМ фирма IBM приняла его в качестве стандарта для кодирования информации. Каждая комбинация данного кода, состоящая из семи двоичных символов, позволяла использовать 128 кодовых комбинаций. Несколько позже этот код был расширен и дополнен: его комбинации стали содержать по восемь двоичных разрядов, и число этих комбинаций возросло до 256. Благодаря этому его стали применять для кодирования информации не только на английском языке, но и на многих других языках мира. В настоящее время все текстовые сообщения, передаваемые в сети Интернет, кодируются с использованием только этого кода.
Коды МТК-2 и ASCII относятся к так называемым равномерным кодам, поскольку каждая комбинация в них содержит одно и то же число двоичных символов. Также существуют неравномерные коды, комбинации в которых имеют разную длину.
Типичным представителем неравномерных кодов является код Морзе, созданный в 1838 г. американским изобретателем и художником Самюэлем Морзе. В этом коде символ «1», соответствующий токовой посылке, называется точкой, а три единицы — тире. Символ «0» используется как разделительный знак внутри кодовой комбинации, а совокупность из трех нулей разделяет между собой кодовые комбинации. Данный код до сих пор применяется в системах слуховой телеграфной радиосвязи. В 2004 г. в коде Морзе появился символ @ и соответствующая ему кодовая комбинация, введенная Международным союзом электросвязи для удобства передачи адресов электронной почты.
К неравномерным относятся и широко известные коды Хаффмана и Шеннона—Фано. В них, как и в коде Морзе, сообщения, встречающиеся чаще (с большей вероятностью), кодируются короткими кодовыми комбинациями, а сообщения, появляющиеся реже (с меньшей вероятностью), — более длинными кодовыми комбинациями.
Это свойство позволяет устранять избыточность в источниках сообщений (т. е. производить «сжатие» информации). Такие коды называются “префиксными”, поскольку в своем составе они не имеют кодовых комбинаций, которые являются началом (префиксом) любых других. Данное свойство позволяет легко распознавать принимаемые сообщения. Код Шеннона—Фано более простой в построении, однако код Хаффмана несколько удобнее в практической реализации. Код Хаффмана используется в технике факсимильной связи и в компьютерных технологиях при создании файлов видеоизображений в формате JPEG, а также для сжатия видеосигналов в телевизионной цифровой технике на основе стандарта MPEG.
Код Хаффмана, предложенный в 1952 г., можно построить следующим образом. Сначала все сообщения располагаются в порядке убывания вероятностей их появления. Затем сообщения с наименьшими вероятностями, стоящие внизу, объединяются в одно промежуточное (вспомогательное) сообщение, которому приписывается значение, равное сумме вероятностей сообщений, из которых оно составлено. Полученную таким образом точку называют узлом, а пути, ведущие в нее, обозначают кодовыми символами: 1 (верхний) и 0 (нижний). Затем из оставшихся сообщений с учетом промежуточного сообщения вновь находят пару с наименьшими вероятностями, которая аналогично объединяется в очередное промежуточное сообщение с значением вероятности, равным сумме вероятностей, входящих в эту пару сообщений. Во второй полученный узел также ведут два пути: единичный и нулевой. Далее процесс объединения продолжается рекурсивно до получения завершающего вспомогательного сообщения с суммарной вероятностью, равной единице. Эту последнюю полученную точку называют корнем кодового дерева, ветвями которого являются пути, приводящие в соответствующие узлы. Считывание кодовых символов производится в обратном направлении: от корня дерева к исходным сообщениям. В качестве кодовых комбинаций сообщений записываются последовательности двоичных символов, встречающиеся на каждом пути, соединяющем соседние узлы дерева.
Пример построения кодового дерева и полученные при этом комбинации для источника сообщений, создающего символы a, b, с, d, e, f, вероятности (Формула) которых равны соответственно 0,33, 0,22, 0,13, 0,12, 0,11, 0,09, представлены на рис. 1.3, а. На рис. 1.3, б приведена таблица, поясняющая процесс объединения сообщений в промежуточные узлы.
Пример построения кодового дерева
Рис. 1.3. Пример построения кодового дерева (а) и таблица шагов (б) при построении кода Хаффмана
Среднюю длину комбинации кода Хаффмана можно найти с помощью соотношения
где Рk — вероятность появления k-го сообщения, содержащего nk двоичных символов.
Для рассмотренного примера (Формула). Если эти сообщения кодировать равномерным простым кодом, то каждая комбинация должна содержать по три двоичных символа, т.е. n = 3. Следовательно, выигрыш в длине кодовой комбинации в среднем составляет примерно 22%.
Рассмотренные коды относятся к так называемым “первичным” кодам. Равномерные телеграфные коды, представленные ранее, называются также “простыми” (“примитивными”), или “кодами без избыточности”. Это связано с тем, что искажение любого из символов комбинации приводит к образованию новой разрешенной комбинации, т. е. к ошибке, что выражается в регистрации буквы или цифры, отличающейся от переданного знака.
Существуют также коды, “корректирующие ошибки” (error correction), или “помехоустойчивые”, которые строятся таким образом, чтобы для передачи сообщений применялись не все возможные комбинации, а только часть из них, называемые “разрешенными”. Это позволяет обнаруживать и исправлять ошибки при искажениях некоторых символов. Корректирующие свойства таких кодов обеспечиваются целенаправленным введением в комбинации примитивных кодов дополнительных (избыточных) символов. Эта операция выполняется в кодирующем устройстве — “кодере”.
Примером одного из простейших равномерных корректирующих кодов является код с постоянным весом, т. е. с одинаковым числом единиц в любой из разрешенных кодовых комбинаций, общее число которых определяется соотношением
Наиболее известен код, в котором имеется (Формула) разрешенных 7-элементных комбинаций, содержащих по три токовых и четыре бестоковых посылки. Изменение данного соотношения при передаче сообщений свидетельствует о появлении искажений. С помощью такого кода обнаруживаются одиночные и другие нечетные ошибки. При этом необнаруженными остаются искажения, называемые трансформацией, т. е. искажения, при которых единицы преобразуются в нулевые символы и одновременно нули преобразуются в единицы, но при этом сохраняется соотношение три единицы и четыре нуля.
В общем случае построение корректирующего кода, способного не только обнаруживать, но и исправлять возникающие ошибки, достаточно сложная задача, которая решается с использованием ряда разделов высшей алгебры.
Далее закодированный сигнал поступает в модулятор.
“Модуляцией” (modulation) называется преобразование исходного сигнала посредством изменения параметров сигнала-переносчика в соответствии с преобразуемым (модулируемым) сигналом. В качестве сигнала-переносчика информации применяется гармоническое высокочастотное колебание, импульсная последовательность или шумовой процесс.
При использовании в качестве сигнала-переносчика гармонического колебания S(t) = U cos(ωt + φ) возможна реализация трех видов модуляции: амплитудной (AM), частотной (ЧМ) и фазовой (ФМ). При использовании в качестве управляющего колебания закодированной последовательности двоичных кодовых символов получим дискретную (цифровую) модуляцию, которую принято называть “манипуляцией”.
Поясним сказанное с помощью рис. 1.4. При AM символу «1» соответствует передача колебания на несущей частоте в течение времени Τ (длительность посылки), а символу «0» — отсутствие колебания (пауза). При ЧМ осуществляется поочередная передача колебаний с частотой f1, что соответствует передаче символа «1», и колебаний с частотой f0, что соответствует передаче символа «0». При двоичной ФМ происходит изменение фазы несущего колебания на 180° при каждой смене полярности в управляющей последовательности прямоугольных посылок.
Виды дискретной модуляции сигналов
Рис. 1.4. Виды дискретной модуляции сигналов:
а – модулирующий сигнал; б — амплитудная модуляция; в — частотная модуляция; г — фазовая модуляция
Длительность Τ посылки управляющего сигнала позволяет определить техническую скорость передачи (скорость манипуляции), которую принято выражать числом посылок, передаваемых в секунду. Данная единица измерения скорости получила наименование бод (по имени французского изобретателя телеграфного аппарата и кода Ж.-М.Э. Бодо). Один бод соответствует передаче одной электрической посылки в течение одной секунды. Если длительность посылки задается в секундах, то скорость передачи v=1/Τ, Бод.
Усиление модулированных сигналов по мощности и вывод их в линию реализует передатчик {transmitter). В каналах радиосвязи на выходе передатчика включается антенна, которая осуществляет преобразование электрических сигналов в электромагнитные колебания и излучает их в окружающее пространство. Основными характеристиками современного передатчика являются диапазон применяемых частот, мощность и коэффициент полезного действия (КПД). В зависимости от свойств канала связи и предназначения передатчика его мощность может колебаться от долей до нескольких тысяч ватт. Для сравнения можно сказать о передатчиках сотовых телефонов и широковещательных станций, ведущих радиотрансляцию на сотни и тысячи километров. Диапазоны частот, применяемые в настоящее время, имеют также весьма широкие границы: от сотен килогерц до тысяч мегагерц.
Поскольку отправитель и получатель сообщений в системе передачи информации находятся в различных точках пространства, то между передатчиком и приемником создается некоторая физическая среда. В системах проводной связи — это электрический или оптический кабель, а в системах радиосвязи — область естественного пространства, по которому распространяются электромагнитные волны (радиоволны). В процессе передачи сигнал ослабляется и может искажаться вследствие воздействия всевозможных помех.
Антенна приемника улавливает лишь незначительную долю энергии, которая излучается передающей антенной. Далее происходит усиление принятого колебания и выделение сигнала, несущего информацию, предназначенную конкретному получателю. Эти операции осуществляются в приемнике (receiver). Основными характеристиками приемника являются диапазон применяемых частот, чувствительность — способность принимать весьма слабые сигналы на фоне помех, а также избирательность, под которой понимают способность выделять полезные сигналы из совокупности передаваемых колебаний и посторонних мешающих воздействий, отличающихся от принимаемого сигнала частотой.
Принятый сигнал поступает в демодулятор.
“Демодуляция” (demodulation) — это преобразование модулированного сигнала, искаженного помехами, в модулирующий сигнал. Иными словами, посредством демодуляции восстанавливается первичный сигнал, отображающий переданное сообщение. Далее этот сигнал поступает в “устройство преобразования сигнала в сообщение”.
В телефонной связи, радиовещании или при звуковом вещании таким устройством является громкоговоритель, в факсимильной связи — приемный факсимильный аппарат, а в телевидении приемная телевизионная трубка.
В системах передачи дискретных сообщений в процессе демодуляции элементы сигнала преобразуются в последовательность кодовых символов, которая поступает в декодер.
“Декодирование” (decoding) — это восстановление дискретного сообщения по выходному сигналу демодулятора, осуществляемое с учетом правила кодирования. Если на передаче был применен помехоустойчивый или корректирующий код, то на выходе декодера образуются кодовые комбинации первичного (простого) кода.
Например, при передаче текстовых сообщений роль преобразователя сигнала в сообщение выполняет приемный буквопечатающий телеграфный аппарат (телетайп), с помощью которого и будет отпечатан текст телеграммы. В системах слуховой телеграфной радиосвязи в качестве преобразователя выступает человек, т.е. оператор, на слух определяющий, какой из сигналов кода Морзе («точка» или «тире») был передан. Оператор также выполняет операцию декодирования, записывая на бумаге текст переданного сообщения.
В системах буквопечатающей телеграфной связи определение сигнала выполняется автоматически с помощью специального устройства, в котором задается некоторое значение порога. Если принятый сигнал превысил пороговое значение, то выдается символ кода, например «1», а если не превысил, — выдается символ «0». В отдельных случаях могут применяться два пороговых значения: положительное и отрицательное. Тогда, если сигнал принимается с искажениями и его уровень оказывается в промежутке между этими порогами, никакого решения не выносится. Вместо сомнительной посылки сигнала вырабатывается особый символ, называемый “стиранием”. Введение такого третьего решения повышает вероятность правильного декодирования принятой кодовой комбинации за счет ее повторной передачи по запросу с приемной стороны.
Таким образом, в системах передачи дискретных сообщений решение о передаваемом сообщении принимается в два этапа. Первой решающей схемой в этом случае является демодулятор, а второй — декодер.
В системах передачи аналоговых сообщений решение выносится сразу в демодуляторе. Иногда при передаче дискретных сообщений применяется процедура приема сообщений в целом. В этом случае одним устройством выполняется совместная операция демодуляции-декодирования, в результате чего приходящий ряд сигналов сразу преобразуется в последовательность знаков (букв) сообщения.
Существует ошибочное мнение, что демодуляция и декодирование — это операции, обратные модуляции и кодированию, выполняемые с принятым сигналом. На самом деле в результате различных искажений и воздействия помех принятое колебание может существенно отличаться от переданного сигнала. Поэтому данные операции являются наиболее сложными в системе передачи информации. Для принятия решения о переданном сообщении необходимо детально проанализировать принятый сигнал, для чего его подвергают различным преобразованиям, которые называются обработкой сигнала. Следовательно, одной из задач теории электрической связи является отыскание правил (процедур) оптимальной обработки сигнала, при которых решение о переданном сообщении является наиболее достоверным.
Завершая рассмотрение системы передачи информации, отметим, что качество обработки сигналов существенным образом зависит от точности синхронизации переданных и принятых сигналов. При этом различают следующие виды синхронизации: “тактовую” — установление границ посылок сигналов, “цикловую”, при которой следует различать границы кодовых комбинаций, синхронизацию несущих частот и др. Неточности синхронизации приводят к снижению достоверности приема информации. Сбой в работе системы синхронизации делает вообще невозможным правильный прием переданных сообщений. Подробно системы синхронизации рассматриваются в специальных курсах.
Проанализированная система передачи информации является одноканальной, т.е. она обеспечивает передачу информации от одного источника к одному получателю.
Существуют также многоканальные системы. Упрощенная схема одной из таких систем показана на рис. 1.5, в которой по одной общей линии связи обеспечивается обмен информацией между несколькими абонентами. В такой системе первичные сигналы, подлежащие передаче, преобразуются посредством модуляторов M1, M2, …, Мn в электрические сигналы U1(t), U2(t), …, Un(t), a затем объединяются в аппаратуре уплотнения. Полученный таким образом групповой (суммарный) сигнал UΣ(t) передается по линии связи. На приемной стороне колебание Z(t) = UΣ(t) + n(t), искаженное помехами, с помощью устройства разделения, основу которого составляют индивидуальные фильтры Ф1, Φ2, …, Фn, разделяется на сигналы (Формула), которые с помощью демодуляторов D1, D2, …, Dn преобразуются в первичные сигналы (Формула). Для разделения сигналов обычно используется их различие по частоте, времени или форме.
Многоканальная система передачи информации
Рис. 1.5. Структурная схема многоканальной системы передачи информации
В заключение отметим, что в современных системах передачи дискретных сообщений принято различать две группы относительно самостоятельных устройств: кодеки и модемы.
“Кодек” (сокращение словосочетания кодер-декодер) — устройство, в котором сообщение в процессе передачи преобразуется в код (кодер), а код в процессе приема преобразуется в сообщение (декодер). “Модем” (сокращение словосочетания модулятор-демодулятор) — устройство, преобразующее при передаче код в сигнал (модулятор), а при приеме сигнал в код (демодулятор). Обычно эти устройства выполняются в виде целостных узлов, через которые проходят цепи на передачу и на прием точно так же, как в телефонных аппаратах.