Главная > Компьютеры и комплектующие > Мультимедиа >
FAQ по цифровому представлению звуковых сигналов

Секция 2 из 3 - Предыдущая - Следующая
Все секции - 1 - 2 - 3
распространен тип MPEG-1.

Существует три уровня (layers) Audio MPEG-1 для сжатия
стереофонических сигналов:

1 - коэффициент сжатия 1:4 при потоке данных 384 кбит/с;
2 - 1:6..1:8 при 256..192 кбит/с;
3 - 1:10..1:12 при 128..112 кбит/с.

Минимальная скорость потока данных в каждом уровне определяется в 32
кбит/с; указанные скорости потока позволяют сохранить качество сигнала
примерно на уровне компакт-диска.

Все три уровня используют входное спектральное преобразование с
разбиением кадра на 32 частотные полосы. Наиболее оптимальным в
отношении объема данных и качества звука признан уровень 3 со
скоростью потока 128 кбит/с и плотностью данных около 1 Мб/мин. При
сжатии с более низкими скоростями начинается принудительное
ограничение полосы частот до 15-16 кГц, а также возникают фазовые
искажения каналов (эффект типа фэйзера или фленжера).

Audio MPEG используется в компьютерных звуковых системах, CD-i/DVD,
"звуковых" дисках CD-ROM, цифровом радио/телевидении и других системах
массовой передачи звука.

PASC (Precision Adaptive Sub-band Coding - точное адаптивное
внутриполосное кодирование) - частный случай Audio MPEG-1 Layer 1 со
скоростью потока 384 кбит/с (сжатие 1:4). Применяется в системе DCC.

ATRAC (Adaptive TRansform Acoustic Coding - акустическое кодирование
адаптивным преобразованием) базируется на стереофоническом звуковом
формате с 16-разрядным квантованием и частотой дискретизации 44.1 кГц.
При сжатии каждый кадр делится на 52 частотные полосы, результирующая
скорость потока - 292 кбит/с (сжатие 1:5). Применяется в системе
MiniDisk.

----------------------------------------------------------------------

 - Какие форматы используются для представления цифрового звука?

Понятие формата используется в двух различных смыслах. При
использовании специализированного носителя или способа записи и
специальных устройств чтения/записи в понятие формата входят как
физические характеристики носителя звука - размеры кассеты с магнитной
лентой или диском, самой ленты или диска, способ записи, параметры
сигнала, принципы кодирования и защиты от ошибок и т.п. При
использовании универсального информационного носителя широкого
применения - например, компьютерного гибкого или жесткого диска - под
форматом понимают только способ кодирования цифрового сигнала,
особенности расположения битов и слов и структуру служебной
информации; вся "низкоуровневая" часть, относящаяся непосредственно к
работе с носителем, в этом случае остается в ведении компьютера и его
операционной системы.

Из специализированных форматов и носителей цифрового звука в настоящее
время наиболее известны следующие:

- CD (Compact Disk - компакт-диск) - односторонний пластмассовый диск
с оптической лазерной записью и считыванием, диаметром 120 или 90 мм,
вмещающий максимум 74 минуты стереозвучания с частотой дискретизации
44.1 кГц и 16-разрядным линейным квантованием. Система предложена
фирмами Sony и Philips и носит название CD-DA (Compact Disk - Digital
Audio). Для защиты от ошибок используется двойной код Рида-Соломона с
перекрестным перемежением (Cross Interleaved Reed-Solomon Code, CIRC)
и модуляция кодом Хэмминга 8-14 (Eight-to-Fourteen Modulation, EFM).
Различаются штампованные (CD) однократно записываемые (CD-R) и
многократно перезаписываемые (CD-RW) компакт-диски.

- ИКМ-приставка (PCM deck) - система для преобразования цифрового
звукового сигнала в псевдовидеосигнал, совместимый с популярными
видеоформатами (NTSC, PAL/SECAM), и обратно. ИКМ-приставки применяются
в сочетании с бытовыми (VHS) или студийными (S-VHS, Beta, U-Matic)
видеомагнитофонами, используя их в качестве устройств чтения/записи.
Устройства работают с 16-разрядным линейным квантованием на частотах
дискретизации 44.056 кГц (NTSC) и 44.1 кГц (PAL/SECAM), и позволяют
записывать двух- или четырехканальную цифровую сигналограмму. По сути,
такая приставка представляет собой модем (модулятор-демодулятор) для
видеосигнала.

- S-DAT (Stationary head Digital Audio Tape - цифровая звуковая лента
с неподвижной головкой) - система наподобие обычного кассетного
магнитофона, запись и чтение в которой ведутся блоком неподвижных
тонкопленочных головок на ленте шириной 3.81 мм в двухсторонней
кассете размером 86 x 55.5 x 9.5 мм. Реализует 16-разрядную запись
двух или четырех каналов на частотах 32, 44.1 и 48 кГц.

- R-DAT (Rotary head Digital Audio Tape - цифровая звуковая лента с
вращающейся головкой) - система наподобие видеомагнитофона с
поперечно-наклонной записью вращающимися головками. Наиболее
популярный формат ленточной цифровой записи, системы R-DAT часто
обозначаются просто DAT. В R-DAT используется кассета размером 73 x 54
x 10.5 мм, с лентой шириной 3.81 мм, а сама система кассеты и
магнитофона очень похожа на типовой видеомагнитофон. Базовая скорость
движения ленты - 8.15 мм/с, скорость вращения блока головок - 2000
об/мин. R-DAT работает с двухканальным (в ряде моделей -
четырехканальным) сигналом на частотах дискретизации 44.1 и 48 кГц с
16-разрядном линейным квантованием, и 32 кГц - с 12-разрядным
нелинейным. Для защиты от ошибок используется двойной код
Рида-Соломона и модуляция кодом 8-10. Емкость кассеты - 80..240 минут
в зависимости от скорости и длины ленты. Бытовые DAT-магнитофоны
обычно оснащены системой защиты от незаконного копирования фонограмм,
не допускающей записи с аналогового входа на частоте 44.1 кГц, а также
прямого цифрового копирования при наличии запрещающих кодов SCMS
(Serial Code Managenent System). Студийные магнитофоны таких
ограничений не имеют.

- DASH (Digital Audio Stationary Head) - система с записью на
магнитную ленту шириной 6.3 и 12.7 мм в продольном направлении
неподвижными головками. Скорость движения ленты - 19.05, 38.1, 76.2
см/с. Реализует 16-разрядную запись с частотами дискретизации 44.056,
44.1 и 48 кГц от 2 до 48 каналов.

- ADAT (Alesis DAT) - собственная (proprietary) система
восьмиканальной записи звука на видеокассету типа S-VHS, разработанная
фирмой Alesis. Использует 16-разрядное линейное квантование на частоте
48 кГц, емкость кассеты составляет до 60 минут на каждый канал.
Магнитофоны ADAT допускают каскадное соединение, в результате чего
может быть собрана система 128-канальной синхронной записи. Для ADAT
выпускается множество различных интерфейсных блоков для сопряжения с
DAT, CD, MIDI и т.п. Модель Meridian (ADAT Type II) использует
20-разрядное квантование на частотах 44.1 и 48 кГц.

- DCC (Digital Compact Cassette - цифровая компакт-кассета) - бытовая
система записи в продольном направлении на стандартную
компакт-кассету, разработанная Philips. Скорость движения ленты - 4.76
см/с, максимальное время звучания такое же, как при аналоговой записи.
Частоты дискретизации - 32, 44.1, 48 кГц, разрешение - 16/18 разрядов
(метод сжатия PASC). На DCC-магнитофонах могут воспроизводиться (но не
записываться) обычные аналоговые компакт-кассеты. В настоящее время
система DCC признана неперспективной.

- MD (MiniDisk) - бытовая и концертная система записи на
магнитооптический диск, разработанная Sony. Диск диаметром 64 мм,
помещенный в пластмассовый футляр размером 70 x 67.5 x 5 мм, вмещает
74 минуты (60 в ранних версиях) стереофонического звучания. При обмене
со внешними устройствами используется формат 16-разрядных отсчетов на
частоте 44.1 кГц, однако на сам диск сигнал записывается после сжатия
методом ATRAC.


Из универсальных компьютерных форматов наиболее популярны следующие:

- Microsoft RIFF/WAVE (Resource Interchange File Format/Wave - формат
файлов передачи ресурсов/волновая форма) - стандартный формат звуковых
файлов в компьютерах IBM PC. Файл этого формата содержит заголовок,
описывающий общие параметры файла, и один или более фрагментов
(chunks), каждый из которых представляет собой волновую форму или
вспомогательную информацию - режимы и порядок воспроизведения,
пометки, названия и координаты участков волны и т.п. Файлы этого
формата имеют расширение .WAV.

- Apple AIFF (Audio Interchange File Format - формат файла обмена
звуком) - стандартный тип звукового файла в системах Apple Macintosh.
Похож на RIFF и также позволяет размещать вместе со звуковой волной
дополнительную информацию, в частности - самплы WaveTable-инструментов
вместе с параметрами синтезатора.

- Формат "чистой оцифровки" RAW, не содержащий заголовка и
представляющий собой только последовательность отсчетов звуковой
волны. Обычно оцифровка хранится в 16-разрядном знаковом (signed)
формате, когда первыми в каждой паре идут отсчеты левого канала, хотя
могут быть и исключения.

----------------------------------------------------------------------

 - Как выполняется обработка цифрового звука?

Цифровой звук обрабатывается посредством математических операций,
применяемых к отдельным отсчетам сигнала, либо к группам отсчетов
различной длины. Выполняемые математические операции могут либо
имитировать работу традиционных аналоговых средств обработки
(микширование двух сигналов - сложение, усиление/ослабление сигнала -
умножение на константу, модуляция - умножение на функцию и т.п.), либо
использовать альтернативные методы - например, разложение сигнала в
спектр (ряд Фурье), коррекция отдельных частотных составляющих, затем
обратная "сборка" сигнала из спектра.

Обработка цифровых сигналов подразделяется на линейную (в реальном
времени, над "живым" сигналом) и нелинейную - над предварительно
записанным сигналом. Линейная обработка требует достаточного
быстродействия вычислительной системы (процессора); в ряде случаев
невозможно совмещение требуемого быстродействия и качества, и тогда
используется упрощенная обработка с пониженным качеством. Нелинейная
обработка никак не ограничена во времени, поэтому для нее могут быть
использованы вычислительные средства любой мощности, а время
обработки, особенно с высоким качеством, может достигать нескольких
минут и даже часов.

Для обработки применяются как универсальные процессоры общего
назначения - Intel 8035, 8051, 80x86, Motorola 68xxx, SPARC - так и
специализированные цифровые сигнальные процессоры (Digital Signal
Processor, DSP) Texas Instruments TMS xxx, Motorola 56xxx, Analog
Devices ADSP-xxxx и др.

Разница между универсальным процессором и DSP состоит в том, что
первый ориентирован на широкий класс задач - научных, экономических,
логических, игровых и т.п., и содержит большой набор команд общего
назначения, в котором преобладают обычные математические и логические
операции. DSP специально ориентированы на обработку сигналов и
содержат наборы специфический операций - сложение с ограничением,
перемножение векторов, вычисление математического ряда и т.п.
Реализация даже несложной обработки звука на универсальном процессоре
требует значительного быстродействия и далеко не всегда возможна в
реальном времени, в то время как даже простые DSP нередко справляются
в реальном времени с относительно сложной обработкой, а мощные DSP
способны выполнять качественную спектральную обработку сразу
нескольких сигналов.

В силу своей специализации DSP редко применяются самостоятельно - чаще
всего устройство обработки имеет универсальный процессор средней
мощности для управления всем устройством, приема/передачи информации,
взаимодействия с пользователем, и один или несколько DSP - собственно
для обработки звукового сигнала. Например, для реализации надежной и
быстрой обработки сигналов в компьютерных системах применяют
специализированные платы с DSP, через которые пропускается
обрабатываемый сигнал, в то время как центральному процессору
компьютера остаются лишь функции управления и передачи.

----------------------------------------------------------------------

 - Что представляет собой цифровая звуковая рабочая станция?

Digital Audio Workstation (DAW) представляет собой специализированную
или универсальную компьютерную систему, способную выполнять запись,
хранение, воспроизведение и обработку цифрового звука.
Специализированные системы ориентированы исключительно на работу с
цифровым звуком и выпускаются в законченном исполнении, допускающем
лишь ограниченное расширение, либо нерасширяемые вообще. Универсальные
системы представляют собой обычный персональный компьютер, снабженный
средствами для ввода/вывода звука (ЦАП/АЦП и/или цифровые интерфейсы)
и набором программ для его записи, воспроизведения и обработки. Кроме
этого, станция может содержать и другие компоненты - например,
аппаратные модули цифровой обработки, музыкальные синтезаторы,
записывающие CD-приводы и т.п.

Поскольку любая компьютерная система является сильным источником
высокочастотных помех, возникают определенные проблемы в достижении
профессионального качества звука при использовании встроенных АЦП/ЦАП.
В таких случаях предпочтительно использование внешних модулей АЦП/ЦАП,
выдающих и получающих цифровую информацию в реальном времени через
универсальные или собственные цифровые интерфейсы.

----------------------------------------------------------------------

 - Какие жесткие диски используются в рабочих станциях?

Большинство специализированных рабочих станций используют для хранения
звука жесткие диски с интерфейсом SCSI (Small Computer System
Interface - интерфейс малых компьютерных систем), ставшие
универсальным стандартом - любая популярная компьютерная система имеет
возможность подключения этих дисков. Достоинствами SCSI является
универсальность среди всех компьютерных систем, возможность
подключения до семи устройств (любых, не только дисковых) к одному
контроллеру, хороший арбитраж при конкуренции устройств,
интеллектуальность каждого устройства, более высокое общее качество
исполнения, возможность использования интерфейса для прямой связи
между двумя станциями. К недостаткам SCSI следует отнести высокую
стоимость интерфейсов и дисков и ограниченный спектр выпускаемых
моделей.

В компьютерах типа IBM PC более популярны жесткие диски с интерфейсом
IDE (Integrated Drive Electronics - электроника, встроенная в
накопитель), не получившие распространения в других системах.
Достоинства IDE-дисков - простота, хорошая производительность, не
уступающая большинству SCSI-дисков, а в ряде случаев - превосходящая
их, низкая стоимость, массовый выпуск, широкий спектр моделей.
Недостатки - низкая производительность и надежность моделей низших
классов, возможность подключения только двух накопителей к одному
контроллеру, невозможность прямого соединения двух станций, часто
худшая поддержка драйверами операционных систем.

----------------------------------------------------------------------

 - Есть ли преимущества у SCSI перед IDE при цифровой записи?

Среди пользователей звуковых рабочих станций - как домашних, так и
студийных - бытует мнение, что только диски SCSI способны обеспечить
нужное быстродействие. Однако, несмотря на ряд очевидных преимуществ
SCSI, большинство даже профессиональных рабочих станций на IBM PC
вполне может обходиться дисками IDE. Скорость чтения/записи типовых
моделей IDE-дисков сегодня (конец 1998 г.) находится на уровне 6-10
Мб/с при времени поиска около 8-10 мс, что равнозначно таким же
типовым (не High End) моделям SCSI.

Такой жесткий диск свободно справляется с одновременным чтением
16-разрядных звуковых данных по 20-30 звуковым каналам на частоте
дискретизации 48 кГц, и несколько меньшим объемом данных в случае
записи. Другое дело, что в случае SCSI его внутренняя оптимизация
(сортировка запросов для минимизации перемещения головок в SCSI-2)
часто маскирует неоптимальную работу ОС и звуковой программы, а для
достижения такого уровня на IDE может потребоваться хороший драйвер ОС
и аккуратно сделанная программа (например, DDClip).

Причины нелюбви многих пользователей к IDE-дискам происходят оттого,
что с этими дисками они обычно сталкиваются в дешевых, некачественно
собранных и протестированных компьютерах средней мощности, состоящих
из разномастных компонент, нередко плохо совместимых друг с другом. И
напротив - SCSI-диски чаще всего ставятся в более мощные и дорогие
модели, содержащие компоненты "уважаемых" производителей, более
тщательно собранные и проверенные. Замена во втором варианте диска
SCSI на IDE примерно равной производительности и сборка/настройка
системы с учетом особенностей IDE во многих случаях не окажет
заметного влияния на ее производительность.

----------------------------------------------------------------------

 - Зачем в цифровой записи применяются жесткие диски класса AV?

Класс AV (Audio/Video) у жестких дисков означает их способность
предельно равномерно, без пауз, записывать и считывать потоки данных.
Такие диски снабжаются внутренним буфером большего размера и не
прерывают процесса чтения/записи термокалибровкой системы
позиционирования. Для систем цифровой записи, имеющих недостаточное
быстродействие и объемы ОЗУ, чтобы сгладить возможные неравномерности
в работе обычных дисков, диски класса AV являются единственным
возможным выходом.

Следует иметь в виду, что наличие аббревиатуры AV в обозначении диска
еще не означает его принадлежности к классу Audio/Video - об этом
должно быть явно упомянуто в паспорте диска.

Однако указанная особенность в общем случае необходима только при
работе с качественной видеоинформацией, скорость поступления которой
составляет порядка 10 мегабайт в секунду на канал. В случае же
звуковых систем скорость одноканального 16-разрядного потока с
частотой дискретизации 48 кГц на два порядка меньше и составляет всего
94 килобайта в секунду. В то же время почти никакая рабочая станция не
в состоянии обеспечить одновременную работу с сотней каналов, как и
жесткий диск не в состоянии параллельно обрабатывать такое количество
данных, расположенных в разных его участках. В реальных применениях
многоканальной записи на одном диске основная часть накладных расходов
дисковой подсистемы ложится на перемещение головок между участками
записи, а отнюдь не на саму передачу данных. Низкая же скорость
звуковых потоков делает более удобной и надежной их буферизацию в ОЗУ
компьютера, компенсирующую термокалибровку диска в течение 0.5 - 1 с,
нежели использование дорогих и редких дисков AV-класса. К тому же
далеко не на всех обычных дисках термокалибровка оказывает заметное
влияние на равномерность потока данных.

"Рваная" передача данных может также возникать при использовании
"неправильной" операционной системы (DOS, Windows без 32-разрядного
драйвера диска и т.п.), недостаточном количестве и размере файловых
буферов ОС и записывающей программы, применении дисков низкого класса
со скоростью передачи порядка 1-2 мегабайт в секунду и ниже,
неправильном подключении диска и т.п. В любом случае, такие ситуации
чаще всего говорят о неправильной конфигурации и настройке аппаратной
и программной части системы.

----------------------------------------------------------------------

 - Искажается ли цифровой сигнал при передаче и хранении?

Поскольку любой цифровой сигнал представляется реальной электрической
кривой напряжения или тока - его форма так или иначе искажается при
любой передаче, а "замороженный" для хранения сигнал (сигналограмма)
подвержен деградации в силу обычных физических причин. Все эти
воздействия на форму несущего сигнала являются помехами, которые до
определенной величины не изменяют информационного содержания сигнала,
как отдельные искажения и выпадения букв в словах обычно не мешают
правильному пониманию этих слов, причем избыточность информации, как и
увеличение длины слов, повышает вероятность успешного распознавания.
Другими словами, сам несущий сигнал может искажаться, однако
переносимая им информация - закодированный звуковой сигнал - в
абсолютном большинстве случаев остается неизменной.

Для того, чтобы качество несущего сигнала не ухудшалось, любая
передача полезной звуковой информации - копирование, запись на
носитель и считывание с него - обязательно должна включать операцию
восстановления формы несущего сигнала, а в идеале - и первичного
цифрового вида сигнала информационного, и лишь после этого заново
сформированный несущий сигнал может быть передан следующему
потребителю. В случае прямого копирования без восстановления
(например, обычным переписыванием видеокассеты с цифровым сигналом,
полученным при помощи ИКМ-приставки, на обычных видеомагнитофонах)
качество цифрового сигнала ухудшается, хотя он по-прежнему полностью
содержит всю переносимую им информацию. Однако после многократного
последовательного копирования или длительного хранения качество
ухудшается настолько, что начинают возникать неисправимые ошибки,
необратимо искажающие переносимую сигналом информацию. Поэтому
копирование и передачу цифровых сигналов необходимо вести только в
цифровых устройствах, а при хранении на носителях - своевременно
"освежать" не дожидаясь необратимой деградации (для магнитных
носителей этот срок оценивается в несколько лет). Правильно переданная
или обновленная цифровая сигналограмма качества не теряет и может
копироваться и существовать вечно в абсолютно неизменном виде.

Тем не менее, не следует забывать, что корректирующая способность
любого кода конечна, а реальные носители далеки от идеальных, поэтому
возникновение неисправимых ошибок - на такая уж редкая вещь, особенно
при неаккуратном обращении с носителем. При чтении с новых и правильно
хранимых DAT-кассет или компакт-дисков в качественных и надежных
аппаратах таких ошибок практически не возникает, однако при старении,
загрязнении и повреждении носителей и считывающих систем их становится
больше. Одиночная неисправленная ошибка почти всегда незаметна на слух
благодаря интерполяции, однако она приводит к искажению формы
исходного звукового сигнала, а накопление таких ошибок со временем
начинает ощущаться и на слух.

Отдельную проблему составляет сложность регистрации неисправленных
ошибок, а также проверки идентичности оригинала и копии. Чаще всего
конструкторы цифровых звуковых устройств, работающих в реальном
времени, не озабочены вопросом точной проверки достоверности передачи,
считая вполне достаточными меры, принятые для коррекции ошибок.
Невозможность в общем случае повторной передачи ошибочного отсчета или
блока приводит к тому, что интерполяция происходит скрытно и после
копирования нельзя с уверенностью сказать, точно ли скопирован
исходный сигнал. Индикаторы ошибки, имеющиеся в ряде устройств, обычно
включаются только в момент ее возникновения, и в случае одиночных
ошибок их срабатывание легко может остаться незамеченным. Даже в
системах на основе персональных компьютеров чаще всего нет возможности
контролировать правильность приема по цифровому интерфейсу или прямого
считывания CD; выходом является только многократное повторение
операции и сравнение результатов.

И наконец, в принципе возможны ситуации, когда даже незначительные
ошибки способны необратимо исказить передаваемую информацию, оставшись
при этом незамеченными системой передачи. Другое дело, что вероятность
возникновения подобных ошибок исчезающе мала (порядка одной на
несколько лет непрерывной передачи сигнала), поэтому такую возможность
практически нигде не принимают в расчет.

----------------------------------------------------------------------

 - Страдает ли качество сигнала при цифровой обработке?

Прежде всего, необходимо различать "искажающие" и "неискажающие" виды
обработки. К первым относятся операции, изменяющие форму и структуру
сигнала - смешивание, усиление, фильтрация, модуляция и т.п., ко
вторым - операции монтажа (вырезка, вклейка, наложение) и переноса
(копирования).

Качество сигнала может страдать только при "искажающей" обработке,
причем любой - и аналоговой, и цифровой. В первом случае это
происходит в результате внесения шумов, гармонических,
интермодуляционных и других искажений в узлах аналогового тракта, во
втором - благодаря конечной точности квантования сигнала и
математических вычислений. Все цифровые вычисления выполняются в
некоторой разрядной сетке фиксированной длины - 16, 20, 24, 32, 64, 80
и более бит; увеличение разрядности сетки повышает точность вычислений
и уменьшает ошибки округления, однако в общем случае не может
исключить их полностью. Конечная точность квантования первичного
аналогового сигнала приводит к тому, что даже при абсолютно точной
обработке полученного цифрового сигнала квантованное значение каждого
отсчета все равно отличается от своего идеального значения. Для
минимизации искажений при обработке в студиях предпочитают
обрабатывать и хранить сигналограммы на мастер-носителях с повышенным
разрешением (20, 24 или 32 разряда), даже если результат будет
тиражироваться на носителе с меньшим разрешением.

Кроме собственно ошибок вычислений и округления, на точность сильно
влияет выбор представления числовых отсчетов сигнала при обработке.
Традиционное представление PCM с так называемой фиксированной точкой
(fixed point), когда отсчеты представляются целыми числами, наиболее
удобно и влечет минимум накладных расходов, однако точность вычислений
зависит от масштаба операций - например, при умножении образуются
числа вдвое большей разрядности, которые потом приходится приводить
обратно к разрядности исходных отсчетов, а это может привести к
переполнению разрядной сетки. Компромиссным вариантом служит
промежуточное увеличение разрядности отсчетов (например, 16->32), что
снижает вероятность переполнения, однако требует большей
вычислительной мощности, объема памяти и вносит дополнительные
искажения при обратном понижении разрядности. Кроме того, снижению
погрешности способствует правильный выбор последовательности
коммутативных (допускающих перестановку) операций, группировка
дистрибутивных операций, учет особенностей работы конкретного
процессора и т.п.

Другим способом увеличения точности является преобразование отсчетов в
форму с плавающей точкой (floating point) с разделением на значащую
часть - мантиссу и показатель величины - порядок. В этой форме все
операции сохраняют разрядность значащей части, и умножение не приводит
к переполнению разрядной сетки. Однако, как само преобразование между
формами с фиксированной и плавающей точкой, так и вычисления в этой
форме требуют на порядки большего быстродействия процессора, что
сильно затрудняет их использование в реальном времени.

Несмотря на то, что качество сигнала (относительно исходного
аналогового) неизбежно, хоть и незначительно, ухудшается при любой
"искажающей" цифровой обработке, некоторые операции при определенных
условиях являются полностью и однозначно обратимыми. Например,
усиление сигнала по амплитуде в три раза заключается в умножении
каждого отсчета на три; если эта операция выполнялась с фиксированной
точкой и при этом не возникло переполнения, с помощью деления на три
потом можно будет вернуть все отсчеты в исходное состояние, тем самым
полностью восстановив первоначальное состояние сигнала.

Сказанное выше демонстрирует, что ухудшение качества при "искажающей"
цифровой обработке совсем не обязательно накапливается со временем,
хотя в большинстве реальных применений происходит именно так. Кроме
того, это не означает, что любая операция цифрового усиления всегда
будет однозначно обратимой - это зависит от многих особенностей
применения операции.

При сравнении аккуратности аналоговой и цифровой обработки нужно иметь
в виду, что оба вида вносят в сигнал некоторое количество
погрешностей, которые можно рассматривать как шум, однако каждый вид
обработки имеет свои особенности. Любой элемент аналогового тракта
вносит шум всегда, однако его величина колеблется в зависимости от
качества тракта и вида обработки. При цифровой обработке "первичный"
шум всегда вносится самим фактом квантования, а внутри цифрового
тракта его могут вносить только операции с ограниченной точностью
(например, описанное умножение на три шума не добавляет - оно лишь
усиливает ранее внесенные шумы, и шум квантования в том числе).

Из этого следует, что точные операции не изменяют соотношения
сигнал/шум цифрового сигнала, однако могут увеличивать ошибки
первичного квантования. Таким образом, увеличение точности цифровой
обработки само по себе не гарантирует хорошего качества сигнала -
необходимо еще и достаточно точное квантование. Например, 20-разрядное
квантование в сочетании с 24-разрядной обработкой уже может успешно
соперничать со многими аналоговыми устройствами, в то время как такая
же обработка при 16-разрядном квантовании существенно им уступает.

Грамотно и качественно реализованная цифровая обработка может давать
существенно меньший уровень искажений, чем такая же аналоговая, разве
что это будут искажения разных видов.

----------------------------------------------------------------------

 - Страдает ли качество сигнала при преобразованиях форматов?

Только в том случае, когда в процессе преобразования применяются
"искажающие" операции - изменение разрядности отсчета, частоты
дискретизации, фильтрование, сжатие с потерями и т.п. Простое
увеличение разрядности отсчета с сохранением частоты дискретизации
будет неискажающим, однако такое же увеличение, сопряженное с
применением сглаживающей функции - уже нет. Уменьшение разрядности
отсчета всегда является искажающей операцией, кроме случая, когда
преобразуемые отсчеты были получены таким же простым увеличением
разрядности - равной или меньшей.

Многие форматы отличаются друг от друга только порядком битов в слове,
отсчетов левого и правого каналов в потоке и служебной информацией -
заголовками, контрольными суммами, помехозащитными кодами и т.п.
Точный способ проверки неискажаемости сигнала заключается в
преобразовании нескольких различных потоков (файлов) формата F1 в
формат F2, а затем обратно в F1. Если информационная часть каждого
потока (файла) при этом будет идентична исходной - данный вид
преобразования можно считать неискажающим.

Под информационной частью потока (файла) понимается собственно набор
данных, описывающих звуковой сигнал; остальная часть считается
служебной и на форму сигнала в общем случае не влияет. Например, если
в служебной части файла или потока предусмотрено поле для времени его
создания (передачи), то даже в случае полного совпадения
информационных частей двух разных файлов или потоков их служебные
части окажутся различными, и это будет зафиксировано логическим
анализатором в случае потока или программой побайтного сравнения - в
случае файла. Кроме этого, временной сдвиг одного сигнала относительно
другого, возникающий при выравнивании цифрового потока по границам
слов или блоков и состоящий в добавлении нулевых отсчетов в начало
и/или конец файла или потока, также приводит к их кажущемуся цифровому
несовпадению. В таких ситуациях для проверки идентичности цифровых
сигналов необходимо пользоваться специальной аппаратурой или
программой.

----------------------------------------------------------------------

 - Как преобразовать цифровой звук из одного формата в другой?

Для "перегонки" звука между специализированными системами, имеющими
совместимые цифровые интерфейсы, достаточно соединить их цифровым
кабелем и переписать звук с одной системы на другую; в ряде сочетаний
устройств при этом возможно ухудшение качества сигнала из-за
уменьшения разрядности отсчета, передискретизации или сжатия звука.
Например, при копировании звука между одинаковыми системами MiniDisk
через интерфейс S/PDIF сжатый звуковой поток на передающей стороне
подвергается восстановлению, а на приемной - повторному сжатию.
Вследствие несимметричности алгоритма ATRAC в звук при повторном
сжатии будут внесены добавочные искажения.

Для преобразования компьютерного файла в другой формат используются
программы-конверторы: WAV2AIFF/AIFF2WAV, Convert, AWave и другие - на
IBM PC, SoundExtractor, SampleEditor, BST - на Apple Macintosh.

Обмен звуковой информацией между компьютерной и специализированной
системой нередко возможен несколькими способами:

- Прямой перенос по цифровому интерфейсу, если у обоих систем имеются
совместимые цифровые интерфейсы. При этом на компьютерной системе
используется программа записи/воспроизведения, формирующая или
воспроизводящая стандартный для данной системы звуковой файл.

- Чтение/запись на специализированных системах стандартных
компьютерных носителей. Например, ряд музыкальных рабочих станций
использует гибкие диски в форматах стандартных файловых систем IBM PC
Секция 2 из 3 - Предыдущая - Следующая
Вернуться в раздел "Мультимедиа" - Обсудить эту статью на Форуме
Главная - Поиск по сайту - О проекте - Форум - Обратная связь