Статьи
Как люди, непосредственно связанные с AV сферой, мы постоянно говорим об аудио-кодировании и аудиокодеках, а что же это такое? Аудиокодек – это, по сути, устройство или алгоритм, способный кодировать и декодировать цифровой аудиосигнал.

На практике аудиоволны, которые передаются по воздуху, являются продолжительными аналоговыми сигналами. Сигналы преобразуются в цифровой формат устройством, которое называется аналого-цифровой преобразователь (АЦП), а устройство обратного преобразования – цифро-аналоговый преобразователь (ЦАП). Кодек находится между этими двумя функциями и именно он позволяет откорректировать некоторые важные параметры для успешного захвата, записи и трансляции звукового сигнала: алгоритм кодека, частота дискретизации, разрядность и скорость передачи данных.
Три наиболее популярных аудиокодека: Pulse-Code Modulation ( PCM), MP3 и Advanced Audio Coding ( AAC ). Выбор кодека определяет степень сжатия и качество записи. PCM – кодек, который используется компьютерами, CD-дисками, цифровыми телефонами и иногда SACD-дисками. Источник сигнала для PCM сэмплируется через равные интервалы, и каждый сэмпл представляет собой амплитуду аналогового сигнала в цифровом значении. PCM – это наиболее простой вариант для оцифровки аналогового сигнала.
При наличии правильных параметров этот оцифрованный сигнал может быть полностью реконструирован обратно в аналоговый без каких-либо потерь. Но этот кодек, обеспечивающий практически полную идентичность оригинальному аудио, к сожалению, не очень экономичен, что выражается в очень больших объемах файлов, а такие файлы не подходят для потокового вещания. Мы рекомендуем использовать PCM для записи цифровых образов для ваших источников или когда вы занимаетесь постобработкой аудио.
К счастью, у нас всегда есть возможность выбрать другой кодек, который может сжимать цифровые данные (по сравнению с PCM) на основании некоторых полезных наблюдений о поведении звуковых волн. Но в этом случае приходится идти на компромисс: все альтернативные алгоритмы сопряжены с «потерями», так как невозможно полностью восстановить исходный сигнал, но, тем не менее, результат всё равно хорош настолько, что большинство пользователей не смогут уловить разницу.
MP3 – это формат аудио-кодирования с использованием как раз такого алгоритма сжатия цифровых данных, который позволяет сохранять аудиосигнал в меньшие по объему файлы. Кодек MP3 чаще всего используется пользователями для записи и хранения музыкальных файлов. Мы рекомендуем применять MP3 для трансляций аудио-контента, так как ему требуется меньшая пропускная способность сети.
AAC – это более новый алгоритм кодирования аудиосигнала, ставший «преемником» MP3. AAC стал стандартом для форматов MPEG-2 и MPEG-4. По сути это тоже кодек сжатия цифровых данных, но с меньшей, чем у MP3, потерей качества при кодировании с одинаковыми битрейтами. Мы рекомендуем использовать этот кодек для онлайн трансляций.
Частота дискретизации (кГц, kHz)
Частота дискретизации (или частота сэмплирования) — частота, с которой происходит оцифровка, хранение, обработка или конвертация сигнала из аналога в цифру. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (сэмплов), взятых через равные промежутки времени.
Измеряется в герцах (Гц, Hz) или килогерцах (кГц, kHz,) 1 кГц равен 1000 Гц. Например, 44 100 сэмплов в секунду можно обозначить как 44 100 Гц или 44,1 кГц. Выбранная частота дискретизации будет определять максимальную частоту воспроизведения, и, как следует из теоремы Котельникова, для того, чтобы полностью восстановить исходный сигнал, частота дискретизации должна в два раза превышать наибольшую частоту в спектре сигнала.
Как известно, человеческое ухо способно улавливать частоты между 20 Гц и 20 кГц. Учитывая эти параметры и значения, показанные в таблице ниже, можно понять, почему именно частота 44,1 кГц была выбрана в качестве частоты дискретизации для CD и до сих пор считается очень хорошей частотой для записи.
Есть ряд причин для выбора более высокой частоты дискретизации, хотя может показаться, что воспроизводить звук вне диапазона человеческого слуха – пустая трата сил и времени. При этом среднестатистическому слушателю будет вполне достаточно 44,1 – 48 кГц для качественного решения большинства задач.
Разрядность
Наряду с частотой дискретизации есть такое понятие как разрядность или глубина звука. Разрядность – это количество бит цифровой информации для кодирования каждого сэмпла. Проще говоря, разрядность определяет «точность» измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. С минимальной возможной разрядностью есть только два варианта измерения точности звука: 0 для полной тишины и 1 для звучания в полном объеме. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 = 65 536) различных значений.
Разрядность закреплена в кодеке PCM, но для кодеков, которые предполагают сжатие (например, MP3 и AAC) этот параметр рассчитывается при кодировании и может меняться от сэмпла к сэмплу.
Битрейт
Битрейт — это показатель количества информации, которым кодируется одна секунда звучания. Чем он выше, тем меньше искажений и тем ближе закодированная композиция к оригиналу. Для линейного PCM битрейт рассчитывается очень просто.
битрейт = частота дискретизации × разрядность × каналы
Для таких систем как Epiphan Pearl Mini, которые кодируют линейный PCM 16-бит (разрядность 16), этот расчет может быть использован для определения, сколько дополнительных полос пропускания может потребоваться для PCM аудио. Например, для стерео (два канала) оцифровка сигнала производится с частотой 44,1 кГц на 16-бит, а битрейт при этом рассчитывается таким образом:
44,1 кГц × 16 бит × 2 = 1 411,2 кбит/с
Между тем алгоритмы сжатия аудиосигнала, такие как AAC и MP3, имеют меньшее количество бит для передачи сигнала (в этом и заключается их цель), поэтому они используют небольшие битрейты. Обычно значения находятся в диапазоне от 96 кбит/с до 320 кбит/с. Для этих кодеков чем выше битрейт вы выбираете, тем больше аудио бит вы получаете на сэмпл, и тем выше будет качество звучания.
Частота дискретизации, разрядность и битрейты в реальной жизни.
Аудио CD-диски, одни из первых наиболее популярных изобретений для простых пользователей для хранения цифрового аудио, использовали частоту 44,1 кГц (20 Гц – 20 кГц, диапазон человеческого уха) и разрядность 16-бит. Данные значения были выбраны, чтобы при хорошем качестве звука иметь возможность сохранять как можно больше аудио на диске.
Когда к аудио добавилось видео и появились DVD, а позднее Blu-Ray диски, был создан новый стандарт. Записи для DVD и Blu-Rays обычно используют линейный формат PCM с частотой 48 кГц (стерео) или 96 кГц (звук 5.1 Surround) и разрядность 24. Эти значения были выбраны в качестве идеального варианта, чтобы сохранять аудио с синхронизацией с видео и при этом получать максимально возможное качество с использованием дополнительного доступного дискового пространства.
Наши рекомендации
CD, DVD и Blu-Ray диски преследовали одну цель – дать потребителю высококачественный механизм воспроизведения. Задачей всех разработок было предоставить высокое качество аудио и видео, не заботясь о величине файла (лишь бы он умещался на диск). Такое качество мог обеспечить линейный PCM.
Напротив, у мобильных средств информации и потокового медиа совсем другая цель – использовать максимально низкий битрейт, при этом достаточный для поддержания приемлемого для слушателя качества. Для этой задачи лучше всего подходят алгоритмы сжатия. Теми же принципами вы можете руководствоваться для своих записей.

При записи аудио с видео…
В случае если запись будет использоваться для последующей обработки , выбирайте кодек PCM с частотой 48 кГц и максимальной разрядностью (16 или 24), чтобы обеспечить наилучшее качество аудио. Мы рекомендуем данные параметры для Epiphan Pearl Mini.
При потоковой передаче аудио с видео…
При потоковой передаче или записи для последующей трансляции можно получить хорошее звучание аудио при меньшей полосе пропускания, используя кодеки AAC или MP3 с частотой 44,1 кГц и битрейт 128 кбит/с или выше. Такие параметры гарантируют, что звук будет достаточно хорош и не скажется на качестве трансляции.
Последние статьи
Подпишитесь на нашу рассылку, чтобы узнавать о новых статьях:
- H.264/AVC или H.265/HEVC: Краткий гид по сжатию видео
- SRT или NDI для удалённого видеопроизводства
- Новинки Pearl: Новый MultiViewer и улучшения в CMS
- NDI и NDI|HX для сетевого производства видео
- Поддержка NDI для «комнат» в Zoom и производство видео в реальном времени
- Pearl Nano: улучшенное качество записи и трансляций
- Почему виртуальные мероприятия будут в выигрыше и после пандемии
- 5 причин, почему виртуальные мероприятия останутся с нами
- Дикий Запад удаленного видеопроизводства
- Выбор камеры для стримов в 2021 году
- Epiphan Cloud: простое управление несколькими устройствами
- Аудиооборудование для трансляций
- 7 непростых уроков о видеопроизводстве
- Видео 4K для онлайн трансляций
- Искусственный интеллект и транскрибирование в реальном времени
- HyFlex: новый формат в образовании
- Удалённый гость на стриме: что и как
- Где может пригодиться кадрирование?
- KVM2USB: 6 лет работы в космосе
- Как лучше выглядеть в Скайпе и Зуме: 5 простых советов
Акустическое кодирование с адаптивным преобразованием — Adaptive Transform Acoustic Coding
Акустическое кодирование с адаптивным преобразованием (ATRAC ) является семейством проприетарных алгоритмы сжатия звука, разработанные Sony. MiniDisc был первым коммерческим продуктом, включающим ATRAC в 1992 году. ATRAC позволил относительно небольшому диску, подобному MiniDisc, иметь такое же время работы, как и CD, при сохранении аудиоинформации с минимальной потерей воспринимаемого качества. Усовершенствования кодеков в форме ATRAC3, ATRAC3plus и ATRAC Advanced Lossless последовали в 1999, 2002 и 2006 годах соответственно.
Другие производители мини-дисков, такие как Sharp и Panasonic также реализовали собственные версии кодека ATRAC.
Sony почти отказалась от кодеков, связанных с ATRAC, в США и Европе, а также в своих SonicStage powered Connect Music Store (эквивалент Sony iTunes и iTunes Music Store ) 31 марта 2008 г. Однако он продолжается в Японии и других странах.
- 1 Общее качество битрейта
- 2 Производительность
- 3 ATRAC1
- 4 ATRAC3 (режимы LP2 и LP4)
- 5 ATRAC3plus
- 6 ATRAC Advanced Lossless
- 6.1 Сопоставимая технология
Общее качество битрейта
Исходный битрейт ATRAC 292 кбит / с, который использовался на исходных мини-дисках, был акустически приближен к качеству CD. Спустя годы ATRAC был улучшен и, как правило, считается лучше, чем более ранние версии с аналогичным битрейтом. Для сравнения: компакт-диски кодируются со скоростью 1411,2 кбит / с, а кодеры без потерь могут кодировать большинство компакт-дисков со скоростью ниже 1000 кбит / с со значительным снижением битрейта для упрощения кодирования контента, такого как голос.
Производительность
По словам инженеров ATRAC, алгоритмы ATRAC были разработаны в тесном сотрудничестве с инженерами-разработчиками интегральных схем LSI в компании Sony, чтобы создать материальный продукт, который мог бы кодировать на высоких скоростях и с минимальным энергопотреблением. Это контрастирует с другими кодеками, разработанными на компьютерах без учета ограничений портативного оборудования. Это отражено в конструкции кодеков ATRAC, которые, как правило, делают упор на обработку меньшего количества выборок за раз для экономии памяти за счет эффективности сжатия и дополнительных умножений. Эти компромиссы вполне логичны в системах DSP, где память часто дороже по сравнению с производительностью умножителя.
Sony Walkmans обеспечивает лучшее время автономной работы при воспроизведении ATRAC файлов по сравнению с файлами MP3. Однако, поскольку Sony продвигала совместимость ATRAC только в телефонах серии Sony Ericsson Walkman на японском рынке, она не поддерживается в телефонах рынка GSM / UMTS. Автомобильные аудиопроигрыватели компакт-дисков Sony поддерживают диски ATRAC CD. Минидиски с песнями в формате ATRAC в прошлом поддерживались автомобильными стереосистемами Eclipse.
ATRAC1
ATRAC1 был впервые использован в системе Sony в собственном кинотеатре SDDS в 1990-х годах и в этом контексте является прямым конкурентом Dolby Digital (AC3) и DTS. SDDS использует ATRAC1 с 8-канальным кодированием и с общей скоростью кодирования по всем каналам 1168 кбит / с.
Два наложенных друг на друга квадратурных зеркальных фильтра разделяют сигнал на 3 части:
- от 0 до 5,5125 кГц
- от 5,5125 до 11,025 кГц
- от 11,025 до 22,05 кГц
Полное стерео (т. Е. Независимый канал) кодирование со скоростью передачи данных 292 кбит / с.
High- частота lowpass зависит от сложности материала; в некоторых кодировках есть содержимое до 22,05 кГц.
ATRAC1 также можно использовать в моно (один канал) режиме, удваивая время записи.
FFmpeg имеет реализацию декодера ATRAC1.
ATRAC3 (режимы LP2 и LP4)
Подобно ATRAC1 и MP3, ATRAC3 также является гибридным кодировщиком поддиапазона — MDCT, но с некоторыми отличиями.
В ATRAC3 три объединенных QMF разбивают сигнал на 4 части:
- от 0 до 2,75625 кГц (от 0 до f / 16)
- от 2,75625 до 5,5125 кГц (от f / 16 до f / 8)
- от 5,5125 до 11,025 кГц (от f / 8 до f / 4)
- от 11,025 до 22,05 кГц (от f / 4 до f / 2)
Четыре поддиапазона затем кодируются MDCT с использованием преобразования фиксированной длины. В отличие от почти всех современных форматов, длина преобразования не может быть изменена для оптимизации переходных процессов кодирования. Вместо этого используется более простой метод кодирования переходных процессов, в котором усиление различных поддиапазонов изменяется во время переходного процесса до MDCT и затем восстанавливается во время декодирования после обратного MDCT, чтобы попытаться сгладить переходные процессы. Кроме того, перед квантованием тональные компоненты вычитаются из сигнала и независимо квантуются. Во время декодирования они отдельно реконструируются и добавляются обратно для преобразования исходных коэффициентов MDCT.
Sony утверждает, что основным преимуществом ATRAC3 является эффективность кодирования, которая была настроена для портативного DSP, обеспечивающего меньшую вычислительную мощность и время автономной работы. Однако, поскольку ATRAC является гибридным кодеком поддиапазона — MDCT, который алгоритмически очень похож на MP3, любое преимущество, вероятно, преувеличено. Кроме того, по сравнению с более новыми форматами, такими как Windows Media Audio, в которых используется простое MDCT, а не гибридное, ATRAC3 должен выполнять дополнительный и дорогостоящий в вычислительном отношении обратный — QMF, хотя гибридная система это делает. значительно уменьшить использование памяти, что, вероятно, было фактором, учитывая ограниченность памяти, доступную при первоначальной разработке ATRAC.
Используется скорость передачи данных 132 кбит / с, качество которой, как объявляется, аналогично качеству MP3, закодированного с аналогичной скоростью передачи данных. Однако в независимом двойном слепом тесте (2004/05) без параметров кодирования формата ссылка на Ogg Vorbis, AAC и LAME VBR MP3, ATRAC3 пришел последним. К сожалению, из-за отсутствия прозрачности в управлении версиями кодировщика ATRAC неизвестно, был ли протестированный кодер ATRAC3 оптимальным, и последующее расследование было безрезультатным. Возможно, более новые кодировщики ATRAC3 предлагают лучшую производительность.
Это снижает скорость передачи данных до 66 кбит / с (вдвое меньше, чем у LP2), частично за счет использования совместного стереокодирования и фильтра нижних частот около 13,5 кГц. Он позволяет записать 324 минуты на 80-минутный мини-диск с тем же заполнением, что и LP2.
FFmpeg имеет реализацию декодера ATRAC3, который был преобразован в фиксированную точность и реализован в серии прошивок Rockbox для ARM, Процессоры Coldfire и MIPS. представляет собой высокоскоростную реализацию ATRAC3 (до 352,8 кбит / с).
Видеоигра PlayStation 3 Race Driver: Grid использует 224 одновременных потока сжатого звука ATRAC3, от одного до восьми каналов на поток с частотой дискретизации от 24 до 48 кГц, каждая фильтруется с использованием 512 частотных полос адаптивной эквализации, маршрутизируемых через шесть блоков реверберации, работающих на одном сопроцессоре SPU (один из восьми на чипе Cell PS3), наряду с 7.1-канальным гибридным третьим порядком Ambisonic микширование.
ATRAC3plus

ATRAC3plus CD, воспроизводимый на автомобильной стереосистеме Sony.
Этот кодек используется в Sony Hi-MD Walkman устройства (например, «Hi-LP и Hi-SP»), сетевые плееры Walkman, плееры Memory Stick, VAIO Pocket, Консоль PS3 и PSP и проигрыватели компакт-дисков ATRAC . Это гибридный кодек поддиапазона / MDCT на основе 16-канального QMF, за которым следует 128-точечный MDCT. До кодирования MDCT для извлечения тональных компонентов использовался обобщенный гармонический анализ (GHA), улучшенная версия процесса, используемого в ATRAC3. Как и в предыдущих версиях ATRAC, управление усилением используется для управления предварительным сигналом, а не преобразованиями переменного размера, хотя, очевидно, возможны различные окна MDCT.
SonicStage версии 3.4, выпущенный в феврале 2006 года, представил копирование компакт-дисков с битрейтами 320 и 352. Доступные битрейты: 48, 64, 96, 128, 160, 192, 256, 320 и 352 кбит / с. Новые битрейты не всегда совместимы со всеми старыми аппаратными декодерами, однако было обнаружено, что некоторое старое оборудование совместимо с некоторыми новыми битрейтами ATRAC3plus.
Мини-диски, записанные в этом формате, несовместимы со старыми плеерами.
В ходе тестирования, проведенного независимой фирмой, но финансируемого Sony, был сделан вывод, что ATRAC3plus на скорости 64 кбит / с по субъективному качеству звука равен устаревшему кодировщику MP3 на скорости 128 кбит / с. Производительность по сравнению с современными высококачественными кодировщиками MP3 не оценивалась.
ATRAC Advanced Lossless
ATRAC Advanced Lossless — это «масштабируемый» аудиокодек без потерь, который записывает поток ATRAC3 или ATRAC3plus с потерями и дополняет его потоком корректирующей информации, хранящейся в самом файле, который позволяет при желании воспроизвести исходный сигнал. Проигрыватель / декодер может извлекать и использовать только данные ATRAC3 или ATRAC3plus, или он может комбинировать их с потоком коррекции для идеального воспроизведения исходной аудиоинформации. Это позволяет декодировать файл как без потерь, так и с потерями. Он реализован таким образом, чтобы размер файла был меньше, чем у несжатых или сжатых версий того же файла. Сжатие составляет примерно 30–80% от исходного файла. Преимущества масштабируемого сжатия включают обеспечение обратной совместимости, так что старые устройства, которые не поддерживают AAL, могут по-прежнему иметь поток ATRAC3, доступный для воспроизведения без понимания формата AAL, и более высокую скорость передачи между портативными аудиоустройствами и ПК.
ATRAC Advanced Lossless широко поддерживается в старых плеерах Walkman и SonicStage версии 4 или новее. SonicStage 4 позволяет загружать ATRAC Advanced Lossless на проигрыватели мини-дисков, PlayStation Portable и PlayStation 3. Последние плееры Walkman не поддерживают ATRAC Advanced Lossless / ATRAC.
Сопоставимая технология
Использование AAL «основного» (с потерями) и «остаточного» (корректирующего) потоков аналогично идее, лежащей в основе Opus, MPEG -4 SLS, DTS-HD Master Audio, Dolby TrueHD и Ogg Vorbis отслаивание битрейта. Фактически, AAL был первым, выпущенным на коммерческий рынок с этой схемой для обратной совместимости.
Гибридный режим WavPack и OptimFROG DualStream находятся в одной категории, но сохраняют поток коррекции в отдельном файле.
ATRAC9
Согласно Sony ATRAC9 — это аудиокодек с высокой степенью сжатия, оптимизированный для игр, предлагающий низкую задержку (детализацию) и низкое использование ЦП и памяти. Используется в консолях PS4 и PS Vita. Промежуточное программное обеспечение аудио, такое как FMOD и Audiokinetic Wwise, поддерживает его.
См. Также
Ссылки
Внешние ссылки
- ATRACLife.com — этот домен теперь припаркован, содержание форума доступно только из кэша Google.
Новостной портал, дискуссионные форумы и загрузки, связанные с ATRAC.
- Sony.net, страница технологии ATRAC.
Аналого-цифровые и цифро-аналоговые преобразователи в системах активного управления акустическими полями Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»
Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Семенцов Станислав Григорьевич
Проанализирована применимость преобразователей различного типа в системах активного управления акустическими полями. Рассмотрены особенности реализации и параметры параллельных и сигма-дельта преобразователей. Проанализированы особенности обоих типов преобразователей и их влияние на качественные характеристики систем активного гашения акустического шума. Показано, что, несмотря на невысокие технические характеристики, параллельные преобразователи имеют ряд преимуществ при работе в составе реальных систем активного гашения акустического шума.
i Надоели баннеры? Вы всегда можете отключить рекламу.
Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Семенцов Станислав Григорьевич
Как работают аналогово-цифровые преобразователи и что можно узнать из спецификации на ацп
Анализ состояния и тенденций производства интегральных преобразователей информации s∆-архитектуры
Выбор способа реализации аналого-цифрового преобразования для систем с однобитной технологией
Сигма-дельта ЦАП
Сигма-дельта аналого — цифровые преобразователи ацп Texas Instruments
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.Analog-Digital and Digital-to-Analog Conver ters in Systems of Active Control of Acoustic Fields
The applicability of various type converters in systems of active control of acoustic fields is analyzed. Implementation peculiarities and parameters of parallel and delta-sigma converters are considered. Features of both type converters and their influence on the qualitative characteristics of systems of active elimination of the acoustic noise are analyzed. It is shown that despite the fairly low technical characteristics the parallel converters have some advantages in operation being included in real systems of active elimination of the acoustic noise. Refs.5. Figs.15.
Текст научной работы на тему «Аналого-цифровые и цифро-аналоговые преобразователи в системах активного управления акустическими полями»
АНАЛОГО-ЦИФРОВЫЕ И ЦИФРОАНАЛОГОВЫЕ ПРЕОБРАЗОВАТЕЛИ В СИСТЕМАХ АКТИВНОГО УПРАВЛЕНИЯ АКУСТИЧЕСКИМИ ПОЛЯМИ
Проанализирована применимость преобразователей различного типа в системах активного управления акустическими полями. Рассмотрены особенности реализации и параметры параллельных и сигма-дельта преобразователей. Проанализированы особенности обоих типов преобразователей и их влияние на качественные характеристики систем активного гашения акустического шума. Показано, что, несмотря на невысокие технические характеристики, параллельные преобразователи имеют ряд преимуществ при работе в составе реальных систем активного гашения акустического шума.
Аналого-цифровые и цифроаналоговые преобразователи (АЦП/ЦАП) используются в системах активного гашения (САГ) шума и вибраций для ввода и вывода сигналов на элементы приемно-измерительного блока. Системы активного гашения шума являются системами управления в реальном времени и все шире используются для защиты человека и технических систем от интенсивных акустических и вибрационных воздействий (активные системы снижения шума на транспорте, в системах вентиляции, активные системы виброзащиты для высокоточного оборудования и т.д.). Принцип функционирования таких систем состоит в непрерывной регистрации и анализе входного шумового сигнала и выработке управляющего воздействия, противофазного исходному. Эффективность работы САГ во многом зависит от качественных характеристик регистрации сигнала и формирования управляющих воздействий, поэтому выбору и моделированию АЦП/ЦАП при синтезе САГ придается важное значение. Для лучшего понимания принципов работы преобразователей, их влияния на характер работы САГ в реальном времени и реально достижимое качество гашения (достигнутое снижение уровня звукового давления или вибрации в заданной точке) рассмотрим принципы работы САГ как на уровне модельной проработки, так и на уровне элементной реализации.
Несмотря на то, что частоты сигналов управления САГ достаточно низки (в большинстве случаев 20.. .1000Гц), тем не менее, для сохранения достаточной точности при операциях аналого-цифрового и цифроаналогового преобразования требуется обработка данных с частотой дискретизации не менее 8.. .12кГц и числом разрядов не менее 14.. .16 [1]. Выбор разрядности и тактовой частоты обусловлен тем
фактом, что при указанных параметрах АЦП/ЦАП обеспечивается реальное отношение сигнал/шум порядка 60.. .75 дБ в полосе до 1 кГц. При учете роста шумов квантования с понижением уровня сигнала достаточная точность преобразования сохраняется при уровне входного сигнала приблизительно до -50дБ. Однако даже современные параллельные АЦП имеют разрядность 12.. .14 бит.
Здесь необходимо учитывать, что САГ, как правило, работают лишь в узком участке динамического диапазона — в верхней его части и собственный динамический диапазон системы не превышает 40 дБ. Современные аналоговые узлы системы имеют более широкий динамический диапазон, и для подавления шумов преобразования, неизбежно возникающих при более низких уровнях внешнего сигнала, необходимо применение специальных мер (например, режима «gate» в предварительных каскадах усиления).
При выборе преобразователей для САГ можно руководствоваться соответствующими оценками метрологических характеристик, которые регламентируются ГОСТ 24736-81, ОСТ 1100783-84 и др. Сюда входят: число разрядов, время преобразования, нелинейность и дифференциальная нелинейность, амплитудно-частотная характеристика. Однако при работе в составе САГ к преобразователям предъявляется ряд дополнительных требований, определяющих такие параметры САГ, как максимальное качество гашения в заданной полосе частот, уровень вносимых шумов за пределами полосы подавления, динамический и частотный диапазоны устойчивости системы. Эти требования обусловлены работой САГ в реальном режиме времени, влиянием шумов квантования преобразователей на работу адаптивных алгоритмов и реакцией системы на импульсные и случайные сигналы.
К числу этих дополнительных параметров можно отнести:
время преобразования ¿пр — интервал времени от начала преобразования АЦП/ЦАП до появления на выходе кода или тока (напряжения), соответствующего входному воздействию. Определяется типом преобразователя и наличием/отсутствием схемы выборки/хранения;
число эффективных разрядов N^ учитывает все виды погрешностей преобразования. Любые ошибки преобразователя, обусловленные дифференциальной и интегральной нелинейностями, пропуском кодов выступают как составляющие некоторой суммарной среднеква-дратической погрешности. На этот параметр определяющее влияние оказывают тип используемого преобразователя и внешние элементы обвязки;
переходную характеристику g(t), определяющую реакцию преобразователя на скачок напряжения единичной амплитуды. Зависит
от типа преобразователя и параметров применяемых аналоговых и цифровых низкочастотных (НЧ) фильтров.
В настоящее время в составе блока преобразователей САГ чаще всего применяются следующие типы АЦП:
— параллельные АЦП, в которых входной сигнал одновременно сравнивается с эталонными уровнями линейки компараторов, формирующих на выходе двоичный код. В таком АЦП число компараторов равно 2м — 1, где N — разрядность цифрового кода. Недостатком АЦП данного типа является необходимость увеличения в 2 раза числа компараторов для каждого следующего разряда точности. Для 4-разрядного АЦП необходимо 16 компараторов, для 12-разрядного —
— sigma-delta АЦП как вариант АЦП, работающего на частоте Fs, значительно (в 64 раза и более) превышающей частоту дискретизации Fd выходного цифрового сигнала. Компаратор такого АЦП выдает значения пониженной разрядности (обычно однобитовые), сумма которых в интервале дискретизации Fd пропорциональна величине отсчета. Последовательность однобитовых значений подвергается цифровой фильтрации и понижению частоты квантования (децимация), в результате чего получается серия отсчетов с заданной разрядностью и частотой дискретизации Fd.
Современные ЦАП в основном строятся по трем схемам:
— взвешивающие ЦАП с суммированием взвешенных токов или напряжений, когда каждый разряд входного слова вносит соответствующий своему двоичному весу вклад в получаемый аналоговый сигнал; такие ЦАП называют также параллельными или многоразрядными (multibit) (рис. 1);
— sigma-delta ЦАП с предварительной интерполяцией и выдачей малоразрядных (обычно однобитовых) значений на схему формирования эталонного заряда, которые со столь же высокой частотой добавляются к выходному сигналу. Такие ЦАП также называются bitstream.
Рис. 1. Структура параллельного ЦАП с резистивной матрицей R-2R
— ЦАП с широтно-импульсной модуляцией (ШИМ). На схему выборки/хранения аналогового сигнала выдаются импульсы постоянной амплитуды и переменной длительности. На этом принципе основана работа преобразователей MASH (Multi-stаge Noise Shaping — многокаскадное формирование шума) фирмы Matsushita. Свое название эти ЦАП получили из-за применения в них нескольких последовательных каскадов формирования шума.
Основой работы сигма-дельта преобразователей является использование выборки с запасом по частоте. Интерполяция может быть аналоговой, когда с повышенной частотой делаются выборки исходного сигнала, или цифровой, когда между уже существующими цифровыми отсчетами вставляются дополнительные, рассчитанные путем интерполяции. Другой способ получения значений промежуточных отсчетов состоит во вставке нулей, после чего вся последовательность подвергается цифровой фильтрации, за счет чего достигается сглаживание формы сигнала без улучшения разрешения по частоте. Изначально интерполяция использовалась для снижения требований к аналоговому входному/выходному фильтру. При повышении частоты дискретизации зеркальные частоты пропорционально отодвигаются от основного сигнала, и аналоговый фильтр может иметь гораздо меньшую крутизну среза. Другое преимущество интерполяции состоит в том, что ошибки амплитудного квантования (шум квантования), распределенные по всему спектру квантуемого сигнала, при повышении частоты дискретизации распределяются по более широкой полосе частот, так что на долю основной полосы приходится меньшее количество шума. Собственная мощность шума квантования определяется по формуле [2]
где А — шаг квантования. При относительно больших амплитудах входного сигнала энергия шума квантования равномерно распределяется по всему спектру от 0 до Fs/2. В этом случае спектральная плотность мощности шума квантования Pc(f ) задается как
где ^ — частота квантования (рис. 2).
Таким образом, эффективное отношение сигнал/шум преобразователя можно увеличить, повышая частоту дискретизации и используя методы формирования шума, что позволяет распределить энергию шума по более широкой полосе частот и снизить уровень шума в полосе 0 . ^/2. Каждое удвоение частоты дискретизации снижает уровень шума квантования на 3 дБ; поскольку один двоичный разряд
Рис. 2. Снижение шумов квантования с помощью интерполяции
эквивалентен 6 дБ шума, то каждое учетверение частоты позволяет уменьшить разрядность преобразователя на единицу. Интерполяция вместе с увеличением разрядности отсчета, интерполяцией отсчетов с повышенной точностью и выводом их на ЦАП надлежащей разрядности позволяет несколько повысить отношение сигнал/шум. По этой причине даже в 16-разрядных системах нередко применяются 18- и 20-разрядные ЦАП совместно с цифровыми фильтрами, осуществляющими интерполяцию. Однако при работе со случайными и псевдослучайными сигналами сигма-дельта преобразователи заметно уступают параллельным, поскольку несут заложенный в самом принципе преобразования недостаток — изменение статистических параметров сигнала на этапе преобразования, что, в принципе, несущественно при работе с детерминированными сигналами, но нежелательно при работе со случайными сигналами, которыми по своей сути являются сигналы управления в САГ.
При повышении тактовой частоты в десятки раз (обычно от 64 до 512) становится возможным уменьшить разрядность ЦАП без ощутимой потери качества сигнала; ЦАП с меньшим числом разрядов имеет также лучшую линейность на детерминированных сигналах [3]. В пределе число разрядов может быть сведено к одному. Форма выходного сигнала таких ЦАП представляет собой полезный сигнал, обрамленный значительным высокочастотным шумом, который подавляется аналоговым фильтром. В отличие от простого широкополосного шума, вносимого ошибками квантования, шум квантования представляет собой гармонические искажения сигнала, наиболее заметные в верхней части спектра. Искажения, вносимые шумом квантования, можно уменьшить, добавляя к сигналу обычный белый шум (случайного или псевдослучайного сигнала) с амплитудой в половину младшего значащего разряда; такая операция называется дизеринг (dithering) (рис. 3, а, б). Это приводит к незначительному увеличению уровня шума, зато ослабляет корреляцию ошибок квантования с высокочастотными компонентами сигнала. Дизеринг применяется также перед округлением отсчетов при уменьшении их разрядности (например, при цифровой фильтрации).
Рис. 3. Уменьшение искажений, вносимых шумом квантования (а), за счет использования дизеринга (б)
Для улучшения отношения сигнал/шум и снижения влияния ошибок квантования, которое в случае 1-разрядного преобразователя получается довольно высоким, также применяется метод формирования шума через схемы обратной связи по ошибке и цифровой фильтрации. В результате применения этого метода основная энергия шума вытесняется в область, выше половины частоты Fs, и практически весь шум удаляется из полосы исходного аналогового сигнала.
По существу дизеринг и формирование шума являются частными случаями одной технологии с той разницей, что в первом случае используется белый шум с равномерным спектром, а во втором — шум со специально сформированным спектром.
Для оценки степени применимости двух наиболее распространенных сегодня типов преобразователей (параллельных и сигма-дельта) в САГ рассмотрим их параметры, учитывая предъявляемые требования. Сравнение параметров целесообразно проводить как с использованием результатов экспериментальных исследований, так и с помощью математических моделей в среде MATLAB [4].
Смоделируем простейший параллельный АЦП (рис. 4).
Функционально модель включает в себя блок предварительного усиления (Gain), блок выборки/хранения (Zero-Order Hold) и блок квантования по уровню (Quantizer). Блок предварительного усиления необходим для приведения уровня входных сигналов к максимальному для блока квантования (до ограничения) размаху ±1. В свойствах блоков выборки/хранения и квантования по уровню можно задать частоту дискретизации. В данной версии MATLAB разработанная структура имеет число эффективных разрядов, эквивалентное 16 битам.
Рис. 4. Модель параллельного АЦП в среде MATLAB
Параметры схемы выборки/хранения во многом определяют задержку т, вносимую АЦП/ЦАП при преобразовании. Для параллельных ЦАП при сравнении его выхода y (t) и входа y (rt) становится очевидным, что для каждого цифрового кода его выход задерживается на т (один такт), т.е. т = 1/Fd, — ЦАП имеет задержку нулевого порядка.
В частотных координатах задержка преобразования вносит частотные искажения по закону sin x/x, где x = шт/2, или апертурные искажения. Среднюю ошибку, вносимую этим видом искажений, при заданной частоте можно оценить в процентном отношении следующим образом:
(1 — sin x/x) х 100%.
Для задержки нулевого порядка функция sin x/x спадает приблизительно на 4 дБ на частоте Fs/2, что дает среднюю ошибку приблизительно в 36%. Апертурную ошибку можно скомпенсировать с помощью внешней частотной коррекции.
Модель сигма-дельта АЦП с 64-кратной интерполяцией (рис. 5) функционально состоит из следующих блоков:
• компаратора (1-разрядного АЦП) (1-bit quantizer);
• блока выборки/хранения (Zero-Order Hold);
• блоков децимации (Decimation), осуществляющих поблочное последовательное 4-кратное прореживание входного сигнала и включающих в себя НЧ КИХ-фильтр.
Как было указано ранее, одними из важнейших параметров преобразователей, влияющим на эффективность работы всей САГ в целом, являются вносимые ими задержки сигнала.
Все возникающие на этапе обработки сигнала задержки можно разделить на три группы (рис. 6):
• задержки блока обработки (ro);
• задержки объекта управления (ту);
• задержки АЦП и ЦАП (тпр).
Очевидно, что задержка Sp мало зависит от применяемых типов компенсаторов и датчиков, т.е. Sp можно считать константой. Задерж-
Рис. 5. Модель сигма-дельта АЦП в среде MATLAB
Рис. 6. Распределение задержек сигнала в обобщенной модели САГ
ки сигнала, вносимые блоком управления, определяются производительностью используемых средств цифровой обработки и вычислительными требованиями алгоритмов. Если производительность аппаратных вычислительных средств напрямую зависит от достигнутого при их производстве технологического уровня, то выбор тех или иных алгоритмов является многокритериальной задачей и требует проведения всестороннего анализа. Используя упрощенные алгоритмы, можно уменьшить задержки, но увеличить время сходимости или снизить качество гашения.
С помощью созданных в среде МА^АВ моделей оценим вносимые обоими типами преобразователей задержки. Для этого подадим на их входы последовательность прямоугольных импульсов с частотой следования 700 Гц. Результат преобразования можно контролировать на экране виртуального осциллографа (рис. 7, 8).
Результаты моделирования показывают, что преобразователи параллельного типа имеют существенно меньшее время преобразования по сравнению с сигма-дельта преобразователями. Если для параллельных преобразователей время преобразования не превышает одного отсчета, то для сигма-дельта преобразователя оно составляет около 100 мкс. Это подтверждается и экспериментально — для сигма-дельта АЦП при тактовой частоте 32 кГц задержка составляет около 4 отсчетов, т.е. 125 мкс. Это значение определяется помимо тактовой частоты одноразрядного преобразователя, также и порядком НЧ-фильтра в блоке децимации.
Что касается числа эффективных разрядов, определяемого экспериментально из соотношения сигнал/шум преобразователя, то здесь, если не принимать во внимание элементы обвязки, на первый план выходят три составляющие (рис. 9): шумы квантования, интермодуляция и джиттер.
Analog Input f N
Signal Analog Generator Butterworth LP Filter
Integrator 1-bit Zero-Order quantizer Hold
FIR X 4(a) Decimation
Zero-Order Quantizer Holdl
Рис. 7. Модель для исследования задержки преобразования АЦП
Рис. 8. Результаты оцифровки тестового сигнала преобразователями различного типа
Рассмотрим специфику каждой составляющей применительно к параллельным и сигма-дельта преобразователям.
Шум квантования определяет теоретический предел точности преобразования и зависит от числа разрядов, т.е. от размера шага разрядной сетки преобразователя. Интермодуляционные искажения обусловлены взаимодействием полезного сигнала с зеркальными частотами, кратными ^, и приводят к появлению в спектре оцифрованного сигнала большого числа комбинационных частот. Проведем оценку шума квантования и интермодуляционных искажений с помощью разработанных в МА^АВ моделей (рис. 10).
В данном случае реализована модель сигма-дельта преобразователя с тактовой частотой 2,048 МГц и 512-кратной децимацией. Результаты моделирования при наличии только узкополосного синусои-
Рис. 9. Состав шумов преобразования
Рис. 10. Модель для оценки уровня шумов квантования и интермодуляционных искажений
дального сигнала 20 Гц с относительным уровнем —6 дБ показаны на рис. 11, а, б.
Спектр параллельного АЦП без интерполяции близок к белому шуму с максимальным относительным уровнем —95 дБ, близким к теоретическому пределу. В спектре же сигма-дельта АЦП, несмотря
Рис. 11. Спектр шумов квантования и интермодуляционных искажений параллельного (а, в) и сигма-дельта (б, г) АЦП при наличии узкополосного (а, б) и широкополосного псевдослучайного (в, г) сигналов
на высокий порядок НЧ КИХ-фильтра в блоке децимации (200), заметен ряд комбинационных частот с плотным спектром и относительным уровнем -76 дБ. Несколько другая картина наблюдается при подмешивании к синусоиде 20 Гц псевдослучайного сигнала с полосой 0 . Fs/2 и амплитудой -50 дБ (рис. 11, в, г).
В данном случае спектр шума обоих реализаций не имеет ярко выраженных составляющих, однако если для параллельного АЦП относительный уровень не превышает -53 дБ при выраженной зависимости sin x/x, то для сигма-дельта АЦП он равен -47 дБ. Таким образом, очевидно, что если при наличии случайной составляющей в полезном сигнале отношение сигнал/шум для параллельных и сигма-дельта преобразователей различается на 6 дБ, то на детерминированных сигналах разница превышает 12 дБ, что эквивалентно уменьшению числа эффективных разрядов более чем на 2. Таким образом, на низкоуровневых сигналах для сигма-дельта преобразователей с эквивалентным числом разрядов 16 число эффективных разрядов не превышает 14.
Случайный сигнал при восстановлении из цифровой последовательности дельта-сигма демодулятором меняет статистические характеристики и обогащается модуляционным шумом, который коррелирован с самими сигналом. Преобразователи параллельной структуры лишены указанных недостатков по принципу своей работы, но имеют очень существенный с точки зрения фирм-производителей недостаток — большую себестоимость ввиду сложности изготовления и настройки кристалла. Поэтому такие микросхемы вытесняются из производственных программ даже крупных фирм.
Рассмотрим далее влияние джиттера на точность преобразования. Эта проблема не раз поднималась в литературе, но, как правило, применительно к высокочастотным системам, где значения джиттера сравнимы с временем преобразования, например в телекоммуникации. В НЧ прецизионных преобразователях этот параметр зачастую не рассматривается как влияющий на точность преобразования, однако, как будет показано далее, это совсем не так.
При временной и амплитудной дискретизациях энергия сигнала передается импульсами с периодом следования для формата CD-DA 22,67 мкс. При этом, если считать период следования импульсов постоянным, вносится ошибка квантования, равная половине младшего значащего разряда. Предельное значение джиттера, приводящее к ошибке в 1 младший значащий разряд, вычисляется как пиковое значение временной нестабильности (джиттера) момента преобразования
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
где n0 — разрядность данных; /max — максимальная частота в спектре преобразованного сигнала. Нетрудно подсчитать, что при непосредственном использовании данных стандарта CD-DA (16 разрядов и полоса до 22,05 кГц) для сохранения младшего разряда допустим джиттер до 173 пс (рис. 12, а).
Это значение джиттера вполне достижимо в преобразователях без использования интерполяции. Например, джиттер системы, состоящей из цифрового приемника
Рис. 12. Временные параметры работы 16-битового ЦАП без интерполяции (а) и 20-битового ЦАП с 8-кратной интерполяцией (б)
DIR1703 Texas Instruments и параллельного ЦАП AD1866 Analog Devices не превышает 100 пс. При введении цифровой фильтрации с повышением разрядности до 20 бит и 8-кратной интерполяцией значение допустимого джиттера сокращается до 1,35 пс (рис.12, б), что реально недостижимо в современных условиях, поскольку каждый из элементов цепочки приемник-цифровой фильтр-ЦАП имеет собственный джиттер, как минимум на порядок больший. К тому же необходимо учесть округление результатов интерполяции в цифровом фильтре. Даже при использовании специализированных ИМС для цифровой фильтрации, например SM5847 с внутренней разрядностью 32 бита, на выходе происходит округление результатов до 20 бит. В однокристальных системах с интегрированным цифровым фильтром внутренняя разрядность, как правило, не превышает 20 бит. Таким образом, очевидно, что использование интерполяции при наличии джиттера приводит к значительному снижению разрешения преобразователя в области малых сигналов.
В заключение рассмотрим импульсную характеристику параллельных и сигма-дельта преобразователей. Поскольку в реальных САГ сигналы управления носят, как правило, случайный характер, то отклик на импульсные сигналы во многом определяет параметры системы в части устойчивости и эффективности. В параллельных преобразователях заметен дискретный характер преобразования при выводе синусоидальных сигналов (рис. 13), однако при наличии сглаживающего НЧ-фильтра и при работе в частотном диапазоне ниже Fs /20 (типичный рабочий диапазон САГ) этот фактор можно не учитывать.
Рис. 13. Осциллограмма синусоиды 1 кГц на выходе параллельного ЦАП без интерполяции и аналоговой фильтрации
Рис. 14. Реакция преобразователей различного типа на импульсный сигнал
Для оценки импульсной характеристики преобразователей воспользуемся моделью, изображенной на рис. 10. В данном случае частота дискретизации составляет 8 кГц, частота следования импульсов 700 Гц (рис. 14, а).
Как можно заметить, параллельный преобразователь не искажает форму сигнала (рис. 14, б). На выходе сигма-дельта преобразователя наблюдаются значительные выбросы как по переднему, так и по заднему фронтам, достигающие 5 % амплитуды импульсов (рис. 14, в). В данном случае результаты моделирования явно коррелируют с экспериментальными данными. На рис. 15 показаны осциллограммы вывода последовательности импульсов параллельным ЦАП без интерполяции и сигма-дельта ЦАП с 8-кратной интерполяцией.
На основе анализа полученных результатов можно сделать следующие выводы:
— параллельные преобразователи имеют переходную характеристику, близкую к идеальной, время установления не превышает 1. 2 отсчета; переходная характеристика сигма-дельта преобразователей
Рис. 15. Осциллограммы последовательности импульсов на выходе параллельного ЦАП без интерполяции (а) и сигма-дельта ЦАП с 8-кратной интерполяцией (б)
имеет сложный вид, зависящий от целого ряда факторов (порядка формирователей шума, коэффициента интерполяции и т.д.), и в общем случае содержит пре- и постэхо;
— реальное отношение сигнал/шум у параллельных преобразователей в зависимости от характера сигнала на 5. 10 дБ больше, чем у сигма-дельта преобразователей, что соответствует увеличению числа эффективных разрядов Жэфф на 1. 2 разряда при равной эквивалентной разрядности;
— сигма-дельта преобразователи имеют время преобразования £пр, равное 3. 4 отсчетам; время преобразования параллельных АЦП/ЦАП составляет 1 отсчет.
Естественно, на фазовые и временные характеристики преобразователей значительное влияние оказывают параметры входного/выходного аналогового НЧ-фильтра. Для ЦАП без интерполяции от качества его исполнения, примененных компонентов и точности номиналов во многом зависит результирующее качество восстановления сигнала. Однако наиболее существенное влияние оказывает тип аппроксимации характеристики фильтра. В литературе этот вопрос рассмотрен весьма подробно [5], поэтому далее остановимся лишь на аспектах применимости тех или иных типов фильтров в составе блока преобразователей САГ.
Фазолинейные фильтры Бесселя обеспечивают требуемое затухание в полосе задержания лишь при высоком порядке (10. 14) фильтра. Определение минимально необходимого порядка фильтра является многокритериальной задачей. Применительно к задаче активного гашения фильтры высокого порядка неприемлемы из-за значительных фазовых искажений на краю частотного диапазона и сложных переходных процессов. К тому же они требуют очень точного подбора элемен-
тов с минимальными допусками. Таким образом, при использовании преобразователей с высокой Fs или преобразователей с интерполяцией наиболее целесообразно использование фазолинейных фильтров Бесселя 4. 7-го порядка, либо фильтров Баттерворта 3. 4-го порядка в преобразователях с низкой тактовой частотой.
При работе САГ в диапазоне, меньшем Fs/20, возможно применение преобразователей без восстанавливающего фильтра. В таком режиме наиболее полно проявляются преимущества параллельных преобразователей по времени преобразования и импульсной характеристике. Необходимо лишь проконтролировать устойчивость последующих усилительных каскадов к высокому уровню ультразвуковых помех.
1. ОлссонГ., ПианиД. Цифровые системы автоматизации и управления. -СПб.: Невский Диалект, 2001. — 557 с.
2. АйфичерЭ., ДжервисБ. Цифровая обработка сигналов: практический подход, 2-е издание / Пер. с англ. — М.: Издательский дом «Вильямс», 2004. -992 с.
3. K a h r s M., Brandenburg K. Application of Digital Signal Processing to Audio and Acoustics. Kluwer Academic Publishers, New York, 2002. — 571 p.
4. Дьяконов В. П. MATLAB 6.5 + Simulink 5/6. Основы применения. — М.: СОЛОН-Пресс, 2005. — 800 с.
5. ХоровицП., ХиллУ Искусство схемотехники / Пер. с англ. — М.: Мир, 1998. — 704 с.
Статья поступила в редакцию 26.02.2008
Станислав Григорьевич Семенцов родился в 1976 г., окончил Дагестанский государственный технический университет в 1998 г. Канд. техн. наук, доцент кафедры «Конструирование и технология производства электронной аппаратуры» МГТУ им. Н.Э. Баумана. Автор 18 научных работ в области систем управления акустическими полями, цифровой обработки сигналов, электроакустики.
S.G. Semencov (b. 1976) graduated from the Dagestan State Technical University in 1998. Ph. D. (Eng.), assoc. professor of «Construction and Manufacturing Technology of Electronic Apparatus» department of the Bauman Moscow State Technical University. Author of 18 publications in the field of systems of control of acoustic fields, digital signal processing, electroacoustics.
Начало пути — Часть 5. Терминология.
Предпоследняя часть из серии «Начало Пути». Под катом представлен словарь технических терминов, который мне удалось собрать, а также ссылка на музыкальные термины. К сожалению словарь не является полным, наверняка я что-то упустил, но для начала его более чем достаточно. Кстати, назвать этот пост статьей язык у меня не повернется, это именно словарь, который при желании можно распечатать (я сделал именно так).
Английский язык.
Аcoustical spectrum — см. акустический спектр.
Acoustincal wave — см. звуковая волна.
ADPCM — Adaptive Delta Pulse Code Modulation — адаптивная импульсно-кодовая модуляция. Способ цифрового кодирования сигнала при помощи записи приращения значений амплитуд.
Bitrate — количество бит, используемых для хранения одной секунды аудио в потоке данных. Термин чаще применяется в отношении закодированных аудио данных.
Channel — см. канал.
Chorus — от англ. «хор», эффект звучания, названный так потому, что в результате его применения звучание исходного сигнала превращается в звучание подобное хору, то есть «размножается». В общем случае эффект достигается путем наложения на сигнал нескольких его копий, сдвинутых во времени.
Codec — COder/DECoder — кодер/декодер. Программный или аппаратный блок, предназначенный для кодирования/декодирования данных.
Сontinuous spectrum — см. непрерывный спектр.
Сontinuous noise — см. непрерывный шум.
Compressor — см. компрессор.
Covox — небольшое устройство, подключаемое к параллельному порту компьютера и предназначенное для воспроизведения звука через усилитель или наушники.
Dithering — Искусственное подмешивание к звуковому сигналу псевдослучайного белого шума, результатом чего является рассеивание шума квантования по спектру сигнала.
Distortion — («искажение», англ.), эффект звучания, основанный на использовании амплитудной модуляции. Фактически это замена одних значений амплитуд сигнала другими значениями. За счет переусиления, когда происходит срезание верхушек входного сигнала, можно получить, например, классический вариант гитары heavy metal (то есть сигналу придается скрежетание или своеобразная «хрипота»). Применение такого эффекта приводит к довольно резкому искажению входного сигнала (в зависимости от глубины модуляции), в результате чего сигнал становится похож на прямоугольный, и как следствие происходит расширение спектра сигнала. Классический механизм получения эффекта состоит в следующем: входной сигнал смешивается с его копией, подвергнутой преобразованию в блоке амплитудной модуляции, который имеет два уровня сигнала: пороговый и верхний. Если амплитуда входящего в блок сигнала не превышает порогового уровня, то сигнал проходит на выход блока без изменений. Если же амплитуда сигнала выше порогового уровня, то блок усиливает такой сигнал до верхнего уровня.
DMA — Direct Memory Access. См. прямой доступ к памяти.
DSP — Digital Signal Processor. См. цифровой сигнальный процессор.
Duplex — cм. дуплекс.
Dynamic range — см. динамический диапазон.
Emulation — cм. эмуляция.
Emulator — cм. эмулятор.
Fader — см. фэйдер.
Flanger — см. флэнжер.
Frequency — см. частота.
GM — General MIDI. Основополагающий MIDI-стандарт, разработанный фирмой Roland.
GS — General Synth. MIDI-стандарт, разработанный фирмой Roland как продолжение GM.
HRTF — Head Related Transfer Function. Специальный алгоритм преобразования звукового сигнала, учитывающий особенности восприятия звука слуховым аппаратом человека. Используется в различных технологиях создания объемного звучания.
Interpolation — cм. интерполяция.
IRQ — сигнал от устройства (например, от клавиатуры или звуковой карты), указывающий на то, что устройство требует задействования центрального процессора. Сигналы IRQ передаются по IRQ-линиям, которые объединены в Программируемый Контроллер Прерываний (Programmable Interrupt Controller, PIC)
Jitter — шум, возникающий при оцифровке звукового аналогового (проигрывании цифрового) сигнала как следствие нестабильности (неточности) времени выборки отсчетов АЦП (ЦАП).
MIDI — Musical Instrument Digital Interface. Спецификация, включающая стандарт на программную и аппаратную части; предназначенный для организации локальной сети электронных инструментов.
MIDI Thru — ретрансляционный выход MIDI-устройства (служит для ретрансляции поступивших MIDI-команд другим устройтсвам).
MIDI-данные — последовательность MIDI-сообщений или событий.
MIDI-контроллер — устройство, предназначенное для генерирования MIDI-сообщений и не содержащее средств синтеза звука.
MIDI-оператор — генератор сигнала в совокупности с управляющей схемой.
MIDI-стандарт — для всех устройств, выполненных в соответствии с этим стандартом, устанавливает соответствие номеров инструментов и самих инструментов (тембров), а также требования к голосам, каналам, контроллерам и воспроизведению.
Mixer — см. микшер.
MPEG — Moving Pictures Experts Group. Группа экспертов, занимающаяся разработкой алгоритмов кодирования мультимедиа информации. Также, набор стандартов кодирования (сжатия) аудио- и видео информации в цифровом виде.
Oscillation — см. колебание.
Oversampling — см. передискретизация.
PAC — Perceptive Audio Coding. Алгоритм кодирования (сжатия) цифровых аудио сигналов, основанный на психоакустическом анализе.
Panning — см. панорамирование.
Phaser — см. фэйзер.
Pitch — см. высота звука.
PCM — Pulse Code Modulation. Способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд.
Resonance — см. резонанс.
Reverberation — см. реверберация.
Reverberation time — см. время реверберации.
Sample — см. сэмпл.
Spectrum — см. акустический спектр
Stream playback — см. потоковое воспроизведение.
Streaming — см. потоковое воспроизведение.
Synthesizer — см. синтезатор
Tracker — см. трекер.
Tracker module — см. трекерный модуль.
TwinVQ — алгоритм кодирования (сжатия) цифровых аудио сигналов, основанный на психоакустическом анализе.
UART — Universal Asynchronous Receiver/Transmitter. Универсальный асинхронный приемо-передатчик (интерфейс).
Wave length — см. длинна волны.
XG — extended General. MIDI-стандарт, разработанный фирмой Yamaha.
Русский язык.
Абсолютная кодировка сигнала — представление сигнала в виде численных значений его амплитуды, взятых с определенной частотой.
Акустика — общая и теоретическая акустика занимаются изучением закономерностей излучения и распространения упругих волн в различных средах, а также взаимодействия их со средой. К разделам акустики относятся электроакустика, архитектурная акустика и строительная акустика, атмосферная акустика, геоакустика, гидроакустика, физика и техника ультразвука, психологическая и физиологическая акустика, музыкальная акустика.
Акустическая волна — см. звуковая волна.
Акустический спектр звука — совокупность синусоидальных составляющих сложного звука, заданных с помощью амплитуд и частот этих составляющих.
Амплитуда — наибольшее отклонение колеблющейся по определенному закону величины от среднего значения или от некоторого значения, условно принятого за нулевое; значение величины сигнала в данный момент времени.
Амплитудная огибающая спектра — кривая, соединяющая на графике амплитуды составляющих спектра.
АОИКМ — Адаптивная относительная импульсно-кодовая модуляция. См. ADPCM.
Аранжировка — переложение музыкального произведения для исполнения на др. инструменте или др. голосом, др. составом инструментов или голосов; облегченное изложение музыкального произведения для исполнения на том же инструменте; гармонизация и инструментовка новой или хорошо известной мелодии.
Баланс — отношение уровней сигналов в каналах.
Биения — возникают при наложении двух синусоидальных колебаний с близкими частотами. Они являются периодическими. Основная частота биений в этом случае равна разнице между частотами наложенных взаимодействующих синусоидальных колебаний.
Бинарное представление числа — представление числа в двоичной системе счисления, то есть в виде нулей и единиц.
Бинауральная запись — двухканальная (стерео) аудио запись, предназначенная для воспроизведения через наушники (сигнал каждого канала направляется в соответствующее ухо). Таким образом достигается ощущение восприятия источников звука в их оригинальной позиции в пространстве.
Бинауральный эффект — способность человека и высших животных определять направление на источник звука. Из-за того, что уши расположены на некотором расстоянии, звук приходит к ним, различаясь по фазе и интенсивности, что ведет к различию импульсов, поступающих в центральную нервную систему от правого и левого уха, и дает возможность определять направление.
Бит-поток — см. цифровой поток.
Битрейт — см. bitrate
Бифонический процессор — устройство, позволяющее получить бинауральный эффект при прослушивании бинауральной записи через колонки.
Бытовой шум — звук произвольного характера, нежелательный в данных условиях или для данного лица.
Волна — пространственное и временное изменение состояния среды, которое можно представить как однонаправленное ее перемещение. Существуют поперечные и продольные волны.
Волновая таблица — обычно, — MIDI-синтезатор, основанный на использовании таблично-волнового синтеза.
Время реверберации — время с момента выключения источника звука до уменьшения плотности акустической энергии или интенсивности звука до уменьшения плотности акустической энергии или интенсивности звука до одной миллионной доли от ее первоначального значения, т.е. до 60 дБ (стандарт DIN 52212).
Высота звука — зависит не только от частоты основного тона, но и от ряда дополнительных факторов, таких, как громкость, длительность и спектральный состав звучания. Высота звука сложного сигнала определяется самой низкой (основной) частотой, или присутствующей в самом сигнале, или обусловленной формой его огибающей кривой.
Гармоника — простейшая периодическая функция, характеризующая гармоническое колебание, которая является составляющей сложного колебания, с частотой, кратной основной частоте (первой гармонике). В акустике и музыке гармонику называют обертоном.
Давление звука — характеризует величину физического давления звуковой волны. Абсолютное звуковое давление удобно измерять в дБ в виду того, что, например, самый тихий звук, различимый человеческим ухом, соответствует величине давления 20*10-6 Па, самый громкий звук — 200000000*10-6 Па. Если производить сравнение этих величин просто находя их соотношение, то оно будет равно 10000000:1 Па, что очень неудобно. Для расчета абсолютного звукового давления в дБ пользуются формулой: P (dBspl)=20*lg(P/Pпор), где P — давление звука, Па; Pпор — пороговое давление слышимости (Pпор=20*10-6 Па); dBspl — sound pressure level in dB, т.е. уровень звукового давления в дБ. Мгновенное звуковое давление — давление в некоторой точке среды в какой-то момент времени за вычетом статического давления в этой точке. Пиковое звуковое давление — абсолютное максимальное мгновенное звуковое давление, возникающее в определенный период времени.
Декомпрессор — см. экспандер.
Декремент — основная величина при расчетах затухания. Декремент — характеристика быстроты затухания двух колебаний, следующих друг за другом в одну и ту же сторону.
Децибел (дБ) — относительная логарифмическая величина, численно характеризующая отношение двух физических величин. Обычно в децибелах измеряется амплитуда звука. Разница на 6 дБ означает разницу амплитуд в 2 раза, на 12 дБ — в 4 раза (то есть, если A1 — одна амплитуда, а A2 — другая, то разница в дециБелах X считается по формуле: X = 20*lg(A1/A2), когда lg — логарифм по основанию 10). За 0 дБ часто принимают или самый тихий слышимый человеком звук, или (в цифровом аудио) самый громкий звук, не выходящий за допустимый диапазон амплитуд.
Джиттер — см. jitter.
Дитеринг — см. dithering.
Динамический диапазон — это диапазон наибольшего и наименьшего уровней сигнала. Измеряется в дБ. Расчет динамического диапазона проводится по следующей формуле: D=20*lg(Pmax/Pmin), где Pmax и Pmin — соответственно максимальное и минимальное значение звукового давления. Из практических соображений динамический диапазон принято рассчитывать как разность Pmax и Pmin. Предельный динамический диапазон, например, голоса, составляет примерно 57 дБ. Сигналы, имеющие слишком широкий динамический диапазон, могут вызывать перегрузки в аппаратуре. Особенно это касается различных устройств записи и оцифровки.
Дискретизация сигнала (во время оцифровки) — процесс получения значений амплитуды оцифровываемого сигнала в определенные промежутки времени (см. оцифровка сигнала).
Дисторшн — см. distortion.
Длина волны — расстояние между двумя ближайшими точками волны, сдвинутыми по фазе на один полный период.
Драйвер — управляющая программа, т.е. программа, вызывающая другую программу (или программы) и задающая ей параметры работы; программа, организующая взаимодействие физических устройств с BIOS и операционной системой.
Драйвер устройства — программная процедура (см. драйвер), управляющая конкретным устройством, например, дисковым накопителем, звуковой картой и проч.
Дуплекс, дуплексная связь — двусторонняя связь между двумя устройствами, при которой в каждом из них передача и прием сообщений могут вестись одновременно.
Затухание — мера потерь энергии в колебательной системе при превращении одной формы энергии в другую.
Звук — механические колебания и упругие волны, распространяющиеся в твердых, жидких и газообразных средах, преимущественно в слышимых областях частот (16-20000 Гц).
Звукоизоляция — уменьшение воздействия звука благодаря установке отражающей (поглощающей) стенке между источником звука и местом воздействия.
Звуковая волна — звуковой волной называют процесс распространения переменного возмущения в упругой среде, а звуковыми колебаниями называют колебательные движения частиц среды под действием этого возмущения.
Звуковое давление — см. давление звука.
Звуковая мощность — см. мощность звука.
Звуковой отсчет — см. отсчет.
Звуковой редактор — программа, предназначенная для осуществления различных преобразований и монтажа аудио данных в цифровом виде.
Звукопоглощение — потеря звуковой энергии при падении звуковых волн, и их распространении в материальной среде. Коэффициент звукопоглощения материала — отношение поглощенной энергии к падающей энергии звука. Характеристика способности материала поглощать звуковые волны, изменяется от 0 до 1 (иногда измеряется в процентах от 0 до 100%). При нулевом коэффициенте звукопоглощения вся звуковая энергия отражена поверхностью материала. 1 — означает, что вся звуковая энергия поглощена материалом.
ИКМ — Импульсно-кодовая модуляция. См. PCM.
Интенсивность (сила) звука — отношение падающей на поверхность звуковой мощности к площади этой поверхности. Определяется как амплитудами всех частотных составляющих, так и числом источников, звучащих одновременно. Интенсивность звука измеряется в Вт/м2 или дециБелах и рассчитывается по формуле: I=P/S (Вт/м2), где P — мощность падающей на поверхность звуковой волны (см. ниже); S — площадь поверхности. Чувствительность слуха в среднем подчиняется логарифмическому закону, то есть нарастание интенсивности звука в виде степенной функции воспринимается на слух как линейное (равномерное) увеличение громкости. Поэтому для оценки интенсивности звука удобно пользоваться логарифмической единицей, какой и является дециБел. При измерении абсолютной интенсивности звука, за эталонное значение Z принимается уровень порога слышимости синусоидального сигнала с частотой 1000 Гц, что соответствует интенсивности 10-12 Вт/м2. Учитывая тот факт, что ухо человека различает относительное изменение интенсивности примерно на одну десятую часть Белла, то интенсивность принято оценивать в децибелах (дБ или dB): I (дБ)=lg(X/10-12)/10, где X – интенсивность звука, Вт/м2. В результате получается, что порог слышимости определяется интенсивностью равной 0 дБ (lg(10-12/10-12)/10=0), интенсивность шепота — около 35 дБ, интенсивность громкого голоса — около 90 дБ. Болевые ощущения возникают при интенсивности около 110-130 дБ.
Интерполяция — восстановление сигнала между отсчетами; отыскание промежуточных значений величины по некоторым известным ее значениям.
Интерфейс — совокупность программных и аппаратных средств и протоколов, предназначенных для организации взаимодействия различных устройств.
Интерференция — явление усиления колебаний в одних точках пространства и ослабления колебаний в других точках в результате наложения двух или нескольких волн, приходящих в эти точки. Интерференция волн возможна, если разность фаз волн постоянна во времени, т. е. волны когерентны. Интерференция волн действительна для волн любой природы и частоты.
Канал — совокупность устройств, предназначенных для передачи информации.
Канал прямого доступа — см. DMA.
Квантование (во время оцифровки) — процесс замены реальных значений амплитуды сигнала приближенными с определенной точностью (см. оцифровка сигнала).
Ковокс — см. covox.
Когерентность — см. когерентные волны.
Когерентные волны (связанные волны) — волны одинаковой частоты, колебания в которых отличаются постоянной разностью фаз, не изменяющейся со временем.
Колебание — изменение во времени величины по отношению к определенному выбранному ее значению.
Компандер (компрессор) — устройство или программа, предназначенная для сужения динамического диапазона звукового сигнала.
Компрессор — см. компандер.
Коэффициент звукопоглощения материала — см. звукопоглощение.
Микрофон — электроакустический преобразователь, который реагирует на звуковые волны и вырабатывает эквивалентные электрические сигналы.
Микшер — программный или аппаратный блок, предназначенный для регулировки уровней сигналов в каналах и на входах/выходах, а также для смешения сигналов.
Младший квант — минимальный уровень квантования.
Многотембровость (полифония) — максимально возможное количество воспроизводимых одновременно инструментов.
Модуляция — изменение по заданному закону во времени величин, характеризующих какой-либо регулярный физический процесс. Практическое значение имеет модуляция колебаний.
- Шепот — 10-9 Вт
- Разговор — 10-5 Вт
- Крик — 10-3 Вт
- Большой оркестр — 10 Вт
- Большой турбореактивный самолет — 105 Вт
Музыкальный баланс — смысловая уравновешенность громкости звучания в общей звуковой картине: отдельных групп инструментов, солистов, действующих лиц в спектаклях. М.Б. зависит от правильной расстановки микрофонов, микширования, использования искусственной реверберации и частотной коррекции. Частичные параметры: cоответствие полученного результата: партитуре, сценарию спектакля, замыслу теле-, кинорежиссёра, реальному звучанию. Примеры недостатков: нарушение тембров отдельных инструментов, групп или голосов.
Мультитембровость — см. многотембровость.
Непрерывный спектр — спектр волн, частотные составляющие которых распределены непрерывно в диапазоне частот.
Непрерывный шум — шум, интенсивность которого остается без изменений неопределенный период времени или заданный период времени.
Обертон — см. гармоника.
Октава — единица частотного интервала — определяется отношением 2:1. Октава равна интервалу между двумя частотами f1 и f2, логарифм отношения которых равен единице (log(f2/f1)=1), что соответствует различию частот f1 и f2 в два раза.
Октавная полоса — диапазон частот, при котором наивысшая частота вдвое больше самой низкой частоты.
Осциллятор — генератор чистых тонов (синусоидальных сигналов).
Отсчет — численное значение амплитуды сигнала в определенный момент времени.
Оцифровка сигнала — фиксация амплитуды аналогового сигнала через определенные промежутки времени и регистрация полученных значений амплитуды в виде округленных цифровых значений; этот процесс в целом включает в себя два процесса — процесс дискретизации (осуществление выборки) и процесс квантования амплитуды сигнала по уровню (округление амплитуды до ближайшего целого числа).
Ошибка округления — погрешность, возникающая при квантовании в результате округления амплитуды сигнала до ближайшего уровня квантования. Причина возникновения шума квантования.
Панорамирование — управление уровнем сигнала в каналах, приводящее к изменению положения мнимого источника звука на стереопанораме.
Передискретизация — оцифровка сигнала с частотой дискретизации, превышающей исходную. Способ ослабления шума квантования.
Период — время, за которое совершается одно полное колебание.
Полифония — максимально возможное количество воспроизводимых одновременно простейших звуков (максимальное количество одновременно запущенных генераторов синтезатора).
Помехи — шумы (см. шум), мешающие полноценному восприятию звукозаписи. Частичные параметры: шумы акустические и электрические, помехи в цифровом тракте: щелчки, выпадение информации.
Порог слышимости — минимальная интенсивность звука, с которой слуховой аппарат человека начинает воспринимать звуковой сигнал. Порог слышимости звука для человека не остается постоянным с изменением частоты — чувствительность человеческого уха сильно зависит как от громкости звука, так и от его частоты. Например, порог слышимости сигнала на частоте около 3 КГц составляет приблизительно 0 дБ, а на частоте 200 Гц — около 20 дБ. Напротив, болевой порог слышимости мало зависит от частоты и колеблется в пределах 100 — 130 дБ.
Потоковое воспроизведение — воспроизведение аудио данных, не дожидаясь завершения их получения (передачи).
Прозрачность звучания — возможность временного и качественного различения отдельных источников в обшей звуковой картине. Частичные параметры: регистровая прозрачность звучания. Временная прозрачность. Разборчивость текста. Слитность звучания. Стереофоническое разрешение. Острота локализации, отображаемая ширина точечных источников звука. Примеры недостатков: перекрытия между отдельными звуковыми линиями (результат нарушения музыкального или акустического баланса).
Пространственное впечатление от звучания — это восприятие совместного действия источников звука и их пространственного окружения. П.В. характеризует связь между размером помещения и количеством исполнителей. Оценка П.В. включает ощущение звуковой перспективы в глубину и ширину. Взаимное соотношение: объёма помещения и размеров звучащего тела, музыкального содержания и акустических свойств студии. Частичные параметры: впечатление о размере помещения. Продолжительность реверберации. Соотношение прямых и отраженных звуков (акустический баланс). Акустическая атмосфера. Тембр пространственного звука. Объёмность звучания создаваемая многоплановостью звуковой картины. Примеры недостатков: многопространственность — звучание отдельных голосов (инструментов) расположенных как бы в разных помещениях, отличающихся акустикой. Искажение тембра простраственного звука. Нарушение акустического баланса.
Протокол — система параметров и форматов данных, используемых устройством.
Психоакустика — наука, изучающая психологические особенности восприятия звука человеком, а также влияние звука на человека.
Реверберация — процесс затухания звука в помещении после отключения (прекращения действия) источника звука. Реверберация характеризуется временем реверберации. Также, под реверберацией подразумевают эффект звучания, заключающийся в кажущейся объемности, пространственности звучания, характерной для большого зала, где каждый звук порождает соответствующий, медленно угасающий отзвук. С помощью эффекта реверберации можно «оживить», например, фонограмму, сделанную с заглушенном помещении.
Резонанс — явление возрастания амплитуды вынужденных колебаний в какой-либо колебательной системе, наступающее при приближении частоты периодического внешнего воздействия к одной из частот собственных колебаний системы. Характер резонанса существенно зависит от свойств колебательной системы.
Резонансная частота — частота резонатора, при которой колеблющаяся величина достигает своего максимального значения.
Секвенсор — устройство или программа, запоминающая последовательность введенных в нее звуков и позволяющая их воспроизведение (редактирование) с возможными изменениями параметров воспроизведения.
Сила звука — см. интенсивность звука.
Синтезатор — программа или устройство, предназначенное для синтеза (создания) звуковых сигналов.
Скорость звука — скорость распространения звуковой волны в пространстве.
Скорость обмена — число бит в секунду, проходящее по каналам передачи при обмене данными.
Слот — разъем, расположенный на плате и служащий для подключения к ней дополнительных устройств.
Сон — громкость ощущаемая типичным слушателем, при подаче чистого тона частотой 1000 Гц, имеющего уровень звукового давления 40 дБ.
Спектр — см. акустический спектр.
Старший квант — максимальный уровень квантования.
Стерео база — расстояние между двумя мнимыми источниками звука на стерео панораме.
Стереовпечатление – это ощущение пространственного распределения и разрешающей способности звучания. Стереофонический баланс. Частичные параметры: ширина звуковой картины (стерео база), угол слушания, распределение направлений, стереофоническое равновесие. Примеры недостатков: суженная звуковая картина, провал середины, замена сторон, недостаточное переходное затухание, противофаза между каналами или микрофонами.
Стоячие волны — возникают в результате интерференции между двумя волнами, движущимися в противоположных направлениях, с равными длиной, частотой и амплитудой. Амплитуда стоячей волны постоянна в любой точке; узлы колебаний (нулевая амплитуда) и пучности (максимальная амплитуда) совпадают. Стоячие волны возникают при отражениях волн от преград при условии, что волновое сопротивление среды значительно отличается от волнового значения отражателя.
Сэмпл — отрезок (часть) аудио данных в цифровом виде.
Трекер — музыкальный редактор, использующий в качестве инструментов цифровые аудио данные, загружаемые в оперативную память компьютера.
Трекерный модуль — файл определенной структуры, хранящий партитуру и инструменты (сэмплы) для использования в соответствующем трекере.
Тембр звучания – это ощущение характерности звучания отдельных источников звука или их групп. Частотный спектр и характер звучания основного тона и обертонов. Оптимальное воспроизведение поля прямого звука и частотного спектра пространственных звуков. Частичные параметры: тембральное равновесие, амплитудно-частотная и фазо-частотная характеристика, различные виды искажений, нелинейные искажения, переходные процессы, впечатление присутствия. Примеры недостатков: источники искажений тембра (микрофоны, звуковой тракт, контрольные агрегаты, головные телефоны)
Ультразвук — механические колебания, находящиеся выше области частот, слышимых человеческим ухом.
Фаза — состояние колебательного процесса в определенный момент времени.
Физиологическая акустика — наука, изучающая устройство и функции звукоизлучающей и звуковоспринимающей систем человека и животных.
Фильтр — устройство или программа, осуществляющая фильтрацию звуковых сигналов. Аппаратные фильтры могут быть пассивные — не требующие источников питания, активные — требующие источников питания, цифровые — основанные на цифровой технике.
Фильтрация — преобразование звукового сигнала в результате которого происходит усиление или ослабление отдельных частотных областей спектра сигнала.
Флэнжер (от англ. «flange» — фланец, кайма) — эффект звучания, достигаемый путем наложения на сигнал сдвинутых по времени (с небольшой задержкой) и модулированных его же копий. Часто эффект реализуется с циклически изменяющейся временной задержкой. Результатом применения эффекта является плавающий звук с биениями частот или хор с измененными тембрами копий основного сигнала. При определенном соотношении задержек, частоты и глубины модуляции возможно получение эффекта, напоминающего восприятие гудка проезжающего мимо слушателя паровоза. В аналоговых устройствах флэнжер достигается путем пропускания сигнала через гребенчатые фильтры. А обнаружен этот эффект был чисто случайно, когда два магнитофона одновременно воспроизводили одну и ту же запись в одном из них случайно задели ведомый ролик пленки (фланец), то есть фактически задержали скорость воспроизведения. От смешивания двух фонограмм возник эффект плавания звука. Этот эффект удивил звукоинженеров своей новизной и в последствии флэнжер стал широко использоваться при обработке музыкальных композиций.
Фэйдер — орган управления параметрами физического или виртуального устройства (регулятор, движок, ползунок, ручка).
Фэйзер — (от англ. «phase» — фаза) — эффект звучания, основанный на смешивании входного сигнала с его копиями, сдвинутыми в пределах фазы сигнала. Вообще говоря, сдвиг по фазе аналогичен сдвигу во времени на доли миллисекунд. Может применяться сдвиг по фазе не на фиксированные значения, а изменяющийся по какому-то фазомодулирующему закону. В результате такой эффект может восприниматься на слух как «качание» частот, то есть приглушение то одних, то других. В случае обработки стерео сигнала частоты могут «переплывать» из одного канала в другой. В аналоговой технике для получения фэйзера прибегают к использованию фазовращателей.
Фон — фоном называется единица уровня громкости. Уровень громкости звука составляет n фон, если средний слушатель оценивает его как равный по громкости тону с частотой 1000 Гц и уровнем давления в n децибел. Фон в качестве уровня громкости, так же, как и децибел, не является единицей измерения, а представляет собой двадцатикратный десятичный логарифм отношения звуковых давлений.
Форманта — области наибольшей энергии в спектре голоса или музыкальных инструментов. Форманты определяют характерный тембр инструмента, голоса.
Хорус (от англ. «chorus» — хор) — см. chorus.
Цикл — последовательность значений периодической величины за период.
Цифровой поток — последовательность (блок) аудио информации в цифровом виде.
Цифровой сигнальный процессор — специализированный процессор, ориентированный на осуществление высокоскоростных преобразований над звуковыми сигналами. Используется в звуковых картах, модемах и других устройствах.
Частота — частотой функции, периодической во времени, называют величину, обратную периоду.
Частота колебаний — число полных циклов колебаний за одну секунду.
Частотная составляющая спектра — синусоидальное колебание определенной частоты.
Чистый тон — см. частотная составляющая спектра.
Шум — звук, в котором отсутствует или неявно выражена тональность. Известные разновидности шумов: белый шум (шум Джонсона) — имеет спектр с приблизительно постоянной спектральной плотностью на всей его протяженности; розовый шум — его спектр имеет спектральную плотность, уменьшающуюся на 3 дБ с каждой последующей октавой (спектральная плотность обратно пропорциональна частоте); оранжевый шум — квазипостоянный шум с конечной спектральной плотностью, спектр такого шума имеет полоски нулевой энергии, рассеянные на всей его протяженности, такие полоски находятся около частот, соответствующих музыкальным нотам; зеленый шум — подобен розовому шуму с усиленной областью частот в районе 500 Гц; синий шум — его спектральная плотность увеличивается на 3 дБ с каждой последующей октавой (спектральная плотность пропорциональна частоте); фиолетовый шум — дифференцированный белый шум, его спектральная плотность увеличивается на 6 дБ с каждой последующей октавой (спектральная плотность пропорциональна квадрату частоты); серый шум — спектр такого шума имеет график, аналогичный графику психоакустической кривой порога слышимости, это значит, что для слухового аппарата человека этот шум имеет одинаковую громкость на всем слышимом диапазоне частот; коричневый шум — его спектральная плотность уменьшается на 6 дБ с каждой последующей октавой (спектральная плотность обратно пропорциональна квадрату частоты); черный шум — определений этого шума существует достаточно много, одно из них: черный шум есть сверхзвуковой белый шум, такой шум имеет постоянную конечную спектральную плотность за пределами порога слышимости (20 Кгц). Также см. бытовой шум. Широкополосный шум — шум, энергия которого распределяется в широком диапазоне частот (более одной октавы).
Шум дробления — см. шум квантования.
Шум квантования — шум, подмешивающийся к звуковому сигналу при квантовании в результате округления амплитуды сигнала до ближайшего уровня.
Эквалайзер — устройство или программа, предназначенная для фильтрации звукового сигнала.
Экспандер — устройство или программа, предназначенная для расширения динамического диапазона звукового сигнала.
Эмулятор — аппаратные или программные средства для выполнения программ, записанных в системе команд другого устройства (вычислительной машины). Программа, выполняющая функции, обычно реализуемые некоторым внешним устройством.
Эмуляция — выполнение устройством (вычислительной машиной) программ, записанных в системе команд другого устройства (вычислительной машины)
Эффект-процессор — программный или аппаратный блок, построенный на использовании DSP и предназначенный для наложения на сигнал звуковых эффектов (эхо, реверберация и проч.).
Эхо — отраженная с задержкой во времени волна.
- звук и музыка
- терминология