Как найти частоту дискретизации звукового файла

Как определить частоту дискретизации

Одной из основных характеристик цифровой аудиозаписи является частота дискретизации звука. Данный параметр указывает на то, сколько моментальных значений аналогового сигнала в секунду снималось при его оцифровке. Частоту дискретизации конкретной записи можно определить при помощи различных программных средств.

Как определить частоту дискретизации

Вам понадобится

  • – Winamp;
  • – Sound Forge;
  • – Virtual Dub.

Инструкция

Определите частоту дискретизации звука в медиа-файле при помощи проигрывателя Winamp. Он доступен для бесплатной загрузки на сайте winamp.com. Откройте окно редактора списка воспроизведения, если оно не отображено. Для этого нажмите сочетание клавиш Ctrl+E или в главном меню выберите пункты View и Playlist Editor. Добавьте файл в список воспроизведения, кликнув по кнопке Add и выбрав пункт Add file(s) появившегося контекстного меню. Правой кнопкой мыши кликните по записи в списке воспроизведения. Выберите пункт “View file info…” контекстного меню. Отобразится диалог, в котором среди прочих значений будет выведена частота дискретизации.

Как определить частоту дискретизации

Воспользуйтесь аудио-редактором Sound Forge для определения частоты дискретизации. В главном меню выберите пункты File и “Open…”. Также можно нажать клавиши Ctrl+Alt+F2. В диалоге «Открыть» выделите нужный файл. В графе Audio блока со статистической информацией, расположенного снизу, появится нужное значение.

Как определить частоту дискретизации

Если файл уже открыт в Sound Forge, нажмите клавиши Alt+Enter или Alt+2. Либо выберите пункты View и File Properties главного меню. Отобразится окно со списком атрибутов и соответствующих им значений. Найдите в нем графу Audio sample rate. Из поля Value получите значение частоты дискретизации.

Как определить частоту дискретизации

Узнайте частоту дискретизации звука, содержащегося в файле видео. Используйте редактор Virtual Dub. Он бесплатно распространяется на сайте virtualdub.org. Откройте видео в программе, выбрав пункты File и “Open…” главного меню. Отобразите диалог свойств файла. Для этого в меню выберите пункты File и “File Information…”. В группе элементов управления Audio stream найдите значение Sampling rate.

Как определить частоту дискретизации

Узнайте частоту дискретизации при помощи диалога свойств графической оболочки Windows. В окне папки, проводника или какого-либо файлового менеджера кликните правой кнопкой по файлу. В контекстном меню выберите пункт «Свойства». переключитесь на вкладку «Сводка» отобразившегося диалога. В разделе «Аудио» найдите нужное значение.

Как определить частоту дискретизации

Видео по теме

Войти на сайт

или

Забыли пароль?
Еще не зарегистрированы?

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

ЗвукЗвук представляет собой волну с меняющейся интенсивностью и частотой (громкостью и его тональностью соответственно). Чем больше амплитуда, тем громче звук. Чем больше частота, тем больше тон.

Хранение и передача аналогового звукового сигнала осуществляется за счёт представления его в виде электрического сигнала с помощью модуляции.

Звуковой сигнал

Модуляция – процесс изменения одного или нескольких параметров (амплитуды, частоты или фазы) высокочастотного колебания по закону низкочастотного сигнала (несущей частоты).

Существуют разные виды модуляции:

Амплитудная (АМ, amplitude modulation ) – изменение высокочастотных колебаний с частотой, равной частоте звукового сигнала. Например, несущей частотой может быть питание сети – 50 Гц. Или радиоволна СВ (MW) диапазона от 300 кГц до 3 МГц.Модуляция сигнала

Частотная (FM, frequency modulation – модуляция при которой информационный сигнал управляет несущей частотой. По сравнению с амплитудной модуляцией здесь амплитуда остаётся постоянной.


Цифровой сигнал

Для того чтобы аналоговый (непрерывный) сигнал представить последовательностью чисел определённой разрядности, его необходимо превратить в дискретный (прерывистый) сигнал, а затем подвергнуть квантованию.

Дискретизация и квантованиеЗа кодирование звука отвечает звуковая карта, чем выше разрядность звуковой карты, тем больше уровней квантования она выдаёт и тем точнее становится звук при прослушивании.

На современном ПК карта всегда интегрирована в материнской плате, и имеет разрядность не ниже 24 бит.

Оцифровка звука – дискретизация и квантование аналогового сигнала.

1-й этап: Дискретизация сигнала по времени

Допустим, Вы, с помощью микрофона записали свой голос длительностью 5 сек. Этот фрагмент можно разбить на равные малые временный отрезки, которые в сумме дают нам 5 сек. Получаем частоту дискретизации (f, Гц), которая является обратной величиной времени: t сек. При частоте дискретизации 8 кГц=8 000 Гц, из формулы получаем отрезок, равный 0,000125  сек. или 125 миллисекунд.

Частота дискретизации 2-й этап: Квантование сигнала по уровню

Чем больше уровней будет доступно для кодирования временных отрезков, тем ближе к аналогу будет закодированный файл, но при этом объём файла увеличится.

Например, возьмём 8 уровней, чтобы их закодировать в двоичный код нам достаточно 3 бита, что мы получаем из формулы Хартли:

формула Хартли

2³=8 – комбинаций двоичного ряда чисел от 000 до 111.

Параметр (i) – называется глубина кодирования. 8 бит – 256 уровней, 16 бит – 65 536 уровней, 24 бита – более 16 млн. уровней.

3 этап: Определяем скорость потока звука

Частота дискретизации – 22 кГц, глубина кодирования – 16 бит. Произведение этих двух величин дает нам скорость потока 352 кбит/сек.

скорость потока

Именно такой канал передачи данных потребуется для воспроизведения звукового файла в режиме он-лайн.

Расчёт количество звуковой информации

Для определения информационного объёма звуковой информации, нам необходимы следующие параметры:

Объём звуковой информации

  • f – частота дискретизации (Гц);
  • t – время звучания звукового файла (сек.);
  • i – глубина кодирования (бит);
  • n – количество звуковых каналов (n = 1, моно; n = 2, стерео).

Задача 1:

Одна минута записи цифрового аудиофайла занимает 1,3 МБ, разрядность звуковой платы — 8 бит. С какой частотой дискретизации записан звук?

Решение:

сетка

Воспользуемся формулой: I=f∙t∙i∙n , из формулы видно что для нахождения частоты дискретизации формула примет вид: f=I/t∙i∙n.

1,3 МБ = 13,31,2 КБ = 1 363 148,8 Байт. Принимая во внимание что 8 бит = 1 Байту, делим 1 363 148,8 на 60, канал у нас записан 1, поэтому n=1.

Ответ: 22719,1 Гц  или 22 050 Гц, см. основные настройки параметров звукового файла в программе Audacity audacity

Задача 2:

Две минуты записи цифрового аудиофайла занимают на диске 5,1 МБ. Частота дискретизации — 22 050 Гц. Какова разрядность аудиоадаптера?

сетка

Решение: 5,1 МБ = 5 347 737,6 Байт, делим по формуле: i  = I / f∙ t ∙ n.

5 347 737,6 / 22 050 ∙ 120 = 2,02 Байт.

Ответ: 16 бит.


Кодирование видео

Информация хранится на различных носителях в виде файлов. Файл занимает память и может быть измерен в единицах измерения информации: бит, Байт, КБ и т.д.

Стремительное развитие интернета резко увеличило обмен информацией между людьми, для  оптимизации хранения данных люди стали использовать специальные алгоритмы сжатия.

В основе цифрового видео лежит графический и звуковой файлы. Если рассчитать объём видеофайла без сжатия, нам необходимо учитывать тот факт, что человек начинает воспринимать смену кадров (картинок), как непрерывное плавное движение, если за 1 сек. будет мелькать 24 кадра.

Основы ТВ

Для приёма телевизионного сигнала используется антенна и приёмник. Приёмник – это электронная схема, которая преобразует сигнал в изображение на экране. В этом процессе участвует генератор кадровой развёртки и строчной.

Кадровая развёртка формируется на частоте, близкой к частоте переменного тока в бытовых электросетях – 50 Гц.

Кадровая развёртка, в сочетании со строчной служит для преобразования плоского двумерного изображения в одномерную последовательность, то есть, видеосигнал, а в телевизоре или мониторе компьютера для преобразования видеосигнала обратно в изображение на экране.

Для создания такой последовательности, используются специальные стандарты разложения:

576i, 625/50 — стандарт разложения, принятый для аналогового и цифрового телевидения в Европе, России, Австралии, странах Африки и Азии. 576 – это количество активных строк для аналогового телевидения и число пикселей по вертикали, для цифрового. Буква «i», англ. Interlace означает чересстрочную развёртку, передающую 25 целых кадров в 50 полях за 1 секунду.

480i, 525/60 — стандарт разложения, принятый в США, число активных строк составляет 480.

Существует также прогрессивная (p) кадровая развёртка, где все строки каждого кадра отображаются последовательно. Прогрессивная развертка стала широко распространена с появлением персональных компьютеров. Для комфортного чтения мелкого текста с экрана монитора, чересстрочная развертка стала малопригодна, так как мерцание строк вызывало быстрое утомление глаз.

Помимо развёртки существует ещё и соотношение сторон: аналоговое ТВ – 4:3, цифровое ТВ – 16:9, широкоформатное.

Форматы со сжатием

Давайте для начала посчитает объём видеофайла без сжатия, длительность 1 час 30 мин., 576i, 16:9. Звук записан с частотой дискретизации – 44 100 Гц, глубина кодирования 24 бит.

Решение:

Видео: I = 576 ∙ 1024 ∙ 25 ∙ 5400 ∙ 24 = 1 911 029 760 000 бит = 222,5 ГБ

Звук: I = 44 100 ∙ 5400 ∙ 24 = 5 715 360 000 бит = 681,3 МБ = 0,665 ГБ

Ответ: 223,2 ГБ.

Графический формат JPEG

Алгоритм JPEG (от англ. Joint Photographic Experts Group) в большей степени пригоден для реалистичных изображений с плавными переходами яркости и цвета, таковыми являются фотографии.

В основу алгоритма заложен переход от цветового пространства RGB к цветовому пространству YCbCr. Y – компонент яркости, Cb и Crсиний и красный цветоразностные компоненты. Суть сжатия состоит в том что для каждого блока пикселей 2х2 записывается не 12 значений, а 6, за счёт использования усреднённого компонента цвета.

Видео  и аудио форматы MPEG

Алгоритм MPEG (англ. Moving Picture Experts Group) – стандарты сжатия и передачи цифровой видео и аудио информации. Базовым объектом кодирования в стандарте MPEG является кадр телевизионного изображения. Поскольку в большинстве фрагментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, сжатие начинается с создания исходного кадра.

При сжатии аудио используются хорошо разработанные психоакустические модели, чтобы выбросить звуки, которые не слышны человеческому уху.

Современные цифровые стандарты

Современные дисплеи и мониторы уже давно вышли за рамки старых добрых стандартов.

Видео форматы

Стандарты современных дисплеев:

Стандарты дисплеев

Цифровое представление аналогового аудиосигнала. Краткий ликбез

Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.

Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.

Чем отличается цифровой аудиосигнал от аналогового?

Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).

Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).

Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.

Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).

Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).

Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).

Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).

Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)

Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).

Данная формула позволяет вычислить количество уровней квантования:

Если N — количество уровней квантования,
n — разрядность, то

Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.

При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.

Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением и квантованным значением ()

Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).

Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).

Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).

Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.

50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.

Теперь о дискретизации.

Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то

Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).

Теорема Котельникова гласит:

Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.

Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?

Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.

Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.

Аудиопример 4: Линейно возрастающая частота от

100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.

Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг

Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.

Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.

Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):

Битрейт = Частота дискретизации * Разрядность * Количество каналов

Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s

При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.

При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.

Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину.

При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.

ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.

Существуют 3 метода хранения цифрового аудиоматериала:

  • Несжатые («сырые») данные
  • Данные, сжатые без потерь
  • Данные, сжатые с потерями
Несжатый (RAW) формат данных

содержит просто последовательность бинарных значений.
Именно в таком формате хранится аудиоматериал в Аудио-CD. Несжатый аудиофайл можно открыть, например, в программе Audacity. Они имеют расширение .raw, .pcm, .sam, или же вообще не имеют расширения. RAW не содержит заголовка файла (метаданных).

Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.

Аудиоформаты с сжатием без потерь

Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.

Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.

Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).

Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…

При сжатии с потерями

акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».

Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.

Статьи

Как люди, непосредственно связанные с AV сферой, мы постоянно говорим об аудио-кодировании и аудиокодеках, а что же это такое? Аудиокодек – это, по сути, устройство или алгоритм, способный кодировать и декодировать цифровой аудиосигнал.

На практике аудиоволны, которые передаются по воздуху, являются продолжительными аналоговыми сигналами. Сигналы преобразуются в цифровой формат устройством, которое называется аналого-цифровой преобразователь (АЦП), а устройство обратного преобразования – цифро-аналоговый преобразователь (ЦАП). Кодек находится между этими двумя функциями и именно он позволяет откорректировать некоторые важные параметры для успешного захвата, записи и трансляции звукового сигнала: алгоритм кодека, частота дискретизации, разрядность и скорость передачи данных.

Три наиболее популярных аудиокодека: Pulse-Code Modulation ( PCM), MP3 и Advanced Audio Coding ( AAC ). Выбор кодека определяет степень сжатия и качество записи. PCM – кодек, который используется компьютерами, CD-дисками, цифровыми телефонами и иногда SACD-дисками. Источник сигнала для PCM сэмплируется через равные интервалы, и каждый сэмпл представляет собой амплитуду аналогового сигнала в цифровом значении. PCM – это наиболее простой вариант для оцифровки аналогового сигнала.

При наличии правильных параметров этот оцифрованный сигнал может быть полностью реконструирован обратно в аналоговый без каких-либо потерь. Но этот кодек, обеспечивающий практически полную идентичность оригинальному аудио, к сожалению, не очень экономичен, что выражается в очень больших объемах файлов, а такие файлы не подходят для потокового вещания. Мы рекомендуем использовать PCM для записи цифровых образов для ваших источников или когда вы занимаетесь постобработкой аудио.

К счастью, у нас всегда есть возможность выбрать другой кодек, который может сжимать цифровые данные (по сравнению с PCM) на основании некоторых полезных наблюдений о поведении звуковых волн. Но в этом случае приходится идти на компромисс: все альтернативные алгоритмы сопряжены с «потерями», так как невозможно полностью восстановить исходный сигнал, но, тем не менее, результат всё равно хорош настолько, что большинство пользователей не смогут уловить разницу.

MP3 – это формат аудио-кодирования с использованием как раз такого алгоритма сжатия цифровых данных, который позволяет сохранять аудиосигнал в меньшие по объему файлы. Кодек MP3 чаще всего используется пользователями для записи и хранения музыкальных файлов. Мы рекомендуем применять MP3 для трансляций аудио-контента, так как ему требуется меньшая пропускная способность сети.

AAC – это более новый алгоритм кодирования аудиосигнала, ставший «преемником» MP3. AAC стал стандартом для форматов MPEG-2 и MPEG-4. По сути это тоже кодек сжатия цифровых данных, но с меньшей, чем у MP3, потерей качества при кодировании с одинаковыми битрейтами. Мы рекомендуем использовать этот кодек для онлайн трансляций.

Частота дискретизации (кГц, kHz)

Частота дискретизации (или частота сэмплирования) — частота, с которой происходит оцифровка, хранение, обработка или конвертация сигнала из аналога в цифру. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (сэмплов), взятых через равные промежутки времени.

Измеряется в герцах (Гц, Hz) или килогерцах (кГц, kHz,) 1 кГц равен 1000 Гц. Например, 44 100 сэмплов в секунду можно обозначить как 44 100 Гц или 44,1 кГц. Выбранная частота дискретизации будет определять максимальную частоту воспроизведения, и, как следует из теоремы Котельникова, для того, чтобы полностью восстановить исходный сигнал, частота дискретизации должна в два раза превышать наибольшую частоту в спектре сигнала.

Как известно, человеческое ухо способно улавливать частоты между 20 Гц и 20 кГц. Учитывая эти параметры и значения, показанные в таблице ниже, можно понять, почему именно частота 44,1 кГц была выбрана в качестве частоты дискретизации для CD и до сих пор считается очень хорошей частотой для записи.

Есть ряд причин для выбора более высокой частоты дискретизации, хотя может показаться, что воспроизводить звук вне диапазона человеческого слуха – пустая трата сил и времени. При этом среднестатистическому слушателю будет вполне достаточно 44,1 – 48 кГц для качественного решения большинства задач.

Разрядность

Наряду с частотой дискретизации есть такое понятие как разрядность или глубина звука. Разрядность – это количество бит цифровой информации для кодирования каждого сэмпла. Проще говоря, разрядность определяет «точность» измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. С минимальной возможной разрядностью есть только два варианта измерения точности звука: 0 для полной тишины и 1 для звучания в полном объеме. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 = 65 536) различных значений.

Разрядность закреплена в кодеке PCM, но для кодеков, которые предполагают сжатие (например, MP3 и AAC) этот параметр рассчитывается при кодировании и может меняться от сэмпла к сэмплу.

Битрейт

Битрейт — это показатель количества информации, которым кодируется одна секунда звучания. Чем он выше, тем меньше искажений и тем ближе закодированная композиция к оригиналу. Для линейного PCM битрейт рассчитывается очень просто.

битрейт = частота дискретизации × разрядность × каналы

Для таких систем как Epiphan Pearl Mini, которые кодируют линейный PCM 16-бит (разрядность 16), этот расчет может быть использован для определения, сколько дополнительных полос пропускания может потребоваться для PCM аудио. Например, для стерео (два канала) оцифровка сигнала производится с частотой 44,1 кГц на 16-бит, а битрейт при этом рассчитывается таким образом:

44,1 кГц × 16 бит × 2 = 1 411,2 кбит/с

Между тем алгоритмы сжатия аудиосигнала, такие как AAC и MP3, имеют меньшее количество бит для передачи сигнала (в этом и заключается их цель), поэтому они используют небольшие битрейты. Обычно значения находятся в диапазоне от 96 кбит/с до 320 кбит/с. Для этих кодеков чем выше битрейт вы выбираете, тем больше аудио бит вы получаете на сэмпл, и тем выше будет качество звучания.

Частота дискретизации, разрядность и битрейты в реальной жизни.

Аудио CD-диски, одни из первых наиболее популярных изобретений для простых пользователей для хранения цифрового аудио, использовали частоту 44,1 кГц (20 Гц – 20 кГц, диапазон человеческого уха) и разрядность 16-бит. Данные значения были выбраны, чтобы при хорошем качестве звука иметь возможность сохранять как можно больше аудио на диске.

Когда к аудио добавилось видео и появились DVD, а позднее Blu-Ray диски, был создан новый стандарт. Записи для DVD и Blu-Rays обычно используют линейный формат PCM с частотой 48 кГц (стерео) или 96 кГц (звук 5.1 Surround) и разрядность 24. Эти значения были выбраны в качестве идеального варианта, чтобы сохранять аудио с синхронизацией с видео и при этом получать максимально возможное качество с использованием дополнительного доступного дискового пространства.

Наши рекомендации

CD, DVD и Blu-Ray диски преследовали одну цель – дать потребителю высококачественный механизм воспроизведения. Задачей всех разработок было предоставить высокое качество аудио и видео, не заботясь о величине файла (лишь бы он умещался на диск). Такое качество мог обеспечить линейный PCM.

Напротив, у мобильных средств информации и потокового медиа совсем другая цель – использовать максимально низкий битрейт, при этом достаточный для поддержания приемлемого для слушателя качества. Для этой задачи лучше всего подходят алгоритмы сжатия. Теми же принципами вы можете руководствоваться для своих записей.

При записи аудио с видео…

В случае если запись будет использоваться для последующей обработки , выбирайте кодек PCM с частотой 48 кГц и максимальной разрядностью (16 или 24), чтобы обеспечить наилучшее качество аудио. Мы рекомендуем данные параметры для Epiphan Pearl Mini.

При потоковой передаче аудио с видео…

При потоковой передаче или записи для последующей трансляции можно получить хорошее звучание аудио при меньшей полосе пропускания, используя кодеки AAC или MP3 с частотой 44,1 кГц и битрейт 128 кбит/с или выше. Такие параметры гарантируют, что звук будет достаточно хорош и не скажется на качестве трансляции.

Re: [ALSA] Как узнать частоту дискретизации у звуковой карты?

А какая карта? Если встроенная, то почти наверняка 48. Ещё можешь запустить на воспроизведение любой трек (с любой частотой) и посмотреть где-то в /proc/asound/card0/pcm0p/sub0/hw_params — там будет частота, к которой приводит дорожку dmix (он не должен быть отключён). Эта частота и должна быть родной для устройства.

> А какая карта? Если встроенная, то почти наверняка 48.

Мне на надо «наверняка».

Раньше ядро писало 48000KHz, сейчас (2.6.32) не пишет. Поиск в /proc/asound результатов не дал.

Основные понятия

Частота дискретизации(f) определяет количество отсчетов, запоминаемых за
1 секунду;

1 Гц (один герц) – это один отсчет в секунду,

а 8 кГц – это 8000
отсчетов в секунду

Глубина кодирования (b) – это количество бит, которое
необходимо для кодирования 1 уровня громкости

Время звучания (t)

Объем памяти для хранения данных 1
канала (моно)

I=f·b·t

(для хранения информации о звуке
длительностью  t секунд, закодированном с частотой дискретизации f Гц и глубиной кодирования b бит требуется
I бит памяти)

При двухканальной записи
(стерео)
  объем памяти, необходимый для
хранения данных одного канала, умножается на 2
 

I=f·b·t·2
 

Единицы измерения I – биты, b -биты, f – Герцы,  t – секунды

Частота дискретизации 44,1
кГц, 22,05 кГц, 11,025 кГц

Кодирование звуковой информации

Основные
теоретические положения

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук,
непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную
форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается
на отдельные маленькие временные участки, для каждого такого участка
устанавливается определенная величина интенсивности звука.

Таким
образом, непрерывная зависимость громкости звука от времени A(t) заменяется на
дискретную последовательность уровней громкости. На графике это выглядит как
замена гладкой кривой на последовательность “ступенек”.

Частота дискретизации.
Для записи аналогового звука и его преобразования в цифровую форму
используется
микрофон, подключенный к звуковой плате. Качество полученного цифрового
звука
зависит от количества измерений уровня громкости звука в единицу
времени, т.е.
частоты дискретизации. Чем большее количество измерений производится за 1
секунду (чем больше частота дискретизации), тем точнее “лесенка”
цифрового звукового сигнала повторяет кривую аналогового сигнала.

Частота дискретизации звука – это количество измерений громкости звука за одну
секунду, измеряется
в герцах (Гц). Обозначим частоту дискретизации буквой
f.

Частота дискретизации звука может лежать в диапазоне от
8000 до 48 000 измерений громкости звука за одну секунду. Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.

Глубина кодирования звука. Каждой “ступеньке” присваивается определенное
значение уровня громкости звука. Уровни громкости звука можно рассматривать как
набор возможных состояний N, для кодирования которых необходимо определенное
количество информации
b, которое называется глубиной
кодирования звука

Глубина кодирования звука – это количество информации, которое необходимо для кодирования
дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней
громкости цифрового звука можно рассчитать по формуле N = 2b. Пусть глубина кодирования звука составляет 16 битов,
тогда количество уровней громкости звука равно:

N = 2b = 216
= 65 536.

В процессе кодирования каждому уровню громкости звука
присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет
соответствовать код 0000000000000000, а наибольшему – 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем
более качественным будет звучание оцифрованного звука. Самое низкое качество
оцифрованного звука, соответствующее качеству телефонной связи, получается при
частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и
записи одной звуковой дорожки (режим “моно”). Самое высокое качество
оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте
дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи
двух звуковых дорожек (режим “стерео”).

Необходимо помнить, что чем выше качество цифрового звука,
тем больше информационный объем звукового файла.

Задачи для
самостоятельной подготовки
.

1. Рассчитайте  объём 
монофонического  аудиофайла  длительностью 
10 с  при  16-битном 
кодировании  и  частоте 
дискретизации 44,1 к Гц. 
(861  Кбайт)

2. Производится двухканальная (стерео) звукозапись с
частотой дискретизации 48 кГц и 24-битным разрешением. Запись длится 1 минуту,
ее результаты записываются в файл, сжатие данных не производится. Какое из
приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному
в мегабайтах?

 1)0,3   2) 4   3) 16   4) 132

3.
Производится одноканальная (моно) звукозапись с частотой дискретизации 11 кГц и
глубиной кодирования 24 бита. Запись длится 7 минут, ее результаты записываются
в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее
близко к размеру полученного файла, выраженному в мегабайтах?

 1) 11     2)
13    3) 
15              4)  22

4.
Производится двухканальная (стерео) звукозапись с частотой дискретизации 11 кГц
и глубиной кодирования 16 бит. Запись длится 6 минут, ее результаты
записываются в файл, сжатие данных не производится. Какое из приведенных ниже
чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1)
11                2) 12           3) 
13         4)  15

5. При 
16-битном  кодировании,  частоте 
дискретизации  32 кГц  и 
объёме моноаудиофайла 700 Кбайт время 
звучания  равно:

                          1)
20 с             2) 10 с             3) 1,5 мин                  4) 1,5 с

6. Одна минута
записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой
платы – 8. С какой частотой дискретизации записан звук?

7. Аналоговый звуковой сигнал  был 
дискретизирован  сначала  с 
использованием  256 уровней  интенсивности 
сигнала  (качество  звучания 
радиотрансляции),  а  затем 
65 536 уровней (качество звучания аудио-
CD). 
Во  сколько  раз 
различаются  информационные  объёмы 
оцифрованного  звука?

                          1)
16                2)
24               3) 4                 4) 2

Литература.

  1. http://wiki.iteach.ru/images/f/fe/Лазарева_примеры_реш_задач.pdf
  2. http://kpolyakov.narod.ru/school/ege.htm
  3. http://fipi.ru/view/sections/217/docs/514.html
  4. Диагностические
    и тренировочные работы МИОО 2011-2012 http://www.alleng.ru/d/comp/com_ege-tr.htm
  5. http://festival.1september.ru/articles/103548/
  6. http://www.5byte.ru/9/0009.php
  7. Информатика. Задачник-практикум в 2 т. /Под ред. И.Г. Семакина,
    Е.К. Хеннера: Том 1. – Лаборатория Базовых Знаний, 2008 г. – 304 с.: ил.
     
  8. Практикум по информатике и информационным
    технологиям. Учебное пособие для общеобразовательных учреждений / Н.Д.
    Угринович, Л.Л. Босова, Н.И. Михайлова. – М.: Бином. Лаборатория Знаний, 2002.
    400 с.: ил.

Eduard

Гуру

(3963)


5 лет назад

открой через winamp. (сведения о файле)

Иннокентий СемьУченик (140)

5 лет назад

А встроенными средствами Виндоус это возможно?

А в XP это – ГДЕ?

“В Виндоус ХР с этим было проще: нажимаешь свойства файла и там всё видно” – да вроде не видно!
(всё то же MediaInfo использую)
Что за “встроенные средства Виндоус”?

Пользователь удален

Профи

(739)


5 лет назад

Если установить K-Lite codec pack, то при нажатии по любому медиа файлу правой кнопкой, выбор из меню MediaInfo, будет доступно много информации в том числе частота дискретизации

Добавить комментарий