Anton1980
Почётный Глобальный
Ветеран
Карма: 2027
Offline
Пол:
Сообщений: 800 Пригласил: 0
Jedem das Seine...
|
|
Музыкальные форматы: Полезная информация
« : 06 Июля 2008, 10:39:36 » |
|
Здесь выкладываем только собственно техническую информацию о "звуке" и все, что с ним связано. Для программ и софта есть специальный раздел.
История формата mp3 Вступление
Этот самый популярный на сегодняшний день цифровой формат аудиосжатия, был разработан несколько лет назад крупным немецким институтом . Европейская корпорация THOMSON активно поддержала новоявленный формат и приложила все усилия к его быстрейшему распространению. В частности при ее поддержке новичок стал одним из стандартов аудиосжатия семейства MPEG1, MPEG2 и получил название MPEG Layer3 или более привычное нам MP3.
Революция звука
Появление этого формата на свет уместнее всего назвать тихой революцией. Революцией — потому что до MP3 ни один формат звуковых файлов не мог обеспечить такое качество при таком относительно небольшом размере. Единственный на тот момент сетевой формат .RA (real audio) иначе чем издевательством над слухом не назовешь. MPEG Layer3 задумывался именно как „убийца“ этого убогого монополиста, великана на глиняных ногах. MP3 — это формат, разработанный специально для сети Internet, для быстрой пересылки качественного звука куда угодно. Именно поэтому MP3 является потоковым форматом, что это значит будет рассмотрено в дальнейшем. Способность этого алгоритма сжатия уменьшать размер звуковых файлов практически без потери качества, выглядела по тем временам совершенно фантастически. Ведь даже при кодировании с максимальной шириной потока (bitrate) равной 320 kbs (килобит в секунду), а это качество звука практически неотличимое от оригинального, размер исходного WAV файла уменьшается в четыре раза!
Да, это была революция, но очень странная революция. Ведь этот уникальный алгоритм в начале своего существования висел буквально на волоске. Полное отсутствие рекламы, никаких проигрывателей музыки данного формата, кроме фирменного от Fraunhofer IIS, который отличался крайней убогостью дизайна, жутким управлением и непомерными системными требованиями. Прибавьте ещё и колоссальные аппетиты самих разработчиков, которые хотели за свои кодеки (CODEC — COder/DECoder) довольно немалые суммы (схожая ситуация сейчас с некоторыми форматами семейства AAC) и отсутствие музыки как таковой, в отличие от солидных залежей музыки в формате RA. Эти факторы вполне могли загубить новорожденного сразу же после родов. И все любители хорошей музыки должны сказать огромное спасибо тем известным и безымянным разработчикам freeware MP3 CODEC, которые не дали создателю этого формата фирме Fraunhofer IIS из-за своей маркетинговой глупости и жадности погубить гениальное творение.
Так же следует отметить ту важную роль, которую сыграл популярный проигрыватель WinAMP в распространении формата MP3. Этот плеер первым предоставил то удобство, которого так не хватало фирменным проигрывателям. Потом, как я уже говорил, этот формат заметила компания THOMSON, и с этого начался победный марш MP3 по всему миру.
МР3 изнутри: психофизиология звука
Данный формат использует крайне сложный алгоритм кодирования. В отличие от обычных архиваторов, которым нужно ухитрится сжать информацию таким образом, чтобы после извлечения из архива в ней не изменилось ни одного бита, MP3 преследует несколько иные цели. Помимо математических алгоритмов сжатия, в этом формате присутствует так же сложнейший алгоритм удаления ненужной звуковой информации, основанный на психолого-физиологических особенностях организма человека. Попытаюсь остановится на данном моменте несколько подробнее.
Как уже говорилось, MP3 является потоковым форматом. Это означает, что звуковая информация при кодировании разбивается на равные по продолжительности участки, которые называются фреймами. Все фреймы взаимно независимы. Каждый из этих фреймов кодируется отдельно, со своими параметрами, и имеет заголовок, в котором эти параметры описаны. При воспроизведении последовательность декодированных фреймов и порождает непрерывное звучание записанного звука.
Какие преимущества дает данный подход? Во-первых, возможность перемотки, так как возможен легкий переход к произвольному фрейму, и воспроизведение звука именно с этого места. Во-вторых, именно эта структурная особенность и делает MP3 по-настоящему сетевым форматом. Загрузив первые несколько фреймов в оперативную память или дисковый кэш, проигрыватель начинает их воспроизводить, при этом одновременно подгружая новые фреймы, чем достигается непрерывность воспроизведения. И наконец, если вы не смогли целиком скачать MP3 файл из сети Internet, то ничего страшного, музыку всё равно можно будет слушать, просто проигрыватель дойдет до того места, на котором оборвалась связь, и остановится.
Так вот, вернемся к нашим фреймам. При высоком качестве MP3, а это bitrate ~320 кbs, для кодирования фреймов применяются только математические алгоритмы сжатия. Качество при этом совершенно не страдает, но и размер уменьшается всего в четыре раза, то есть коэффициент сжатия такой, какой дал бы обычный архиватор; именно поэтому файлы формата МР3 практически не ужимаются обычными архиваторами. При уменьшении полосы пропускания (bitrate) до 256 kbs и ниже, в дело вступают те самые алгоритмы удаления „ненужных“ звуков, которые основаны на особенностях восприятия звука человеческим ухом, так называемая „психоакустическая модель“. Процессы удаления „ненужных“ звуков называются квантованием. Чем меньше bitrate, тем жестче идет квантование.
По каким же критериям оценивается „нужность“ и „ненужность“ звуков? Подавляющее число кодеков выбрасывает звуки, которые считаются выходящими за порог слышимости человека. При этом за значение порога, так сказать de facto, принимается величина равная 16kHz. Несмотря на то, что этот порог признан азбучной величиной и вписан во все учебники по физике, этот подход неверен. Люди весьма разнообразны по своим физиологическим особенностям. Кроме того, нужно учитывать, что у молодежи слуховой порог гораздо выше, чем у пожилых людей, и запросто может превышать эту среднестатистическую величину. Так же многое зависит от интенсивности сигнала. Следовательно, удаление частот выше 16kHz абсолютно неприемлемо для высоких битрейтов претендующих на CD качество, но вполне уместно для низких битрейтов, где качество приносится в жертву размеру.
Другим критерием, по которому оценивается „ненужность“ звука, является условие, основанное на такой особенности человеческого слуха, как неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, причем этот уровень различен для разных частотных диапазонов. При использовании психоакустической модели кодирования MP3 CODEC автоматически выбрасывает маломощные, неслышимые частоты. К сожалению, опять таки, люди не одинаковы и те, кто в состоянии различить именно эти частоты, часто жалуются на потерю качества звучания при кодировании, тогда как среднестатистическое большинство этого не замечает.
Но самой главной особенностью психоакустической модели кодирования MP3 является так называемый эффект маскирования. Именно благодаря этому эффекту удается так сильно сжимать исходные аудиоданные. Суть этого эффекта в том, что слабый сигнал одного диапазона частот зачастую маскируется более мощным сигналом соседнего диапазона, если он присутствует в аудиозаписи, или мощным сигналом, предыдущего фрейма. Этот сильный сигнал вызывает временное понижение чувствительности уха к сигналу текущего фрейма. По сути, имеет место явление „временного оглушения“. Для каждого звукового диапазона определяется величина маскирующего эффекта, создаваемого сигналом соседних диапазонов и сигналом предыдущего фрейма. Если маскирующий сигнал превышает мощность сигнала текущего диапазона, то данный диапазон сигнала не кодируется, что позволяет психоакустической модели удалить часть данных из этого фрейма. Для оставшихся данных каждого диапазона определяется, сколькими битами на фрейм мы можем пожертвовать, чтобы потери от дополнительного квантования были ниже величины маскирующего эффекта. Несомненно, все отмечали, что звук, кодированный при низких битрейтах, отличается крайней нечеткостью и глухостью. Это происходит из-за того, что при потере одного бита информации в общее звучание вносится шум квантования величиной порядка 6 dB.
Все эти ухищрения суммарно называются адаптивным кодированием. Используя тот факт, что подавляющее большинство людей не обладают идеальным слухом, технология адаптивного кодирования позволяет существенно уменьшить размер кодируемого файла выбросив наименее значимые с точки зрения слухового восприятия детали звучания.
Надо заметить, что в случае низких битрейтов кодирование начинается с адаптивного кодирования. После дополнительного квантования формируется итоговый поток, который затем и сжимается по алгоритму Хаффмана (аналогично алгоритму RAR).
Чем замечателен этот формат, так это тем, что степень сжатия, то есть соотношение размер/качество полностью во власти пользователя. Ширина потока (bitrate) способна изменяться от наибольшего значения в 320 kbs, до 64 kbs и ниже, соответственно варьируется и размер.
С технологиями сжатия используемых в MP3 CODEC мы ознакомились, настало время поговорить о разных битрейтах.
Качество требует жертв
Очевидно, что различные битрейты даже одного и того же CODECa дают далеко неодинаковое качество. Причём, разные люди совершенно по-разному оценивают качество приемлемости одних и тех же битрейтов, высказывая свое собственное сугубо субъективное мнение. При оценке качественности звучания зачастую возникает путаница, так как многие путают факт наличия низкого или высокого уровня шумов с высоким или низким качеством сигнала. Такой дуболомный подход в принципе неверен, так как это характеристика обычной, некомпьютерной аппаратуры, которую некоторые лихо по аналогии переносят на цифровое аудио, забывая, что для компьютера это всего лишь характеристика конкретного программного MP3 плеера. Отсюда следует, что в некоторых случаях, сменив плеер можно существенно улучшить качество воспроизведения.
Так же, почему-то многие пользователи считают, что мнение профессионалов, так сказать „дегустаторов“ звука, обладающих хорошо развитым слухом и чувством фальши, не является авторитетным, а важно мнение середнячков со слухом отравленным дешевой аудиоаппаратурой уровня ESS. Это мнение может повлиять только на звание которое дают тому или иному CODECу — например „массовый“, „народный“, „популярный“, но при оценке качественности кодировщика оно абсолютно неуместно.
При разработке формата MP3 его разработчики наняли команду профессиональных звуковых „дегустаторов“, которые прослушали определенный набор тестовых композиций закодированных с разными битрейтами. Профессионалы единогласно указали, что битрейт 256 kbs в большинстве случаев сохраняет качество звучания, которое практически не отличается от исходного. И так же единодушно указали, что уже битрейт 192 kbs довольно ощутимо отличается от оригинала и не может претендовать на непогрешимость.
Но вы должны обратить внимание на оговорку „в большинстве случаев“ которую эксперты сделали для битрейта 256 kbs. В некоторых случаях, особенно при кодировании классической музыки этот битрейт проявляет себя не лучшим образом.
Если вы хотите точного соответствия сжатого файла оригиналу, пользуйтесь максимальным для кодирования CD Audio битрейтом — 320 kbs. Коэффициент сжатия 4:1, для битрейта 256 kbs — 6:1. Размер несколько больше, зато качество смело можно считать непогрешимым.
Многие пользователи-меломаны уже создали себе обширные фонотеки на CDR или просто на винте, используя MP3 256 kbs и 320 kbs. Кстати, именно в этой связи повсеместно приобрели огромную популярность домашние компьютеры, оснащенные приводами CD-RW (пишущий CD-ROM).
Но самый популярный на текущий момент все же битрейт 128 kbs, который весьма быстро занял место формата RA. Причина такой популярности — в относительно небольшом размере (сжатие 12:1), что является определяющим фактором в условиях медленной передачи данных и дороговизны услуг провайдеров. Так же по размеру файла MP3 легко определить продолжительность звучания. У этого битрейта 1 минута звучания занимает примерно 1 мегабайт. Но качество у этого новоявленного „сетевого короля“ на СD даже не претендует. Это качество средней аудиокассеты. В сети Интернет можно в основном найти MP3 только с битрейтом 128 kbs, MP3 с этим битрейтом и создавался первоначально как сетевой формат.
Путь к победе: триумф звука
После долгой раскачки данного формата, постепенно тысячи и тысячи пользователей наконец его оценили. Как грибы после дождя появилось множество сайтов, специализирующихся исключительно на распространении музыки в модном формате. Разумеется, практически все MP3-файлы были нелегальны или полулегальны, так как до пользователей не доходило, что распространяя купленную за свои деньги и переведенную в MP3 формат музыку, они нарушают законы об авторских и смежных правах. Или доходило, но… Но вот поймать, и тем более наказать нелегальных распространителей оказалось невероятно сложно. Более того, благодаря небольшому размеру MP3 с bitrate 128 kbs оказалось возможным записать на один компакт-диск не 74 минуты музыки как раньше, а более 650 минут! Этим немедленно воспользовались пираты. Они стали производить диски типа „все альбомы хитовой группы на одном диске“. Аудиозаписывающие компании стали нести убытки. Зачем покупать один альбом, если за те же деньги можно купить десять альбомов на одном CD?
Попытку побороть нелегальное распространение музыки MP3 предпринял звукозаписывающий гигант RIAA. Но было уже поздно. MP3 индустрия достигла невиданного размаха. Стали появляться аппаратные мини-плееры с памятью на 32 мегабайта и возможностью подключения к компьютеру, их уже появилось более 40 моделей. Плееры для автомобилей на базе небольших по объему (1Гб) винчестеров. Даже звуковые карты с аппаратной поддержкой MP3. С этой волной бороться стало невозможно. MP3 стал первым признанным форматом хранения аудиоданных после CD-Audio. Это была победа. Эта музыка будет вечной...
Пусть MP3 уже не лучший. Ему на смену идут новые форматы: семейство AAC (advanced audio codec), VQF, PAC (perceptual audio codec). Но он был первым. Кроме того, многочисленная аудитория пользователей MP3 весьма консервативна, MP3 удалось глубоко поразить своих поклонников, тогда как его конкуренты способны их разве что слегка удивить. Так что, этому стандарту уготованы еще долгие годы существования, прежде чем его сменит более достойный.
Глоссарий
- *MP3 (MPEG Layer3) — цифровой формат мультимедиасжатия семейства MPEG, предназначенный исключительно для кодирования звука. Имел предшественников в лице МР1 и МР2, отличатся высокой сложностью алгоритма, как следствие высокими требованиями к системным ресурсам. Лучший в своем классе по соотношению размер/качество.
- *CODEC — расшифровывается как COder/DECoder. Это не что иное как совокупность алгоритмов кодирования и декодирования звука.
- *Bitrate — ширина потока. Количество бит, использующиеся для кодирования звукового потока. Измеряется в kbs, т. е. число килобит в секунду.
- *Квантование — процесс удаления частот, не воспринимаемых обычным человеческим слуховым аппаратом (ухом).
- *CD Audio — старейший формат цифрового звука, существует более 20 лет. Параметры 44 Khz, 16-bit стерео.
- *RA — формат, расшифровывается как Real Audio. Первый сетевой формат, обеспечивающий передачу и воспроизведение звука в реальном времени. Если сравнивать с МР3, то имеет битрейт 8 и 16 kbs, и соответственно ужасное качество звука.
Что такое VBR (Variable Bit Rate)?
Variable Bit Rate (VBR) - метод кодирования, гарантирующий высокое качество звука на протяжении всего времени звучания сжимаемых данных. Это достигается путём ''интеллектуального'' выделения битов информации во время кодирования. Во время кодирования, когда кодировшик натыкается на ''сложный'' участок (к примеру, звучание с очень широким стерео-разносом), он выделяет дополнительные биты данных для того, чтобы звук был передан (сжат) качественно. Когда же встречается участок тишины, либо два канала с минимальными различиями, кодирование производится меньшим количеством информации. В результате, получившийся MP3-файл будет состоять из множества отрезков, закодированных с разными значениями потока. Для того, чтобы лучше понять отличие VBR-кодирования от обычного (CBR - Constant Bit Rate) посмотрите на следующие выкладки: когда вы сжимаете какую-либо композицию с качеством потока 128 кБит в секунду, вы заставляете кодировщик производить 128 тысяч бит на каждую секунду звучания сжимаемой композиции. Если же применить кодировщик с поддержкой VBR-технологии, то в каких-то местах звук будет сжат с потоком, превышающим 128 кБит/секунду, а в каких-то - с меньшим значением потока. Кодируя оркестровую или инструментальную музыку, речь или им подобные звучания, не содержащие резких звуковых переходов (как по громкости, так и по частоте, и по стереоканалам) вы получите MP3-файл меньшего размера, чем тот, который бы получился в результате работы обыкновенного кодировщика. Несомненным плюсом VBR-кодирования является то, что базируется она на внутренних возможностях MP3-формата, не добавляя по сути ничего нового - просто до сегодняшних дней никто этих возможностей в полной мере не использовал. Соответственно, полученные MP3-файлы вы сможете проиграть на любом обыкновенном MP3-плейере. Проблемы могут возникнуть иногда только при определении длительности звучания композиции - но на качество и полноценность воспроизведения это не влияет.
|
|
« Последнее редактирование: 06 Сентября 2009, 07:25:00 от Anton1980 »
|
Записан
|
|
|
|
Anton1980
Почётный Глобальный
Ветеран
Карма: 2027
Offline
Пол:
Сообщений: 800 Пригласил: 0
Jedem das Seine...
|
|
Re: Полезная информация
« Ответ #1 : 06 Июля 2008, 10:52:16 » |
|
Статья взята из журнала Хакер, номер #078
OGG VORBIS vs. MP3: кто кого похоронит?
Holywar, или Великая битва форматов
Количество интересной музыки с течением времени все возрастает, хранить аудиодиски в порядке становится все сложнее, они занимают слишком много места. Обычный для многих выход — коллекционирование звука в mp3. Пока что спасал. Однако слегка настораживает тот простой факт, что формату mp3 уже сто лет в пятницу, а достойной альтернативы ему как-то до сих пор не было. Или она существует, но пока нормального распространения не получила? Последний раз я задавался подобным вопросом совсем недавно, перепробовал множество программ, переслушал огромное количество файлов с кодированной музыкой и все-таки свой выбор сделал. Не стоит считать его единственно верным, хотя некоторые доводы в его защиту я все же приведу.
Теоретическая часть подготовки юного аудиофила Итак, для начала немного теории: для того чтобы добавить к своей музыкальной коллекции очередной компакт-диск, тебе потребуется вечная пара специальных программ — граббер и кодек. Граббер целиком и полностью несет ответственность за корректное извлечение музыкального файла с компакт-диска на винчестер компьютера, а кодек отвечает за компрессию уже извлеченного файла в компактный формат. Вот тут уже начинаются проблемы множественного выбора. И грабберов, и кодеков настолько много, что человек, не разбирающийся в данном вопросе, может совсем отчаяться.
Отчаиваться, конечно, не стоит, особенно если учесть, что практически любой формат компрессии звука придуман, чтобы быть распространенным как можно шире. Соответственно, управление такого рода программой в борьбе за новых и новых пользователей разработчики стремятся сделать простым и доступным. А пользователи заинтересованы в том, чтобы предложенная им программа могла бы на выходе выдавать файлы небольшого размера, но настолько качественные, чтобы среднестатистический слушатель не замечал разницы с оригиналом в формате wav. Задача этого обзора — выбрать из множества программ наиболее достойную пару граббер-кодек и наглядно продемонстрировать их преимущества перед потенциальными пользователями. Программы будут выбираться по целому ряду признаков, среди которых наивысшее качество, бесплатность и отсутствие долгой возни с настройками. Приступим.
Аудиоэкстракция Как ты уже знаешь, кодирование звука начинается с его извлечения с CD. Это и есть главная задача программы-граббера. Разумеется, речь идет об экстракции звука в lossless-виде на этапе «музыкальный диск — винчестер компьютера», а значит, цифровой поток с аудиодиска должен быть извлечен так, чтобы, располагаясь в виде wav-файла на винчестере, до последнего бита соответствовать содержимому CD. В противном случае в возне с граббингом нет вовсе никакого смысла. Вот именно по этой причине я рекомендую использовать в качестве программы-экстрактора звука с диска EAC, или EXACT AUDIO COPY. Программа бесплатная, лежит по адресу .
Почему же EAC? Потому что авторы программы поставили во главу угла КАЧЕСТВО работы, до которого многим другим подобным программам далеко. EAC использует метод считывания Secure, читая все секторы компакт-диска по крайней мере дважды, в то время как другие программы довольствуются одноразовым считыванием, допуская ошибки. Бывает, что EAC не в состоянии считать данные с компакта, который сильно поцарапан или заляпан отпечатками жирных пальцев. В таком случае программа повторяет чтение до 82 раз, если же после всех попыток данные не удается считать, EAC сообщает об ошибке и указывает точное местонахождение сбоя, дабы ты смог самостоятельно прослушать кусок трека на предмет выявления звуковых артефактов. Иными словами, скорость работы ЕАС не так высока, как у некоторых конкурентов, зато программа перечитывает любой подозрительно сбойный сектор на CD и делает это до тех пор, пока не прочтет его правильно.
Готовим ограбление Для того чтобы добиться от программы полноценной работы, ее необходимо должным образом настроить, обучив EAC оптимальным параметрам чтения именно твоего CD-привода. Основное требование программы — нормальный CD-драйв (у меня отлично работает на стареньком ASUS CD-S400). При первом же запуске после нажатия F10 программа самостоятельно протестирует CD-привод на профпригодность и в дальнейшем будет пользоваться данными, полученными в итоге операции AUTODETECT. Прекрасно, если твой привод знаком с распознаванием и коррекцией ошибок чтения C2 pointers. Наличие С2 хорошо тем, что, используя такой механизм выявления ошибок, программа может вовремя сообщить о том, что «медицина бессильна», а не скромно промолчать, как делают многие другие грабберы.
Каждый CD-привод извлекает цифровые звуковые данные с некоторым смещением, которое называется sample offset. По ряду причин экстракция трека происходит не с самого его начала, а с начала трека + offset или с начала трека - offset. Если учитывать размер смещения при извлечении данных с диска, то на любом приводе получим абсолютно идентичный результат. ЕАС умеет учитывать смещение, но потребуется audio-CD из базы, доступной на сайте разработчиков EAC, чтобы предложить программе сравнить данные с образцом, данные которого в EAC уже встроены. В процессе настройки программы стоит активировать поддержку функций CDDB — в таком случае софтина попытается самостоятельно определить, что за диск ей предложили, и сама пропишет в готовых файлах необходимые тэги.
Тюнинг для гуру Перед тем как начать извлекать музыку, отключи ненужные функции программы и включи только необходимые. Например, программа позволяет установить принудительную нормализацию громкости звука. Тогда вся сграбленная музыка будет иметь примерно одинаковую громкость, но строго говоря, нормализация — это дополнительные искажения исходного сигнала, а точнее — передискретизация с новым уровнем сигнала, что не способствует получению файлов максимально лучшего качества. В EAC хватает вкладок с функциями, разобраться с ними несложно, если хотя бы немного знаешь английский. Если не знаешь — добро пожаловать на русскоязычный сайт , где программа разобрана подробно и профессионально. Для совсем затрудняющихся имеется пошаговый мастер настроек, с ним точно не ошибешься. Теперь остается самый последний этап — установка кодека, который будет пахать из оболочки граббера EAC. Процесс очень незамысловатый: качаешь любой кодек в виде dll-библиотеки или exe и помещаешь файл в системную папку программы. Запускаешь EAC и на вкладке COMPRESSION OPTIONS выбираешь подходящий кодек. Если ты используешь внешний кодек в виде exe-файла, то EAC позволяет прописывать для него специальные параметры, которые мы рассмотрим ниже применительно к кодеку LAME.
Кодируем звук Если с программой-граббером все ясно и довольно однозначно, то процесс выбора кодека способен довести до безумия и истерики любого меломанствующего любителя. Из тех программ, что встречались и встречаются более или менее часто, можно запросто перечислить штук 15: MP3 Producer by Fraunhofer, Fraunhofer IIS MPEG Layer 3 codec for Windows, l3Enc by Fraunhofer, Audio Catalyst, Xing MPEG encoder, Lame encoder, Blade encoder, TwinVQ Encoder, Yamaha SoundVQ, Liquifier Pro, Sorenson Squeeze, FAAC, PsyTel AAC encoder, Windows Media Encoder, Dolby encoder by Digigram, TTA, MPegPlus Encoder, QDesign MP2 ACM, ATRAC3 ACM codec by Sony, AudioVeda и так далее.
Прежде всего обратим внимание на тот факт, что компрессия звука — это ВСЕГДА сжатие с потерями (lossless-кодеки не рассматриваем). При компрессии звука мы в каких-то пределах жертвуем его качеством, выигрывая в размере файла. Применение сжатия звука с потерями, на мой взгляд, допустимо, если не влечет за собой явно слышимых искажений. То бишь фронт работ для компрессии музыки открывается при условии, что потребитель желает добиться полного или почти полного субъективного сохранения качества исходного звука при экономии места, занимаемого этим самым звуком. Дальше возникает вопрос о выборе степени сжатия звуковой информации, то есть о выборе битрейта, ведь компрессия звука допускает потерю качества в процессе кодирования. Чем выше степень сжатия, тем значительнее потери в качестве.
Но и здесь есть возможность добиться неких результатов, способных утешить любителей качественного кодированного звука. Дело в том, что человеческий слух можно в некотором смысле одурачить, используя хорошую психоакустическую модель mp3-кодека. В таком случае при правильной настройке программ (граббер плюс кодек) можно создавать звуковые файлы небольшого размера, но на слух неотличимые от исходника даже натренированным ухом.
Lame — передовик качества До сих пор лично я пользовался для составления своей музыкальной коллекции кодеком Lame (, производя гигабайты файлов mp3 с variable bitrate. Готовые, свежескомпилированные версии Lame можно раздобыть на . Lame написан группой энтузиастов, которые придерживались принципов открытых исходных кодов, а за основу был взят свободно распространяемый демонстрационный код от ISO. Кодек привлекателен возможностью тонкой настройки всего, что только может быть настроено, поддерживает VBR и по итогам множества тестов частенько признается лучшим кодеком для высоких битрейтов (192 и выше). До сих пор я считаю его лучшим mp3-кодеком. Психоакустическая модель рассматриваемого кодека в настоящее время доведена до ума и работает не за страх, а за совесть. Если в ранних версиях кодека иной раз приходилось принудительно ее отключать, то сейчас подобная необходимость совершенно отпала. Вообще-то, психоакустическая модель — понятие виртуальное, суть которого заключается в простом посыле: человеческий слух — инструмент, конечно, тонкий, но не способный воспринимать ВСЕ звуки диапазона. Известно, что ухо наиболее чувствительно в среднем диапазоне частот 2 – 5 кГц, в других же диапазонах чувствительность зависит от уровня громкости. Психоакустическая модель как раз и отвечает за то, чтобы после кодирования ВСЕХ звуков разделить частотный спектр на части, выявить и вычистить из потока именно те звуки, которые лежат за порогом чувствительности и все равно не могут быть распознаны органами слуха.
Большой плюс Lame заключается в том, что в качестве оболочки для него удобно использовать уже знакомый граббер — ExactAudioCopy. Кодируя музыку с помощью Lame, можно выбрать несколько различных режимов стереосигнала: stereo, dual channel и joint stereo. В режиме stereo оба канала кодируются отдельно, а кодер выделяет для каждого из них разные значения потока, занимаясь при необходимости коррекцией величины распределения потока одного из каналов за счет другого. Способ хорош тем, что позволяет не тратить драгоценное место на кодирование содержащейся в канале тишины, в то время как в другом канале есть сигнал. В dual channel для каждого канала выделяется ровно половина потока, то есть сигнал кодируется как два отдельных моносигнала. Наиболее же часто используемый режим для обычного пользователя — joint stereo, принцип работы которого предусматривает разложение стереосигнала на основную составляющую и разностную. Основная часть, по сути, является моноканалом, образованным из двух исходных каналов, и несет основную же информацию, а разностная часть поставляет остальную инфу, позволяющую восстановить исходный стереозвук. Основная и разностная составляющие сжимаются отдельно, а психоакустические алгоритмы выбирают, что в данный момент нужнее — пространственная картина, качество передачи информации или кодирование в режиме двух раздельных каналов. В итоге получаем выигрыш в размере файла при сохранении достойного уровня качества.
Продолжение статьи ниже...
|
|
|
Записан
|
|
|
|
Anton1980
Почётный Глобальный
Ветеран
Карма: 2027
Offline
Пол:
Сообщений: 800 Пригласил: 0
Jedem das Seine...
|
|
Re: Полезная информация
« Ответ #2 : 06 Июля 2008, 10:53:02 » |
|
Ogg Vorbis — новичок или убийца mp3? В последнее время люди, пристально следящие за развитием дел в области компрессии звука, все чаще обращают свое внимание на новый формат сжатия звука — Ogg Vorbis, призванный заменить собой все платные патентованные аудиоформаты и создать полностью открытую систему мультимедиасистем. Формат создан компанией Xiphophorus (компания названа по имени аквариумной рыбки Xiphophorus Helleri, а формат Vorbis назван в честь героя книги Тэрри Пратчетта «Маленькие боги»). Кодек Ogg Vorbis вышел в свет в июне 2000 года, а относительно недавно компания Xiph.Org объявила о появлении окончательной версии формата — 1.0. Качество кодирования Ogg Vorbis, который использует переменный битрейт, измеряется обычно при помощи шкалы Quality с параметрами от 1 до 10. Для сравнения: quality 0 сопоставимо с качеством mp3 64 Kbps, 5 — приблизительно 160 Kbps, 10 дает приблизительно около 400 Kbps. Из сравнения становится ясно, что для большинства пользователей будет вполне достаточно установок quality 5-6. Сильной стороной формата является масштабируемость — возможность изменения битрейта потока без необходимости декодирования.
Некоторое время назад я не собирался пересаживаться с mp3 на ogg хотя бы потому, что придется заново перенастраивать всю систему производства компрессованной музыки, но выяснилось, что новый кодек так же просто прикрутить к грабберу EAC, как и Lame, после чего ogg будет доступен во вкладке кодеков. Это значит, что процесс кодирования музыки в формате ogg абсолютно ничем не отличается от такого же, дающего на выходе файлы mp3. Формат позволяет сохранить тэги с русскими буквами в кодировке UTF-8, что однозначно решает проблему с использованием ОС, отличных от Windows.
При примерно равных битрейтах размер файлов ogg и mp3 отличается в пользу первого. Для сравнения был закодирован трек «Apache-Scripture» с диска «Cafe del Mar — Volumen Ocho», размер которого составил в несжатом состоянии 49 Мб. С помощью Lame получился mp3-файл со средним VBR-битрейтом 211 Kbps и размером 7,32 Мб, а Ogg Vorbis при битрейте 175 Kbps выдал файл размером 6,06 Мб, звучащий субъективно приятнее, чем mp3. C некоторых пор я взял за правило не доверять всяческим сонограммам и ломаным линиям АЧХ (о, амплитудно-частотную характеристику я проходил в прошлом семестре! — Прим. Бублика), а полагаться только на собственные уши. Но если тебе необходима наглядная демонстрация — загляни на и убедись в том, что время mp3 начинает уходить.
В ogg вся сила! Предположу, что у формата Ogg Vorbis большое и светлое будущее, особенно если разработчики не сбавят темпа. Новый формат поддерживается рядом популярных программных плееров. Со всем софтом, поддерживающим этот формат, можно познакомиться на официальном сайте по адресу . Радиостанция BBC еще в 2002 году начала интернет-вещание, передавая потоковое аудио в формате Ogg Vorbis. Мой портативный CD-MP3 плеер iRiver с новой прошивкой уже поддерживает этот аудиоформат. Медиа-индустрия все пристальнее поглядывает в сторону ogg, помня, что стоимость лицензии на использование mp3-кодека составляет около 8 долларов за каждое устройство, в котором он применен, а ogg совершенно бесплатен. Не повод ли это подумать о надвигающихся помпезных торжествах по поводу появления нового лидера среди аудиоформатов?
Из формата в формат Убедившись самостоятельно в том, что качество ogg превосходит качество mp3 с теми же битрейтами, у тебя может возникнуть мысль о переконвертации файлов из формата в формат. Делать этого ни в коем случае не стоит. Фокус в том, что кодеки имеют принципиально разные психоакустические модели, и каждый из них вырежет разные части аудиосигнала, соответственно, после переконвертации качество mp3, обращенного в ogg, значительно ухудшится. Говоря строго, любое перекодирование влечет за собой потерю качества звучания, и необходима эта процедура только в тех случаях, когда размер файлов имеет критическое значение. Как правило, наиболее распространенной операцией с перекодированием mp3 является процесс понижения битрейта с целью получения файлов меньшего размера. Лично мне понижение битрейта было необходимо для того, чтобы сбросить на болванки многогигабайтный архив аудиокниг, большинство из которых имело размер около 800 Мб, никак не помещаясь на стандартную 700 Мб CDR-матрицу.
Для понижения битрейта необходимо указать программе в настройках, из какого формата в какой конвертировать файлы и каков ожидаемый на выходе результат. Для mp3 можно указывать желаемые форматы, настроить mono/stereo/joint stereo звучание, а для ogg, например, качество результирующего файла можно задавать ползунком, не цепляясь за фиксированные битрейты. Далее подлежащие конвертации файлы выделяются в окне программы мышью (можно сохранять порядок папок и каталогов), и остается только отправиться пить чай, ожидая, пока программа справится с предложенной работой. Хочу отметить, что справляется она обычно замечательно, сохраняя все тэги и структуру папок, довольно шустро и внимательно обрабатывая файлы один за другим.
Эпилог Вот так, чувак! Стоит задуматься о том, что же мы будем иметь в ближайшем будущем. По-моему, ogg очень скоро вытеснит все популярные ныне музыкальные форматы, если только их разработчики не предпримут в срочном порядке каких-либо серьезных шагов.
Возможности EAC Помимо своей главной задачи, с которой EAC справляется на отлично, программа умеет:
1) Работать с интерфейсом ASPI Windows 95/98/ME и Windows NT/2000.
2) Осуществлять операцию jitter correction (коррекция и синхронизация между
двумя треками во избежание щелчков или провалов, работает только при извлечении соседних треков).
3) Обнаруживать и корректировать ошибки чтения и потери синхронизации.
4) Копировать выбранную область аудиоданных, а не только трек целиком.
5) Автоматически понижать скорость при возникновении ошибок, с последующим ее повышением.
6) Поддерживать кодирование звука разнообразными внутренними и внешними кодеками, в том числе и на лету.
7) Корректно определять паузы между треками (gaps), выявлять тишину в паузах между треками и вырезать ее.
8. Автоматически создавать файлы CUE для программы CDRWin, включающие межтрековые паузы, индексы, атрибуты треков, коды UPC и ISRC.
9) Редактировать названия с использованием локальной и удаленной базы CDDB.
И вновь про Ogg Ogg — непатентованный и не нуждающийся в лицензировании аудиоформат с открытым кодом, обеспечивающий скорость от 16 до 512 Kpbs и частоту сэмплинга от 8 до 48 кГц. Ogg Vorbis принципиально близок к формату mp3, однако есть и отличия. Например, sample accurate, то есть кодек не допускает наличия смещений или потери сэмплов относительно друг друга. Формат Ogg Vorbis не ограничен двумя аудиоканалами (стерео) и способен поддержать до 225 отдельных каналов. Алгоритм Ogg Vorbis рассчитан на кодирование с переменным битрейтом (VBR), в заголовке файла может размещаться информация о песне, исполнителе и т.д., в описание можно вставить даже изображение. Если тебе попался файл с расширением ogg — знай, что это аудиофайл.
Пресеты Lame последних версий рассчитан на работу с пресетами — заранее определенными схемами настроек параметров. При использовании LAME совместно с EAC в настройках последнего можно указать необходимый пресет и получить требуемый файл без колдовства с командной строкой, а просто ориентируясь на привычное «удовлетворительно/хорошо/отлично». Каждый такой пресет был тщательно протестирован, и ты можешь вполне положиться на его внутренние настройки. Подробное описание пресетов можно получить, запустив кодек с параметром --preset longhelp, нас же в данный момент интересуют так называемые альтернативные пресеты, настроенные при помощи прослушиваний для получения максимального качества. Всего таких пресета три:
--alt-preset standard (в среднем 180-190 Kbps, отличное качество)
--alt-preset extreme (в среднем 220-240 Kbps, суперотличное качество)
--alt-preset insane (320 Kbps, максимально возможное качество)
Первые два пресета годятся для кодирования звука с VBR и по качеству между собой отличаются не сильно. Я рекомендую для своей музыкальной коллекции использовать именно два первых пресета, подключая второй лишь в случае, когда хочешь особенно тщательной проработки кодируемого музыкального материала. И ни в коем случае не дополняй стандартные пресеты своими параметрами — никто не отважится предсказать результаты.
|
|
« Последнее редактирование: 06 Июля 2008, 12:42:26 от Anton1980 »
|
Записан
|
|
|
|
karel333
ॐ मणि पद्मे हूँ
Глобальный модератор
Ветеран
Карма: 3563
Offline
Пол:
Возраст: 63
Семейное положение: Женат
Сообщений: 4219 Пригласил: 1
ом мани пад ме хум
|
|
Re: Музыкальные форматы: Полезная информация
« Ответ #3 : 11 Июня 2013, 15:15:13 » |
|
Расширение .m4a
Чем открыть m4a
Название формата по-русски Аудиофайл MPEG-4
Оригинальное название MPEG-4 Audio File
Разработчик: Apple
Категория Аудио файлы
Чем открыть M4A Nullsoft Winamp
Apple iTunes
Apple QuickTime Player
Windows Media Player
KSP Sound Player
NCH Swift Sound WavePad
Описание расширения
Apple Lossless (.m4a)
Это аудио кодек, разработанный Apple Inc, для сжатия цифровой музыки без потерь данных. Apple Lossless данные хранятся в контейнере MP4 с расширением .m4a. Хотя Apple Lossless имеет такое же расширение файла, как AAC, это не AAC, кодек схож с другими Lossless кодеками, такими как FLAC и др. Плеер iPod с док разъемом (не shuffle) и последней прошивкой может проигрывать файлы в формате Apple Lossless. Он не использует какие-либо управления цифровыми правами (DRM), но, с учётом характера контейнера, считается, что DRM может применяться к ALAC.
Тесты показали, что сжатые в ALAC файлы получаются примерно от 40 % до 60 % размера оригиналов в зависимости от вида музыки, подобно другим Lossless форматам. Кроме того, скорость, с которой он может быть декодирован, делает его полезным для устройств с ограниченной производительностью, такие как iPod.
|
|
|
Записан
|
|
|
|
karel333
ॐ मणि पद्मे हूँ
Глобальный модератор
Ветеран
Карма: 3563
Offline
Пол:
Возраст: 63
Семейное положение: Женат
Сообщений: 4219 Пригласил: 1
ом мани пад ме хум
|
|
Re: Музыкальные форматы: Полезная информация
« Ответ #4 : 04 Февраля 2014, 08:06:36 » |
|
Что такое DTS
DTS - формат хранения цифрового звука. Основным отличием DTS от CD является поддержка многоканальности. Они используется для хранения звука на DVD с фильмами и музыкой/концертами, как одна из звуковых дорожек для совместимости на DVD-Audio, в DTS-CD. DTS-CD не требуют наличия специального плеера для воспроизведения, нужен только обычный цифровой выход.
Конкурентом Dolby Laboratories в создании многоканальных форматов стала компания Digital Theater Systems, предложившая свой способ создания многоканальных саундтреков.
DTS, как и Dolby Digital, является системой 5.1, отличаясь от нее меньшей компрессией сигнала (4:1 против 11:1). Кинолюбители всего мира включились в конкурентную борьбу двух форматов, разделив между ними свои пристрастия. До сих пор неясно, кто победит в этой борьбе, однако большинство любителей музыкальных программ, записанных на DVD, предпочитают те из них, что имеют звуковое сопровождение в DTS.
Digital Theater Systems (цифровые системы для кинотеатров) - его официальное название DTS Digital Surround обычно сокращают до DTS. Подобно Dolby Digital, система DTS позволяет получить в домашних условиях 5.1-канальный окружающий звук. (DTS может также использовать схему каналов 7.1, которая отличается от предыдущей использованием двух дополнительных тыловых акустических систем.)
В формате DTS используется скорость цифрового потока 1'536'000 бит в секунду, что обеспечивает более высокое качество шестиканального звукового сигнала.
Название формата по-русски Аудиофайл DTS
Оригинальное название DTS Encoded Audio File
Разработчик: Digital Theater System
Категория Аудио файлы
Чем открыть DTS
Apple iTunes
CyberLink PowerDVD
VLC Media Player
Media Player Classic
Corel WinDVD
|
|
|
Записан
|
|
|
|
|