|
|
Предварительные замечания.
В "MPEG-мире" принято скорость потока видеоданных выражать не в мегабайтах/сек, а в килобитах/сек. Чтобы не смешивать разные скорости, все дальнейшие величины приводятся в килобитах/сек. Требования к качеству у всех разные. Наглядно это видно в "аудиомире": молодёжь (определённого рода, не буду углубляться в классификацию...) слушает бумбоксы за 200$ на дикой громкости и "торчит", а аудиофилы слушают компонентную систему за 2000$ и вздыхают - "недостаточно прозрачна верхняя середина". Эксперименты с JPEG. Начало. Эксперименты с реальными фильмами требуют заметного количества времени, поэтому основные закономерности гораздо быстрее и проще проиллюстрировать на примере неподвижных изображений. Возьмите качественный "несжатый" TIFF, "естественный" (например, пейзаж), с достаточным количеством резких границ и мелких деталей, размером примерно 600х800 (чтобы смотреть на экране в режиме 100%). В нём цвет каждой точки кодируется отдельно, "по-честному". Это - максимальное (эталонное) качество в рамках 24-битной цветовой модели. Но человеческий глаз имеет некоторые особенности, и воспринимает не всю информацию, и поэтому можно удалить (навсегда!) часть данных без заметной потери качества (формат JPEG). В фотошопе или даже в ACDSee попробуйте посжимать картинку с разными параметрами "качества" и найдите отношение размеров исходного файла и JPEG-а при котором искажения ещё практически незаметны. Получится коэффициент в диапазоне 10-25 в зависимости от картинки и Вашей "строгости". При большем сжатии артефакты явно заметны (цветные ореолы, квадратная структура), а ведь в динамике это "безобразие" ещё и шевелится... Что отсюда следует для видео? Разрешение видеосигнала определено TV-стандартом, его "компьютерный" аналог примерно 720х576. Отсюда при 25 кадрах в секунду получим примерно 250 000 кбит/c ("несжатое" видео). Применим к каждому кадру JPEG с тем самым "безопасным" коэффициентом 10-25. Получим 10000-25000 кбит/с (в зависимости от оригинала). Как известно, DV-формат - аналог JPEG-сжатия, и поток у него 28000 (узнаёте? - чтобы наверняка для любого оригинала). Таким образом, в большинстве случаев, дальнейшее покадровое сжатие DV-формата нецелесообразно, т.к. приводит к заметным артефактам. Почему MPEG компактнее и что для этого нужно. Получается, что 20000-30000 кбит/с - предел? Это 3-4 минуты на CD-R и 20-30 минут на DVD-болванке. Строго говоря, для любого произвольного изображения из независимых между собой кадров - ДА! А как же прекрасное качество DVD (5000-8000)? Ответ: в реальных фильмах последовательные кадры обычно взаимозависимы и формат MPEG это использует. Грубо говоря, мы сжимаем JPEG-ом не каждый кадр, а разницу между соседними кадрами. Поскольку камера в профессиональных фильмах всегда стоит на штативе либо на рельсах, то часто изменения заднего плана незначительны либо однообразны, и поэтому легко жмутся. Динамичные же сцены (взрывы и пр.) обычно "занимают" скорость у "спокойных" кусков за счёт применения переменного битрейта... Представим как выглядит разностный кадр для объекта движущегося на неподвижном фоне (используется штатив). Очевидно, весь фон представляет из себя однотонную плоскость (в RGB модели - чёрную), и лишь небольшая часть кадра ("объект") имеет контрастный с фоном цвет. Вернёмся к экспериментам с JPEG в Фотошопе. Подберите сами аналогичную картинку и попробуйте - результаты впечатляют... Итак, я подобрал картинку из Берлина (фрагмент фотографии из альбома "Европа-98") - однотонный фон (небо) и небольшой контрастный объект. Размеры 720х546. Выглядит она примерно так: ![]() Далее я сжал её в JPEG так, что артефакты только-только начали появляться. Получилось 12К. После этого три раза проделывалась однотипная операция: к исходной картинке (несжатой) применялся фильтр "добавить шум" (с разными значениями шума) и затем она сжималась JPEG так чтобы получилось 12К. Фрагменты того что получилось: ![]() Наглядно видно, какие "дикие" артефакты появлются на зашумлённой картинке после сжатия. На фрагментах не очень, но на целом кадре (а лучше на нескольких) можно заметить, что даже шум в 20 единиц на несжатом изображении практически не раздражает. Он как-то сам фильтруется глазами и мы всё равно ясно представляем себе что там за объект (то же самое происходит когда мы смотрим старую VHS-ленту или слушаем кассету на магнитофоне). Наоборот - артефакты сжатия, грубые полосы и квадраты раздражают, и к ним глаз привыкать "не хочет". Чтобы артефакты не росли с зашумлённостью приходится жать не с одинаковым размером, а с одинаковым "качеством". Тогда размеры заметно растут с ростом шума. В данном примере при одном и том же параметре "quality" получалась примерно такая линейка размеров: 12:24:36:48. Что это означает для видео? Только то, что само по себе значение битрейта - не гарантия высокого качества, многое зависит от качества исходного материала. Например если исходный материал содержит шумы, то чтобы не появились артефакты приходится поднимать битрейт в разы... При идеальных условиях профессионального DVD-производства MPEG-2 даёт выигрыш (к JPEG) примерно в 4-5 раз (назовём это "MPEG-добавка"). Ещё раз сформулируем эти идеальные условия в виде таблицы:
Я допускаю мысль что дальнейшее улучшение алгоритмов увеличит "MPEG-добавку" раза в полтора, но скорее всего не больше. Кстати, MPEG4 вопреки шумихе несильно лучше чем MPEG2 - процентов на 10 на высоких битрейтах. А пресловутые компакты с DivХ положа руку на сердце никто не назовёт настоящим DVD-качеством. И что выходит на практике? Практика показывает, что "домашнее" видео на любительских камерах (из-за невыполнения вышеперечисленных условий, прежде всего из-за шума и тряски) жмётся примерно вдвое хуже профессионального, т.е. при одном и том же качестве должно занимать вдвое больший объём. Полученные данные легко представить в виде таблицы.
Выводы и советы.
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
Copyright © 1999-2012 PcTuner.Ru · Design by Alex Dovby
|