Friend's World - Мир Друзей
 

Вернуться   Friend's World - Мир Друзей > Мультимедия > Видео и аудио - оцифровка, видеомонтаж

ОБЪЯВЛЕНИЕ

НОВОСТИ

Старый 23.04.2007   #16
Модератор

 
Аватар для Virus
 
Регистрация: 03.06.2006
Сообщений: 1,501
Поблагодарили: 18 раз
Virus Приносишь большую пользу; 31%Virus Приносишь большую пользу, 31%Virus Приносишь большую пользу, 31%
Отправить сообщение для Virus с помощью ICQ

По умолчанию Полезные советы по работе с VirtualDub

Совет 01 - Сохраняйте настройки обработки видео.
VirtualDub позволяет полностью сохранить настройки обработки видео (Меню "File" - "Save/Load Processing Settings..."). При этом сохраняется все : настройки и последовательность наложенных фильтров, вырезанные фрагменты, настройки кодеков, и т.д. Очень полезно, если часто приходиться обрабатывать однотипные видео файлы, или просто, часто приходится накладывать одну и ту же последовательность фильтров...



Совет 02 - Горячие клавиши перемещения по видео.
Очень удобно при движении по видео пользоваться следующими горячими клавишами :
[Shift] + стрелки [<] и [>] - предыдущий и следующий ключевой кадр (для перемещения по видео сжатому в MPEG4).
[Alt] + стрелки [<] и [>] - 50 кадров назад и вперед, соответственно (для перемещения по видео сжатому в MJPEG, Nuffyuv, ... т.к. здесь каждый кадр является ключевым).



Совет 03 - Комфортное MPEG4 кодирование в два прохода.
Когда все настройки VirtualDub и кодеков сжатия выставлены, и настало время производить первый проход сжатия в MPEG4, удобнее поступить следующим образом:
  • (уточняю) в настройках DivX кодека выбран первый проход.
  • Сохраняем, меню "File" - "Save as AVI ...", задаем имя и расположение AVI файла, а так же ставим галочку напротив "Don't run this job now...". Теперь жмем кнопку "Сохранить".
  • Заходим в настройки DivX кодека, выбираем второй проход. Напомню, что больше ничего менять нельзя!
  • Снова, меню "File" - "Save as AVI ...", задаем имя и расположение AVI файла (имя другое), а так же ставим галочку напротив "Don't run this job now...". Жмем кнопку "Сохранить".
  • Теперь, меню "File" - "Job control...". В открывшимся окне мы видим два назначенных нами задания (первый и второй проходы), жмем "Start".
По завершению первого прохода сжатия, VirtualDub сразу начнет выполнять второй проход. Согласитесь, это очень удобно...



Совесть не отвечает или временно недоступна.

&
&
&



Virus вне форума   Ответить с цитированием
Старый 23.04.2007   #17
Модератор

 
Аватар для Virus
 
Регистрация: 03.06.2006
Сообщений: 1,501
Поблагодарили: 18 раз
Virus Приносишь большую пользу; 31%Virus Приносишь большую пользу, 31%Virus Приносишь большую пользу, 31%
Отправить сообщение для Virus с помощью ICQ

По умолчанию Формат Dolby Digital

В последнее время системы пространственного или объемного звучания становятся все более и более популярными. Система Dolby Surround AC-3 была определена фирмой Dolby Laboratories как звуковая система для домашнего театра. В связи с тем, что реально эта система для конечного пользователя мало чем отличается от просто Dolby Digital (предназначенной для профессиональных применений) было принято решение об объединении обеих технологий под общим названием Dolby Digital. Dolby Digital является дальнейшим улучшением ранее разработанных фирмой Dolby технологий Dolby Surround и Dolby Pro Logic. Изменения коснулись как технологии записи/воспроизведения звука, так и способов его передачи. Информация в технологии Dolby Digital передается только в цифровой форме и за счет оптимальных способов кодирования занимает небольшой объем (меньше, чем обычный аудио сигнал).
Основная задача, которую ставили перед собой разработчики систем кодирования звука - максимально простыми и недорогими способами дать возможность пользователю "видеть" источники звука и четко представлять, где находится источник любого звука. Естественно, первоначально эти системы задумывались только для киноиндустрии, так как в кино объединение высококачественного изображения и объемной звуковой картины дает наиболее сильный и заметный даже для неискушенного слушателя эффект.
Dolby Digital не является форматом 3D звука и не может использоваться в играх для поддержки самой игровой среды. Звук, записанный по Dolby Digital, строго говоря, ничем в смысле его использования, не отличается от обычного аудио и не может быть получен "искуственным" путем, а только соответствующей записью реального, "живого" звука и не может быть изменен после записи. Поэтому Dolby Digital звук может сопровождать фильм, концертную запись и т.п. и будет записан на обычной звуковой дорожке к фильму.
Когда появились DVD видеодиски, стало возможным записывать звуковую дорожку к фильмам на них в формате Dolby Digital и одновременно интерес к технологиям от Dolby сразу возник и у производителей звуковых карт, так как совершенно очевидно, что желание наряду с превосходной картинкой с DVD диска иметь объемный звук появилось у владельцев компьютеров достаточно быстро.
Что требуется иметь на компьютере для прослушивания звука, записанного по технологии Dolby Digital?
Во-первых, собственно источник сигнала с Dolby Digital. Сейчас это фактически только один источник - DVD видеодиск. Во-вторых - декодер сигнала Dolby Digital. Не только крупнейшие производители звуковых карт, но и компании второго эшелона выпускают звуковые карты с поддержкой декодирования Dolby Digital и 6 выходами.
В-третьих - акустическая система с числом колонок минимально от 4 до 5 и сабвуфером (он же LFE).
Примерный эскиз расположения динамиков, рекомендуемый инженерами Dolby Laboratories:

На этом рисунке:
  • LFE - Low Frequence Effects Channel - канал для низкочастотных эффектов. Строго говоря, это не сабвуфер, так как низкочастотные динамики могут входить в состав фронтальных акустических систем и собственно низкочастотные звуки будут воспроизводиться именно ими. Сюда могут быть направлены звуки мощных низкочастотных источников - взрывы, землетрясения и т.п. LFE можно не иметь, но тогда эти звуки будут направлены на фронтальные системы и они должны иметь возможность воспроизвести подобные звуки без искажений.
  • Под усилителем с декодером подразумевается любой источник декодированного Dolby Digital звука.
  • Под правым и левым Surround понимаются акустические системы для левого и правого боковых каналов объемного звука. Их не называют просто тыловыми, так как в кинотеатрах, в зависимости от длины зала, левые и правые Surround системы могут состоять из десятков динамиков как по левой так и по правой стороне зрительного зала.
На DVD дисках обычно есть специальная маркировка, указывающая тип формата записи звука. В таблице ниже приведены условные обозначения видов записи:

Моно
Стерео
Dolby Surround
Дискретный Surround
Квадрафонический звук
Dolby Digital 5.1

Любой диск, на котором есть хотя бы один звуковой фрагмент, записанный в формате Dolby Digital, должен иметь такую маркировку:



Совесть не отвечает или временно недоступна.

&
&
&



Virus вне форума   Ответить с цитированием
Старый 23.04.2007   #18
Модератор

 
Аватар для Virus
 
Регистрация: 03.06.2006
Сообщений: 1,501
Поблагодарили: 18 раз
Virus Приносишь большую пользу; 31%Virus Приносишь большую пользу, 31%Virus Приносишь большую пользу, 31%
Отправить сообщение для Virus с помощью ICQ

По умолчанию Телевидение и компьютер

Введение.
Необходимость написания этого материала возникла после того, как многие начинающие любители цифрового видео стали присылать кадры из своих видеофильмов, на которых отчетливо были видны искажения изображения и задавали резонный вопрос - а что я не так делаю, на телевизоре изображение нормальное, а на компьютере нет?
Телевидение было придумано десятки лет тому назад, задолго до появления электронных вычислительных машин, ни о каких цифровых преобразованиях тогда не могло быть и речи, поэтому все создавалось с целью удобной и дешевой передачи сигналов и последующего простого для уровня тогдашней техники отображения на экране. Поскольку видеоизображение на компьютере не может быть сформировано так же как в телевизоре, и возникают проблемы, вопросы по ним и т.д. Как ответы на большинство подобных вопросов и задуман этот материал.


Передача и формирование телевизионного изображения.
Большинство смотрящих телевизор людей считают, что они видят изображение с частотой 25 кадров в секунду (здесь и далее информация будет относиться к телевизионным системам PAL/SECAM). Это не совсем так. На самом деле на экране меняется изображение 50 раз в секунду, но не все изображение, а только половина его. Сначала рисуется одна половина строк кадра изображения, затем другая. Каждая из половинок называется полем (field). Поэтому правильно считать, что на экране телевизора рисуется 50 полей в секунду. Эта технология хорошо иллюстрируется рисунками ниже:


Исходный кадр



Он же, но разделенный на два поляЧеловек не замечает "половинчатости" каждого изображения как из-за инерции человеческого зрения, так и из-за послесвечения люминофора электронно-лучевой трубки телевизора. Тем не менее многие зрители легко отличают кинофильмы от телефильмов именно по большей дискретности перемещения объектов в кинофильме. Телефильмы снимаются на видеокамеры с теми же 50 полями в секунду, а кинофильмы на кинокамеру с 24 кадрами в секунду. При подготовке кинофильма к показу по телевидению каждый кадр преобразуется в два "половинчатых" поля, но, поскольку, движения в пределах одного кинокадра нет, эти поля, накладываясь друг на друга в глазах зрителя, просто восстанавливают исходный кадр с кинопленки.
Некоторые цифры, характеризующие передачу телевизионного изображения:
  • Максимальное количество вертикальных линий, которое можно отобразить на телевизоре, укладывая их по горизонтали - 768. Такое количество линий можно даже увидеть, подав на низкочастотный вход телевизора прямоугольный сигнал частотой 15625 Hz. Линии будут чередоваться - по 0 сигнала белая, по 1 черная. Таким образом, полный телевизионный кадр получится 768х625. После отбрасывания служебных строк и обратного хода кадровой развертки остается реальное разрешение 720х576. Такое разрешение указывается для полноэкранного видео на компьютере во всех программах редактирования видео.
  • Требуемая для передачи полного телевизионного изображения полоса пропускания считается просто: 768 (линий по горизонтали)/2 (одна линия белая, другая черная) = 384*625 (число строк в кадре) = 240000*25 (число кадров в секунду) = 6000000Hz = 6MHz.
  • Частота строчной развертки 15625Hz, тем самым длительность одной строки 64 микросекунды.
  • Частота кадровой развертки 50Hz, длительность одного поля соответственно 20 миллисекунд.
  • Количество строк, рисуемых за 20 миллисекунд - 312.5 (0.020/0.000064). В целом кадре соответственно 312.5х2=625.
Как учитывать специфику телевизионного сигнала.
Именно из-за незнания специфики телевизионного сигнала часто у многих пользователей возникают недоуменные вопросы после сброса видео на компьютер. Эти же вопросы возникают при сжатии видео в различные варианты MPEG формата. Итак, наиболее часто встречающиеся вопросы и ответы на них:
Смотрю видео, захваченное с цифровой камеры, на компьютере и вижу, что изображение намного более темное, чем при просмотре того же фрагмента на телевизоре. Тем самым я не могу тщательно редактировать фильм, не имея представления о реальных цветах и яркости кадра. Почему это происходит и как исправить подобную ситуацию?
Это явление общеизвестно и возникает из-за особенностей DV кодеков, используемых для декомпрессии DV и отображения его на экране. Действительно, изображение на экране монитора выглядит очень темным, несмотря на то, что это же изображение, отправленное на камеру, будет совершенно нормально выглядеть на телевизоре. Никаких радикальных средств борьбы с этим явлением нет, но есть возможность существенно уменьшить различия между телевизионным и компьютерным изображением. Поскольку как видеоредакторы, так и просто проигрыватели Windows используют режим overlay для показа видео, можно отрегулировать контрастность (Contrast), яркость (Brightness), цветовой тон (Hue), цветовую насыщенность (Saturation) именно для окна overlay'я. Такую возможность предоставляют видеокарты на процессорах от NVidia. В параметрах настройки всех современных драйверов от этого производителя есть соответствующая закладка Overlay Color Control. К сожалению, другой именитый производитель процессоров для видеокарт, Matrox Graphics, возможности настройки в режиме Overlay не предоставляет. Настройки параметров окна overlay НЕ ВЛИЯЮТ ни на что, кроме вывода видео. Вид окна настройки представлен на рисунке:

Для настройки видеоизображения следует загрузить любой видеоклип в обычный проигрыватель Windows, нажать кнопку Стоп, затем вызвать панель настройки overlay, показанную выше и подобрать настройки по вкусу (еще разумнее смотреть то же изображение по телевизору).
При просмотре кадров, которые я взял и сохранил на диске со своего видеофильма, обнаружил артефакт, который можно назвать "гребенкой" - зубцы на движущихся объектах или неподвижных, но при движении камеры. На телевизоре при этом все нормально. Как можно избежать подобных искажений и можно ли как-то исправить уже снятые кадры?
Рассмотрим небольшой пример. Вот снимок людей, которые попали в кадр быстро поворачивающейся камеры:

На этом снимке видно, что края всех предметов на снимке искажены "гребенкой". Этот артефакт вызван наложением двух полей, изображения на которых смещены друг относительно друга. Смещение соответствует расстоянию, которая камера прошла за 1/50 секунды. Избежать подобных искажений при съемке обычными видеокамерами невозможно. Только камеры с прогрессивной разверткой позволяют существенно уменьшить, а при небольшой скорости объекта/камеры убрать совсем подобные искажения. Если же хотелось бы все-таки сохранить такой кадр для размещения на WEB странице или печати на принтере, то можно улучшить качество изображения применением фильтра Video/De-Interlaced в программе Adobe Photoshop или Ulead Photoimpact 8. Результат получится таким:

Следует только учесть, что разрешение по вертикали после такой операции падает в два раза, так как фактически одно поле удаляется и удваиваются строки другого поля.
Захватил видео с цифровой камеры программой Ulead MediaStudio Pro (Adobe Premiere, Vegas Video и т.п.) и обнаружил странную картину - плеер Windows показывает, что разрешение записанного мною видео всего 360х288, хотя должно быть 720х576. Почему это происходит и как посмотреть видео в полном разрешении?
Это действительно так. По умолчанию плеер Windows показывает DV Video в разрешении 360х288. Для перевода показа в полное разрешение нужно проделать следующее:

Войти в меню Tools/Options (Сервис/Параметры), далее выбрать Performance (Быстродействие). Установите Video Acceleration (Аппаратное ускорение) в Full (Полное), нажать кнопку Advanced (Дополнительно) и Digital Video (DV) (Настройки цифрового видео) в Large (Крупно).

Переведя плеер Windows в режим показа полного разрешения, не следует забывать, что плеер будет отображать каждый кадр из 2-х наложенных полей, что приведет к "гребенке" на краях движущихся объектов. Это явление подробно описано выше. В режиме 360х288 показывается только одно полке и подобных искажений нет.
Что означает "камера с прогрессивной разверткой", "камера с обычной разверткой" - по идее телевизионное изображение всегда должно быть чересстрочным и никак иначе? И по этой же теме - как любая цифровая видеокамера делает "фотоснимок" - там же "гребенки" нет, причем на самой обычной, без "прогрессивных" способностей, камере?
Действительно, телевизор может показывать только чересстрочное изображение, но здесь на самом деле нет никакого противоречия с возможностями некоторых видеокамер снимать с прогрессивной разверткой, но для понимания этого следует подробно описать технологию съемки видеокамерой:
  • Съемка с чересстрочной разверткой - Рассмотрим процесс съемки обычной видеокамерой, использующей только чересстрочную развертку. При такой съемке камера реально снимает 50 раз в секунду, причем информация с ее CCD (ПЗС) считывается именно по четным или нечетным строкам - т.е. сначала считываются нечетные строки (1, 3,..., 623, 625), затем, через 1/50 секунды, четные строки (2, 4,..., 622, 624). Поэтому при перемещении объекта съемки относительно камеры, изображения на разных полях будут отличаться друг от друга, причем чем больше будет скорость перемещения объекта съемки, тем заметнее будут отличия и, соответственно, больше "гребенка". У этого типа съемки есть одно явное преимущество - плавный показ движущихся объектов, так как на телевизоре никакой "гребенки" явно видно не будет. Недостатки съемки в чересстрочном режиме ощутимо видны только при монтаже на компьютере - практически невозможно сделать качественные стоп-кадры движущихся объектов для печати фотографий и/или создания альбомов файлов с наиболее интересными кадрами.
  • Съемка с прогрессивной разверткой - Процесс съемки камерой с прогрессивной разверткой отличается тем, что камера делает снимок каждые 1/25 секунды и затем записывает с него два поля, как и положено по телевизионному стандарту. Понятно, что в этом случае никаких нарушений правил нет, но изображение на одном поле никогда не будет смещено относительно другого поля. Видеофильм, снятый на такой камере, при показе на телевизоре будет очень напоминать кинофильм, который, как всем известно, снимается с частотой 24 кадра в секунду. Способностью снимать с прогрессивной разверткой обладает небольшое количество отнюдь не дешевых видеокамер, поэтому не следует надеяться встретить такую возможность в недорогих видеокамерах.
  • Режим "фото" в цифровых видеокамерах - Режим "фото" во всех современных цифровых видеокамерах работает одинаково вне зависимости от остальных характеристик видеокамеры. Этот режим представляет собой частный случай съемки с прогрессивной разверткой. Разница только в том, что таким образом делается только один снимок раз в 6-7 секунд и запись собственно снимка сопровождается записью звука в течении этого времени. Но запоминается сам снимок точно также, просто записывается один и тот же кадр в течении всего времени "фотосъемки". Такой снимок тоже не будет иметь "гребенки" и его не нужно подвергать описанной выше процедуре в Adobe Photoshop.
Разрешение: линии или строки?
Больной вопрос для многих начинающих любителей видео - как оценить качество съемки своей собственной камеры или той камеры, которую планируется купить. Одним из крайне важных параметров видеокамеры является разрешающая способность, которую обычно измеряют в ТВЛ (ТелеВизионные Линии). У большинства современных цифровых видеокамер значение этого параметра достигает 500 и более ТВЛ согласно паспортным данных на них. Наиболее популярный вопрос на эту тему - почему у камеры только 500 линий, в телевизионной картинке должно же быть 625 линий? На самом деле это совершенно разные понятия - строки, на которые раскладывается телевизионное изображение (их действительно 625) и ТВЛ, характеризующие качество изображения. Для понимания того, что есть ТВЛ, проще всего взглянуть на фрагмент обычной телевизионной испытательной таблицы:

Цифры, стоящие рядом с линиями, как раз характеризуют разрешающую способность. Если можно различить линии рядом с цифрой 500, например, то разрешение записывается как "не хуже 500 ТВЛ". Для примера можно посмотреть на два реальных снимка телевизионной таблицы: снимок камерой SONY Digital 8 и снимок неофициального чемпиона по разрешающей способности SONY DCR-TRV900, взятых с сайта John Beale.
SONY Digital 8SONY DCR-TRV900
Следует учитывать, что максимальная разрешающая способность при передаче эфирного телевидения определяется полосой пропускания канала и не может быть улучшена, так как полосы пропускания давно стандартизованы.
Обычный бытовой VHS видеомагнитофон имеет максимальную разрешающую способность всего 240 ТВЛ, S-VHS видеомагнитофоны и видеокамеры - 400 ТВЛ.
Не все пользователи, читающие документацию на видеокамеру или рекламу к оным обращают внимание на примечание, которое зачастую сопровождает значение ТВЛ для цифровой видеокамеры. Обычно примечание гласит - значение указано только для записи/воспроизведения на видеомагнитофон камеры. Фактически в этом случае указывается характеристика качества кодера/декодера камеры, преобразовывающего аналоговый видеосигнал в цифровой и наоборот. Почему дается такое хитрое примечание? Дело в том, что у видеокамеры разрешающая способность зависит от многих факторов, перечисленных ниже:
  • Качество CCD (ПЗС).
  • Количество CCD (ПЗС), больше (3) - лучше.
  • Количество светочувствительных элементов (пикселей) в CCD (ПЗС).
  • Качество DV кодера/декодера камеры.
  • Качество оптики камеры.
Так как в DV стандарте жестко оговаривается формат записи DV на ленту, то для магнитофона цифровой видеокамеры разрешающая способность при записи видео будет одинакова для любой DV камеры стоимостью и 0 и 00. Собственно говоря, и само понятие "разрешающая способность" для цифрового магнитофона абсурдно - нет же понятия "разрешающая способность жесткого диска", например. Правильным же значением, определяющим и в целом качество видеокамеры, будет разрешающая способность на отснятом изображении, но такой параметр приводится не часто - он может быть существенно меньшим, чем значение ТВЛ для магнитофона видеокамеры.



Что же показывает компьютер.
Многие начинающие любители видео считают, что для вывода видео с компьютера на телевизор или видеомагнитофон достаточно иметь обычную хорошую видеокарту с видео выходом и все - результаты своего творчества можно будет легко таким образом сохранять на обычной VHS кассете. На самом деле такой способ вывода практически невозможно использовать из-за низкого качества видеоизображения на TV выходе любой, даже самой дорогой и лучшей видеокарты. Причин здесь несколько:
  • Видеоизображение всегда показывается только по кадрам, а кадр формируется наложением полей со всеми вытекающими отсюда последствиями в виде артефактов, одним из которых является упомянутая выше "гребенка".
  • Среди дозволенных видеокарте разрешений экрана разрешение 720х576 не значится, поэтому при правильном разрешении окна для видео оно будет окружено бордюром до разрешения видеокарты в 800х600 или 1024х768. В случае выбора режима полноэкранного просмотра изображение будет масштабироваться так, как видеокарта и ее драйвер считают нужным.
  • Разложение по полям для вывода по TV выходу видеокарта будет делать без всякой связи с оригинальным видеоизображением.
В настоящее время только видеокарты Matrox практически лишены указанных выше недостатков, но эти видеокарты довольно дороги, редко встречаются в продаже и имеют невысокие параметры в части работы с трехмерной графикой.
Сам же оцифрованный видеофильм хранится в на диске компьютера в оригинальном, т.е. разложенном по полям виде. Но правильное воспроизведение его на обычном телевизоре возможно только через:
  1. Специальную плату для ввода/вывода видео (сам видеофрагмент, конечно, должен иметь формат, поддерживаемый этой платой).
  2. Цифровую видеокамеру для вывода видео в DV формате. Это возможно благодаря тому, что любая цифровая видеокамера при поступлении на цифровой вход данных преобразует их в аналоговый сигнал, который может быть использован для просмотра DV на обычном телевизоре и/или записи на бытовой видеомагнитофон. К сожалению, таким образом нельзя использовать цифровые камеры с заблокированными входами, продаваемые в странах Европейского сообщества в силу их таможенных ограничений.
Заключение.
Кратко в статье приведено большинство "подводных камней", которые ожидают любителя видео при работе на компьютере, вызванных исторически сложившейся спецификой формирования телевизионного изображения. По мере поступления новых вопросов на эту тему этот материал также будет расширяться.



Совесть не отвечает или временно недоступна.

&
&
&



Virus вне форума   Ответить с цитированием
Старый 23.04.2007   #19
Модератор

 
Аватар для Virus
 
Регистрация: 03.06.2006
Сообщений: 1,501
Поблагодарили: 18 раз
Virus Приносишь большую пользу; 31%Virus Приносишь большую пользу, 31%Virus Приносишь большую пользу, 31%
Отправить сообщение для Virus с помощью ICQ

По умолчанию Глоссарий DVD формата

Bitrate - количество бит - характеристика скорости потока видео и/или аудио информации. Измеряется в тысячах килобит за секунду. Чем больше bitrate, тем больше места на диске занимает данная информация. Bitrate в 8000 kbit/s соответствует 1 мегабайту в секунду. Например, 60 секунд видео, закодированного с bitrate 8000 kbit/s, займет на диске 60 мегабайт.

Cell - ячейка - В DVD-Video минимальный адресуемый элемент DVD проекта. Если фильм разбить на главы, например, то фрагмент от начала главы до ее конца также является ячейкой (cell).

Constant Bit Rate (CBR) - постоянная скорость при кодировании - термин, применяемый для описания параметров кодирования в ряде вариантов MPEG формата и означает, что при кодировании в MPEG формат скорость получаемого на выходе кодера MPEG потока всегда постоянна и не зависит от вида кодируемой видеоинформации.

Dolby Digital AC-3 - в общем случае система кодирования (сжатия) звука, разработанного инженерами фирмы Dolby Laboratories. Звуковая дорожка Dolby Digital может содержать моно звук, стерео звук, а также 5.1 звук, запись и воспроизведение которого выполняется для 6 каналов - левого, центрального и правого фронтальных каналов, низкочастотного LFE (общепринятое название subwoofer) а также левого и правого тыловых каналов. Подробнее о Dolby Digital как системе объемного звучания можно прочитать здесь.

Dolby Pro Logic - система объемного звучания, разработанного инженерами фирмы Dolby Laboratories. Запись и воспроизведение звука выполняется для пяти каналов - левого, центрального и правого фронтальных каналов, а также левого и правого тыловых каналов. Отличается от системы Dolby Surround большим разделением фронтальных и тыловых каналов.

Dolby Surround - одна из первых систем объемного звучания, разработанных инженерами фирмы Dolby Laboratories. Запись и воспроизведение звука выполняется для четырех каналов - левого и правого фронтальных каналов, а также левого и правого тыловых каналов. Сигнал для тыловых каналов кодируется вместе с сигналами для фронтальных каналов. При воспроизведении стерео сигнал требует декодирования для извлечения информации тыловых каналов.

Dynamic Range - динамический диапазон - характеристика качества аудио тракта. Измеряется в децибелах и показывает отношение уровня выходного сигнала при номинальной выходной мощности к уровню наименьшего слышимого звука. Такие параметры, как динамический диапазон и отношение сигнал/шум связаны между собой - не может быть у устройства высокое соотношение сигнал/шум и узкий динамический диапазон. Для высококачественных аудио устройств значение динамического диапазона не может быть хуже 95 dB.

Dynamic Range Compression (DRC) - сжатие динамического диапазона - применяется в DVD плеерах с собственными декодерами звука и ресиверах. Сжатие (или уменьшение) динамического диапазона применяется для ограничения пиков звука при просмотре фильмов. Если зритель желает смотреть фильм в котором возможны резкие изменения уровня громкости (фильм о войне, например), но не хочет причинять беспокойство членам своей семьи, то режим DRC следует включить. Субъективно, на слух, после включения DRC в звуке уменьшается доля низких частот и высокие звуки теряют, прозрачность, поэтому без необходимости режим DRC не стоит включать.

DV - Digital Video - формат представления видеоданных, используемый для обмена видео между цифровыми видеокамерами, видеомагнитофонами и компьютерами. В качестве транспорта для передачи DV обычно используется интерфейс IEEE-1394 (FireWire). У DV фиксированный коэффициент сжатия видеосигнала 5:1 и, соответственно, поток 3.515 MBytes/s. Разрешение для PAL 720x576, для NTSC 720x480. Стандарт также предусматривает передачу команд управления устройствами записи/воспроизведения видео по интерфейсу IEEE-1394. Поддерживается запись/воспроизведение звука либо по 4 каналам с частотой дискретизации 32 kHz и разрядностью 12 бит, либо по 2 каналам с частотой дискретизации 48 kHz и разрядностью 16 бит. В DV используется как intraframe компрессия, при которой каждый кадр сжимается сам по себе, без учета информации в соседних кадрах, так и interfield компрессия, применяющая анализ статичных изображений на соседних полях с использованием одинакового фона для соседних полей. Такие алгоритмы компрессии дают очень незначительное количество артефактов.

DV Type-1 - Digital Video Type-1 - оригинальный (native) вариант DV формата, совершенно несовместимый с Video for Windows и поддерживаемый только через DirectShow. Поток (файл) формата Type-1 содержит видео и аудио (стерео, 48 kHz, 16 bit) в одном потоке, т.е. с чередованием видео и аудио. Именно этот формат является рекомендуемым для захвата и последующей обработки видео DV формата на компьютере.

DV Type-2 - Digital Video Type-2 - старый вариант DV формата, обратно совместимый с Video for Windows - программа, понимающая Video for Windows, может прочитать файл формата Type-2 (но сохранить в нем не может без специального кодека). Поток (файл) формата Type-2 содержит видео и от одного до четырех потоков (каналов) для аудио (максимально 2 стереоканала , по 32 kHz, 12 bit каждый). По сравнению с Type-1 требует больших затрат на декодирование и микширование, поэтому область применения этого формата постепенно, по мере перехода программ видеомонтажа на формат Type-1, будет сокращаться.

DVD - Digital Versatile Disk - цифровой универсальный диск - современный стандарт хранения информации на оптическом (лазерном) диске. Отличается от обычного CD-ROM увеличенной почти в 30 раз емкостью (до 17 GB). Для DVD принят другой стандарт на единицу скорости, так объем информации на диске значительно больше. За одну скорость принято считать скорость считывания DVD диска 1352 kBytes/sec. Поэтому диск с 5x DVD скоростью, например, имеет максимальную скорость считывания 6760 kBytes/sec. Возможны следующие варианты изготовления DVD дисков:
  1. Односторонний однослойный с емкостью 4.7 GB.
  2. Односторонний двухслойный с емкостью 9.4 GB.
  3. Двухсторонний однослойный с емкостью 9.4 GB.
  4. Двухсторонний двухслойный с емкостью 17 GB.
Существует также ряд типов DVD дисков в зависимости от назначения и способов записи информации на них:
  • DVD-ROM - диск, доступный только для чтения; может считываться только на приводе DVD.
  • DVD-Video - предназначен для записи видеофильмов и может воспроизводиться как в приводах DVD в компьютерах, так и в DVD плеерах.
  • DVD-R, DVD+R - диски с однократной записью - предназначены для однократной записи данных. Емкость 4.7 GBytes. Диски совместимы с обычными DVD-Video плеерами и DVD-ROM приводами компьютеров.
  • DVD-RW, DVD+RW - диски с многократной записью - предназначены для однократной записи данных. Емкость 4.7 GBytes. Диски совместимы с обычными DVD-Video плеерами и DVD-ROM приводами компьютеров.
  • DVD-RAM - перезаписываемые DVD диски, несовместимые с обычными DVD-Video плеерами и DVD-ROM приводами компьютеров.
  • DVD-Audio - новый стандарт на аудио диски - за счет увеличенной емкости DVD диска увеличена частота дискретизации до 48/96/192 kHz (также 44.1/88.2/176.4 kHz) и разрядность до 16/20/24 бит.
DVD-1 - условное название первого поколения приводов для DVD дисков. Имеют скорость чтения обычных CD-ROM дисков не выше 8-ми, и, кроме этого, не могут читать CD-R и CD-RW диски.
DVD-2 - условное название второго поколения приводов для DVD дисков. Имеют скорость чтения обычных CD-ROM дисков до 24-х, и, кроме этого, могут читать CD-R и CD-RW диски.
DVD Structure - структура DVD-Video диска. Структура DVD-Video диска показана на рисунке:


Linear PCM - линейный PCM - формат несжатого (т.е. без потери качества) звука, используемый для записи звука в некоторых DVD-Video дисках. Отличается от PCM звука на обычных аудио компакт-дисках повышенной частотой дискретизации от 48 до 96 kHz и разрядностью 16, 20, или 24 бит. Этот формат используется в основном только на DVD-Video дисках с записями выступлений различных музыкантов. Широкому использованию этого формата в DVD-Video дисках мешает его высокий bitrate (иными словами, звук в таком формате занимает слишком много места), составляющий минимально около 1500 кбит/сек.

Motion Menu - видео меню - меню в DVD-Video дисках, включающее в себя видеофрагменты.

Multi-angles - под несколькими углами - показ одного и того же изображения, снятого разными камерами. Такая возможность заложена в стандарт на DVD-Video диск, но она практически никогда не применяется. Объясняется это тем, что слишком много места на диске требует каждая видеодорожка и, кроме этого, дополнительными затратами при съемке самого фильма.

PGC - Program Chain - программная цепочка - Основной элемент структуры содержания DVD-Video диска, состоит из нескольких program, связанных вместе для последовательного воспроизведения. На DVD-Video диске обязательно должна быть хотя бы одна PGC.

Program - программа - под программой в DVD среде понимается набор аудио и видео фрагментов. Включает в себя несколько ячеек (cell).

PTT - Part of Title - фрагмент тайтла - часть тайтла, иными словами глава или сцена.

RF modulation - Radio Frequency Modulation - частотная модуляция - в эпоху проигрывателей лазерных видеодисков цифровой звук передавался с таких проигрывателей на усилитель в частотно-модулированной форме. Во многих современных DVD плеерах есть возможность вывода звука в таком же виде для совместимости с различными усилителями (ресиверами).

Seamless playback - непрерывное (дословно бесшовное) воспроизведение - возможность перехода внутри program без перерыва в воспроизведении видео.

Slide Show - последовательный показ статичных изображений DVD плеером, причем длительность показа каждого изображения определяется автором DVD диска при его создании. Вместе с картинками можно дать звуковое сопровождение.

Still Menu - неподвижное меню - меню в DVD-Video дисках, не имеющее подвижных элементов.

Still Show - последовательный показ статичных изображений DVD плеером. Отличается от Slide Show тем, что изображения меняют друг друга только после нажатия кнопки на пульте DVD плеера и Still Show не может иметь звукового сопровождения.

Subpicture - в DVD-Video дисках основополагающий способ представления тех элементов меню, которые могут изменять свой вид на экране в зависимости от действий пользователя. Создавая subpicture в программе DVD-Authoring, автор DVD-Video диска фактически указывает DVD плееру, каким образом он должен отображать на экране элементы управления в меню DVD-Video диска. В простейших программах DVD-Authoring subpicture создается самой программой по собственному усмотрению, поэтому в таких программах неизбежны ограничения возможностей автора в разработке меню.

Title - тайтл - наибольший элемент компоновки в DVD-Video диске. DVD-Video диск может содержать до 99 тайтлов, выбрать которые можно через title меню.

Variable Bit Rate (VBR) - переменная скорость при кодировании - термин, применяемый для описания параметров кодирования в ряде вариантов MPEG формата. В отличие от CBR скорость выходного потока MPEG кодера будет зависеть от вида кодируемого видеоматериала. Как правило, при использовании VBR режима кодеру указываются средняя, максимальная и минимальная скорость потока. В этом случае кодер подбирает оптимальную скорость потока в зависимости от динамики конкретного фрагмента фильма, сохраняя среднюю скорость потока постоянной. Поскольку режим VBR позволяет уменьшить размер получаемого MPEG файла без ущерба для его качества, он применяется в подавляющем большинстве случаев для кодирования фильмов для DVD-Video дисков. Режим CBR применяется только для кодирования коротких фильмов, которые и при наивысшей скорости потока помещаются на DVD-Video диск.

VMG - Video Manager - видео менеджер - меню диска, служит для доступа ко всем Titles на диске. Тем не менее реально может не использоваться, если на диске только один VTS. Если VTS больше, чем один, то только через VMG можно получить доступ к любому VTS.

VTS - Video Title Set - набор тайтлов - контейнер для практически всех составляющих DVD-Video диска. Именно внутри VTS устанавливаются строгие ограничения по единому стандарту применяемых файлов. Может содержать до 99 тайтлов.



Совесть не отвечает или временно недоступна.

&
&
&



Virus вне форума   Ответить с цитированием
Старый 23.04.2007   #20
Модератор

 
Аватар для Virus
 
Регистрация: 03.06.2006
Сообщений: 1,501
Поблагодарили: 18 раз
Virus Приносишь большую пользу; 31%Virus Приносишь большую пользу, 31%Virus Приносишь большую пользу, 31%
Отправить сообщение для Virus с помощью ICQ

По умолчанию MPEG и его применение

Концепция.
Видеоданные по своей природе занимают чрезвычайно большой объем. Над задачей возможно более эффективного сжатия видео уже много лет бьются специалисты в этой области. В начале третьего тысячелетия в связи с острой необходимостью передавать большие объемы видео по различным сетям, задача оптимального по соотношению качество/объем способа кодирования видео стала еще более актуальной.
Концепция сжатия видео в MPEG очень проста - определить, какая именно информация в потоке повторяется хотя бы в течении какого-то отрезка времени и принять меры к избежанию дублирования этой информации. Наиболее ценное достоинство MPEG кодирования, особенно удобное для передачи по различным сетям - возможность гибкой настройки качества изображения в зависимости от пропускной способности сети. Это и сделало MPEG-2 фактическим стандартом для приема/передачи цифрового телевидения по различным сетям.
К сожалению, не существует возможности однозначно оценить качество кодирования некими приборами и измерениями. Единственный критерий здесь - человек и как он воспримет сжатую информацию. Поэтому правила сжатия видеоданных при MPEG кодировании вырабатывались на основе модели восприятия человеком видеоизображений (HVS - Human Visual Sense).
Избыточность изображения согласно HVS определяется по трем основным критериям:
  • Невидимые человеческим глазом детали изображения - места гашения по вертикали и горизонтали. Удаление этой информации вообще никак не сказывается на изображении.
  • Статистическая избыточность. Подразделяется на пространственную и временную. Под пространственной избыточностью понимаются участки изображения, на которых смежные пиксели практически одинаковы. Под временной - не изменяемые во времени фрагменты изображения.
  • Избыточность по цвету и яркости - рассчитывается исходя из ограниченной чувствительности человека к небольшим изменениям цветов и яркости деталей изображения.
Как реализуется.
Для удобства кодирования видеоданных весь видеопоток разбивается на группы, называемые GOP (Group of Pictures - группой изображений). Такая группа строится следующим образом:

где:
I - Intra кадры, которые обычно называются опорными и содержат всю информацию об изображении. MPEG последовательности без этих кадров быть не может в принципе. При компрессии I кадров происходит удаление только пространственной избыточности. Именно с этого кадра начинается декодирование изображения в последовательности.
P - Predictive кадры. "Предсказанные" кадры, при формировании которых используется метод предсказания изображения на следующем кадре с учетом компенсации движения от последнего I или P кадра перед формируемым. P кадр также служит для дальнейшего предсказания изображения. P кадр создается с помощью межкадровой компрессии, уменьшающей как пространственную, так и временную избыточность. Изображение P кадра вычитается из следующего изображения и эта разница кодируется и вместе с вектором движения добавляется к сжатым данным.
B - Bi-directional, "двунаправленные" кадры. Они названы так потому, что хранят наиболее существенную информацию с окружающих их I и P кадров. B кадры имеют наивысшую степень компрессии, но требуют предыдущего и последующего изображения для компенсации движения объектов на изображении.
Такую структуру MPEG потока обычно описывают в виде дроби M/N, для которой M сообщает общее число кадров в GOP, а N - каким по счету будет очередной P кадр после предыдущего. Таким образом, GOP последовательность, изображенная на рисунке выше, может быть записана как 12/3.
Собственно поток данных MPEG состоит из 6-ти иерархических уровней:
  • Блок - данные по яркости и цветности для блоков 8х8 изображения. Блоки анализируются по значениям Y (яркость), CB и CR (цветоразностные сигналы).
  • Макроблок - как следует из названия, состоит из 4 простых блоков в окне 16х16 пикселей соответственно. В формате 4:2:0 макроблок содержит 4 блока яркостных данных Y и по одному CB и CR.
  • Слой - содержит несколько смежных макроблоков.
  • Кадр - состоит из группы слоев, содержащих изображение, которое, в свою очередь, может быть как I, так P или B.
  • Группа изображений (она же GOP) - содержит последовательность кадров. Может включать до 15 кадров и должна обязательно начинаться с I кадра.
  • Видеопоследовательность - должна содержать минимум одну GOP, а также заголовок в начале последовательности и код конца последовательности.
Уровни и профили MPEG.
Под профилем MPEG понимается подмножество структуры битового потока сжатого видеоизображения. В пределах такого подмножества возможен широкий разброс параметров потока и, соответственно, кодеров и декодеров для них.
Под уровнем понимается ряд ограничений, применяемых к параметрам MPEG потока, например, разрешение выходного изображения, частота кадров и т.п.
Таблица ниже иллюстрирует максимальные значения ограничений, накладываемых на уровни и профили MPEG:
Эта таблица нужна в первую очередь, для понимания часто встречающихся обозначений формата конкретной записи или описаний возможности какого-либо кодера. Например, вот так может характеризоваться запись в формате MPEG:
** На самом деле здесь правильнее было бы написать: PAL - название аналогового стандарта телевидения, в котором был создан исходный видеофильм. Собственно MPEG фильм нельзя отнести к какой-либо системе цветного телевидения, так кадры в MPEG являются просто цифровым представлением ранее аналогового изображения и не имеют никакого отношения даже к исходной для оригинала фильма системе телевидения.


Практическое использование.
Придирчивый читатель спросит - чем поможет мне в работе эта информация? Тем, кто не работает с видео, конечно, эта информация может мало что дать, но остальным может помочь в их практической работе. Многие пользователи, начавшие работать с DV видеокамерами и программами для нелинейного видеомонтажа, стали задумываться над способами сохранения своих творений если не на века, то, по крайней мере, на ближайшие несколько десятков лет. Как не странно, большинство начинающих DV видеомонтажников, еще основательно не зная MPEG, планируют хранить свои проекты именно на CD дисках в формате MPEG, даже не представляя, насколько сложно решается эта задача, если пользователь желает в MPEG варианте сохранить качество исходного DV фильма. Итак, наиболее часто встречающиеся вопросы на эту тему:


Почему я после сохранения своего фильма в формате MPEG-2 вижу, что качество его заметно ухудшилось?
Причин здесь несколько:
  • С цифровой видеокамеры на компьютер сбрасывается уже компрессированное, сжатое изображение. DV в сущности представляет собой частный случай JPEG компрессии - это поток, состоящий из сжатых по немного измененному алгоритму JPEG кадров. От идеи (но не принципов сжатия) MPEG в DV используется только то, что при сжатии в DV учитывается информация с двух полей одного кадра - так называемая intrafield компрессия. Поэтому для сжатия в MPEG DV изображение сначала декомпрессируется, а затем подвергается повторному сжатию, что качества не улучшит никогда.
  • Параметры компрессии были заданы неверно с точки зрения качества изображения.
  • Используется быстрый, но не очень качественный кодер MPEG.
Почему качество изображения на DVD дисках очень высокое, хотя это тоже MPEG-2 - можно ли получить подобное качество в домашних условиях?
Качество видео на DVD дисках действительно очень высокое. Объясняется оно двумя основными факторами - в качестве исходного видеоматериала для создания MPEG-2 варианта фильма используется несжатое видео профессионального качества, и, кроме этого, для кодирования в MPEG-2 применяются аппаратные кодеры с очень высоким качеством кодирования изображения. Стоимость таких кодеров доходит до нескольких десятков тысяч долларов США. Поэтому получить в домашних условиях подобное качество с DV фильма невозможно.


Что означают параметры, которые предлагается указать до кодирования фильма в MPEG формат?
Таких параметров может быть много, но следует остановиться на наиболее важных из них:
  • Profile ID и Level ID - см. таблицу выше.
  • Frame Intervals - для понимания того, что имеется ввиду, следует учесть, что обычно задается интервал между I кадрами, что фактически означает размер GOP, а также каким по счету будет очередной P кадр после предыдущего. Чем больше будет интервал между I кадрами, тем хуже будет качество изображения, но меньше размер результирующего файла. Кроме этого, интервал между I кадрами не рекомендуется делать больше 15.
  • Motion Estimation - компенсация движения. Параметр определяет, насколько правильно будет предсказываться движение объекта и очень важен как для качества выходного изображения, так и для оценки времени кодирования. Большее значение даст лучшее качество, но значительно увеличит время работы кодера. При установке этого параметра надо понимать, что максимальное значение может быть "неподъемным" для процессора компьютера и желанный фильм может создаваться несколько суток.
  • Frame sequence - параметр, во многом аналогичный Frame Intervals. Обычно предлагает выбрать вид кодирования - только I кадры, I + P кадры и I, P, B кадры, а также интервалы для P и B кадров. Что касается того, как кодировать - лучшее качество, но максимальный объем дает кодирование в только I кадры, затем соответственно, I + P и I, P, B. Классическими апробированными значениями для интервалов значениями являются P=3 и B=2. Строго говоря, для DVD принято использовать структуру 15/3 или IBBPBBPBBPBBPBB.
  • Video Data Rate - скорость видеопотока. Во многих кодерах, рассчитанных на массового пользователя, это основной параметр, относительно которого кодер сам устанавливает все остальные. Измеряется обычно в мегабитах в секунду. Установив это значение и умножив его на продолжительность фильма в секундах, легко получить объем итого файла.
Я имею DV видеокамеру с возможностью съемки в режиме прогрессивного сканирования. Потом я хочу сохранить готовый фильм в формате MPEG. Как мне лучше снимать, в обычном чересстрочном режиме или в прогрессивном?
Для MPEG-1 ответ однозначный - съемка с прогрессивной разверткой лучше, так при компрессии в MPEG-1 одно поле телевизионного изображения просто отбрасывается. Для MPEG-2 ответ на этот вопрос зависит от того, как планируется использовать созданный MPEG-2 клип. Если планируется просматривать его только на компьютере и/или аппаратного декодера нет, то лучше использовать съемку с прогрессивной разверткой - изображение будет более четким, без артефактов движения. Если же аппаратный декодер MPEG-2 есть и планируется смотреть фильм на телевизоре, то более плавные и естественные движения объектов в фильме будут при съемке в обычном режиме. Многие современные кодеры MPEG-2 разрешают выбор типа исходного фильма (прогрессивная или чересстрочная развертка), при выборе чересстрочной развертки используют поля и при выводе с аппаратного декодера на видеовыход будет восстанавливаться исходное изображение с теми же полями, что и до сжатия.


Я хочу сразу сохранять фильмы в MPEG формате и в нем же редактировать. Возможно и правильно ли это делать?
Сохранять, конечно, можно, но редактировать MPEG видео очень трудно и неудобно. Дело в том, что при редактировании MPEG невозможна реальная точная до кадра нарезка фрагментов, так как отделять фрагменты друг от друга можно только по I кадрам, иначе, при удалении опорного кадра и сохранении следующих за ним кадров, изображение потеряет читаемость. Редакторы видео с поддержкой MPEG позволяют как бы редактировать с точностью до кадра, но надо понимать, что при любых изменениях не I кадра будет выполняться рекомпрессия всей GOP, что скажется на качестве фильма отнюдь не в лучшую сторону. Наложение эффектов, переходов, фильтров также будет нельзя делать с точностью до реального кадра, что может привести к невозможности качественного воплощения художественных замыслов. Кроме этого, рекомпрессия изображения в случае MPEG-2 будет занимать значительно большее, по сравнению с DV, время и требовать более мощных процессоров для этого.


Сейчас очень популярен в России формат MPEG-4. Есть ли смысл сохранять свои фильмы в этом формате?
Формат MPEG-4 изначально создавался для передачи видео по низкоскоростным каналам и не предназначался для хранения видео. Качество изображения по MPEG-4 безусловно хуже MPEG-2, но немного лучше MPEG-1. Компрессия/декомпрессия в MPEG-4 требует значительных затрат процессорного времени и просмотр, а тем более создание видео в формате MPEG-4 на компьютере с процессором ниже Celeron II 700 весьма затруднителен. В основном MPEG-4 используется для рекомпрессии в него оригинальных MPEG-2 фильмов, записанных на DVD дисках. MPEG-4 позволяет записать на обычном CD диске часовой фильм. Сохранять же в этом формате собственные фильмы нет никакого смысла по двум основным причинам:
  • Качество намного хуже оригинала.
  • Отсутствует стандарт записи MPEG-4 на диск, аналогичный DVD стандарту.
Какие кодеры MPEG поддерживают работу с DV форматом и обеспечивают при этом хорошее качество?
Есть несколько популярных кодеров MPEG, поддерживающих работу с DV форматом:
  • TMPEnc Encoder - программа, популярная даже не столько собственно кодировщиком MPEG, сколько инструментами для мультиплексирования, демультиплексирования и склеивания/нарезки MPEG файлов.
  • Main Concept MPEG Encoder - неплохой кодер, встроенные в популярные видеоредакторы Adobe Premiere, Ulead MSP и Vegas Video.
  • Canopus ProCoder - пожалуй, лучший кодировщик DV материалов.



Совесть не отвечает или временно недоступна.

&
&
&



Virus вне форума   Ответить с цитированием
Старый 23.04.2007   #21
Модератор

 
Аватар для Virus
 
Регистрация: 03.06.2006
Сообщений: 1,501
Поблагодарили: 18 раз
Virus Приносишь большую пользу; 31%Virus Приносишь большую пользу, 31%Virus Приносишь большую пользу, 31%
Отправить сообщение для Virus с помощью ICQ

По умолчанию MiniDV видеокамера и принципы обработки видео

Эта небольшая статья не претендует на полное описание принципов работы с DV форматом, скорее, она носит лишь ознакомительный характер. Здесь я расскажу о своем небольшом опыте работы с отснятым на MiniDV видеокамеру материалом. В форуме, да и мне лично частенько задают вопросы по этой теме, надеюсь, после публикации этого описания их будет меньше. В принципе, статью можно считать пробной, все же тема не совсем соответствует направлению сайта, но, тем не менее, если будет определенный интерес, то выберу время и опишу более подробно наиболее интересующие моменты.
Началось все с того, что у меня накрылась старая аналоговая видеокамера SAMSUNG формата Video8, поскольку все усилия починить ее своими силами не увенчались успехом, а вкладывать деньги в ремонт, этой морально устаревшей камеры не хотелось, было принято решение приобрести новую. Долго ломать голову при выборе камеры не пришлось :
  • Хотя уже сегодня существуют всякого рода технологии и камеры, умеющие записывать информацию на диски, оптические или жесткие, мне как человеку не понаслышке знающему, что представляет собой оцифрованное видео и какие у него потребности к дисковому пространству, было сразу очевидно, что при текущем уровне развития этих технологий, все это, конечно, понты. Понятно, что за этим будущее, все же мотать туда-сюда магнитную ленту не есть хорошо, но в любом случае, сейчас это дорого и неоправданно, да и качество там всеже хуже, из-за ограниченности существующих носителей информации. Поэтому такой вариант не рассматривался с самого начала.
  • Сегодня довольно распространенным форматом, обеспечивающим хорошее качество, компактность и удобство является - MiniDV. К тому же в любом из магазинов, торгующим бытовой техникой и электроникой, представлено множество видеокамер именно этого формата, поэтому есть из чего выбрать, собственно, в этом направлении я решил следовать дальше.
  • Я не особо требователен был при выборе камеры, честно говоря, просто прошелся по магазинам, посмотрел, что они предлагают, и, можно сказать на месте, сделал свой выбор. Особое внимание при этом уделил цене, по возможности качеству, функциональности, размеру, удобству исполнения. На месте понять насколько хорошее качество у той или иной камеры не возможно, поэтому пришлось выслушать мнение продавца-консультанта по заинтересовавшим меня камерам. Тут главное, что бы человек попался грамотный, ну и как мне кажется лучше пойти туда покупать, где действительно есть выбор, и где не стараются всеми усилиями впарить единственную имеющуюся у них камеру. Понятно, что я утрирую, но все же смысл в этом есть. В общем, мой выбор был сделан в пользу Panasonic NV-GS50, своего рода золотая середина, поскольку найти видеокамеру, сочетающую все достоинства, и при этом невысокую стоимость, конечно, нереально.

Формат MiniDV (Mini Digital Video), предусматривает запись видеоизображения и звука в оцифрованном виде на кассету небольших размеров, содержащую магнитную ленту. Для кодирования используются специально разработанные и стандартизованные алгоритмы DV сжатия, которые обеспечивают превосходное качество изображения и звука. Поток информации, который записывается на DV кассету, превышает в разы размер MPEG2 потока, используемого на DVD-Video дисках.
Особую распространенность имеют 60-ти минутные кассеты, если соотнести это время объему информации, то получим цифру порядка 14 GB. Таким образом, вы уже сейчас можете прикинуть, какой необходим жесткий диск для монтажа и обработки видео. Конечно, это зависит от того, какого рода будет обрабатываться видеоинформация, и чего именно вы хотите достичь, но, по своему опыту, могу сказать, что для домашнего видео желательно иметь свободным место для переноса 2-3 кассет, и плюс хотя бы свободных 20-30 GB для монтажа, обработки, кодирования, и записи на другой носитель. В общем, я рекомендую иметь винт от 80 GB. Сам сейчас имею в системе 2 жестких диска, общим объемом 200 GB, этого, конечно, хватает с лихвой. Впрочем, я увлекся, о том, какой рекомендуется компьютер для обработки DV видео мы еще поговорим, пока расскажу о других особенностях, которые нужно знать и иногда учитывать.

Информация на MiniDV кассету может записываться в двух скоростных режимах - это SP, либо LP, второй вариант позволяет уместить больше информации на ту же кассету, но учтите, что это все же не рекомендуемый режим, и если вы будете им пользоваться, покупайте более качественные кассеты, с хорошей пленкой.
Видео в DV формате записывается с жестко установленным качеством, единственное, что вы можете выбрать, это формат 4:3, либо 16:9. Для звука можно выбрать частоту дискретизации 33 KHz, либо 48 KHz. Рекомендую использовать частоту 48 KHz, поскольку первый вариант, все же, обеспечивает несколько глуховатый и искаженный звук.
В процессе всей съемки камерой на запись наносится специальный таймкод, содержащий системное время, он не видим и вообще никак не препятствует обычному просмотру видео с кассеты. Но имейте в виду, что каждый раз запуская и останавливая запись, в этот таймкод вносятся соответствующие временные обрывы, согласно которым, потом при перегоне видео в компьютер, удобно производить разбивку отснятых сюжетов. Учитывая это при съемке, проще будет производить монтаж. Лишний раз, по-моему, не стоит останавливать запись, особенно если предполагается скорое продолжение съемки, в противном случае будет слишком много мелких фрагментов, которые конечно можно соединить потом, но как мне кажется это не совсем удобно.

На камерах обычно имеется аналоговые видеовыходы (S-video и композитный), их можно использовать для подключения камеры к телевизору или видеомагнитофону, но, конечно же, это уже не особенно актуально, гораздо больший интерес представляют собой цифровые интерфейсы. Современные MiniDV видеокамеры обычно имеют два выхода для соединения с компьютером - это USB и собственно DV. Поскольку большинство камер сегодня сочетают в себе цифровой фотоаппарат, USB порт предназначен именно для переноса фотографий. Переписать видео с кассеты через него нельзя.
Высокоскоростной порт DV, так же известный как IEEE 1394, а так же как FireWire и i-Link, предназначен именно для переноса видео, соответственно у вас в компьютере должен быть аналогичный. Современные материнские платы могут быть по умолчанию оборудованы таким, часто IEEE 1394 порт есть на ноутбуках. Но если у вас такого нет, расстраиваться не стоит, поскольку можно купить отдельный PCI контроллер, или какую-нибудь другую карту, например звуковую или ТВ-тюнер, имеющую на борту необходимый IEEE 1394 порт.

У меня компьютер не из новых, и такого порта на материнке не оказалось. Я пошел по самому простому пути, купив самостоятельный PCI контроллер, имеющий на борту сразу 3 внешних IEEE 1394 порта и 1 внутренний. Отдал за этот девайс, буквально, 15 долларов, за это получил в комплекте еще и шнур для подключения камеры. Странно, но, по словам продавца-консультанта, такие шнуры в комплекте с камерами бывают крайне редко, с моей Panasonic камерой тоже не было.

Можно встретить IEEE 1394 разъемы двух типов, на фотографии кабель имеет как раз оба типа. Тот, что побольше, кроме как в компьютере, мне нигде наблюдать не приходилось, на видеокамерах DV выход использует более компактный вариант, на ноутбуках тоже сейчас ставят компактные DV разъемы. В общем, в зависимости от имеющихся у вас устройств и в зависимости от используемых в них разъемов, нужно иметь соответствующий кабель.
Соединив первый раз видеокамеру и компьютер, система должна обнаружить и запросить драйвер для нового устройства, для видеокамеры. Соответственно необходимо использовать компакт-диск, который был с камерой. У меня в диспетчере устройств камера выглядит следующим образом :

По сути, процесс переноса информации из видеокамеры с кассеты в компьютер представляет собой копирование информации, иногда этот процесс называют захватом, но это не совсем верный термин. Поток информации, записанный на кассету в цифровом виде, копируется в компьютер без каких-либо изменений. В результате переноса, у вас на жестком диске создается полная копия того, что было на кассете, это важно, и в этом собственно и есть преимущество DV технологии.
Кстати возможен и обратный перенос, после монтажа или отбора наиболее интересных сюжетов, с компьютера на кассету, и при этом тоже не будет потерь, поскольку все в цифре, и поток копируется один к одному. Многие знающие люди, рекомендуют именно так и поступать, поскольку на винте хранить большие объемы информации накладно, перезапись на DVD или просто конвертация в более компактный формат, повлечет неизбежную потерю качества, в то же время, записывая отборные и наиболее важные для вас видеоматериалы обратно на кассету, удастся сохранить их первоначальное качество. Хотя, если честно, MiniDV кассеты тоже дороговаты, представленные на фото TDK 60 мин, стоили по 100 рублей, поэтому в любом случае особо не разбежишься.
Для работы с видеокамерой, конкретно для переноса видео туда и обратно я рекомендую использовать программу ScenalyzerLive. Она совсем небольшая и очень функциональная. В принципе во многих известных программах видеомонтажа Adobe Premiere, Ulead MediaStudio Pro и других, есть схожие функции, но я предпочитаю все же ScenalyzerLive. К сожалению, она не бесплатная, как впрочем, и упомянутые уже видеоредакторы. Однако не стоит забывать, что мы в России, и что у нас в любом магазине, торгующем компьютерными компакт-дисками можно совершенно легально купить за несколько долларов весь необходимый софт, причем полные и полноценно работающие версии... :) ScenalyzerLive не большая, ее имеет смысл скачать из интернета, все остальные программы, о которых речь пойдет дальше проще купить на компакт-диске(ах).

При подключенной камере на интерфейсе программы выводится информация о камере и что она готова к работе, а так же выводятся управляющие кнопки. Кстати о кнопках стоит сказать подробнее, я не ожидал такого, когда впервые начал работать с DV камерой. Дело в том, что эти кнопки полностью дублируют управляющие кнопки, находящиеся на самой камере. Поэтому нет необходимости нажимать кнопки на видеокамере, гораздо проще для перемотки кассеты, начала воспроизведения, перезаписи и т.д., использовать программные кнопки, расположенные на интерфейсе программы. В общем, работать таким образом, одно удовольствие!
Совершенно замечательной возможностью ScenalyzerLive является функция автоматической разбивки всей записи с DV видеокассеты на заснятые сюжеты, начало и конец таких сюжетов, строго до кадра, соответствует моменту начала и окончания записи при съемке видеокамерой. В результате переноса информации на винт вы получаете группу .AVI файлов, разбитых строго по отснятым сюжетам, имена файлов соответствуют моменту начала записи, в названии содержится дата и время. Кодек для .AVI файлов используется соответственно DV. Как вы понимаете монтировать такой материал довольно просто, и, по сути, тоже одно удовольствие!
Вы можете не следить, за процессом переноса видео, нажимать, что-либо не потребуется, все делается на автомате: видео самостоятельно режется по сценам, после окончания записи на кассете, или окончании кассеты, процесс сам прекращается. Перенос осуществляется в реальном времени, для переноса 1 часа отснятого видео потребуется 1 час времени на перегон.
Хотя в программе имеется место для вывода информации о пропущенных кадрах, реально наблюдать их мне не доводилось, возможно, это может происходить из-за медленного жесткого диска или не достаточного быстродействия компьютера. У меня процессор iP3-1000 MHz, оба жестких диска достаточно быстрые, со скоростью вращения шпинделей 7200 об/мин. В процессе захвата загрузка процессора минимальна, поскольку какой-либо обработки видеоматериала не происходит, он лишь копируется один к одному с кассеты на жесткий диск.
Для монтажа мною была выбрана программа Ulead MediaStudio Pro v7.0, она имеет довольно дружелюбный интерфейс, наглядность представления монтируемого видео, и отличные возможности, которые удовлетворят, по-моему, даже самого требовательного юзера. Кроме этого были и чисто технические моменты, почему я ее выбрал. Именно Ulead VideoStudio работала у меня стабильнее других программ монтажа, именно с ней у меня не возникло абсолютно никаких проблем при монтаже первого отснятого мною видео. Кроме того, для этой программы есть плагин фреймсервера, необходимого для передачи смонтированного в программе видео во внешний MPEG2 кодировщик.

Ulead MediaStudio Pro относится к тяжелому классу программ для видеомонтажа, не в сравнение ему всем известный VirtualDub, но в данном случае это только к лучшему. Все же обработка DV записей - это совсем другое дело.
Принцип работы прост, вы создаете новый документ, поочередно, в требуемом порядке расставляете отснятые видеосюжеты на временные дорожки. Тут же вырезаете ненужное, пододвигаете следующие сюжеты, в качестве переходов можно добавить различные эффекты. На звуковых дорожках, наглядно можно подрегулировать уровень звука, а так же сделать плавное появление и исчезновение звука в нужных местах. Я обычно это делаю в начале и конце сюжетов, соответственно. Само собой можно наложить дополнительное музыкальное звуковое сопровождение, фоновое, или заменить им оригинальное. В общем как я уже сказал, здесь есть все необходимое, и чаще всего приходится пользоваться лишь крохотной долей тех возможностей, что заложены в программе, кроме того большой плюс в том, что вся обработка и манипуляции довольно наглядны.
После того как все будет смонтировано, есть несколько вариантов, как поступить дальше, это в частности зависит от того, какие цели вы ставите :
  • Если записать смонтированное видео обратно на пленку, то просто сохраняете результат своей работы снова в AVI формат, используя встроенный в Ulead MediaStudio Pro кодировщик DV. После чего переходите снова к работе с программой ScenalyzerLive.
  • Если планируете записывать видео на DVD-Video диски, то для этого результат монтажа необходимо кодировать в MPEG2 формат. Ulead MediaStudio Pro конечно имеет свой встроенный MPEG2 кодировщик, и в принципе можно не морочить себе голову, сохраняя смонтированное видео сразу в MPEG2, но я, наслушавшись советов знающих людей, все же предпочел использовать внешний кодек.
  • Третий вариант предполагает перенос результата монтажа во внешний MPEG2 кодировщик. Лучшим софтовым MPEG2 кодировщиком принято считать Canopus ProCoder - это уже не раз проверенно и доказано, поэтому можете сейчас принять это на веру. Впрочем, кто не хочет, можете поискать в интернете, информации по этому кодировщику на самом деле не мало. Я в свое время попробовал его, мне понравилось качество, с тех пор так и пользуюсь.
  • Может кто-то захочет сжать результаты своей работы, используя какой-нибудь MPEG4 кодек, проблем нет, можно либо сразу сохранять в AVI формат, используя любой из установленных в системе видеокодеков, либо через промежуточный AVI файл, сжатый безпотерьным кодеком. Иногда некоторые и так поступают, с целью того, что бы потом спокойно ужать полученный AVI файл в своей любимой программе-кодировщике. Кстати вроде есть и фреймсервер для переноса видео в тот же VirtualDub. Впрочем, я считаю, что перегонять DV видео в MPEG4 формат неоправданно и сегодня уже не интересно, поэтому сам не экспериментировал в этом направлении и советы давать не буду.
Для своих любительских записей я предпочел 3-ий вариант, он позволяет сжать видео в MPEG2 с максимально возможным качеством. DVD-Video к сожалению имеет потери в качестве, по сравнению с оригинальной DV записью с кассеты, но для домашнего видео оно вполне приемлемое и что более важно, именно для домашнего видео это просто идеальный вариант по удобству, поскольку DVD-Video диски в последствии можно посмотреть на любом бытовом DVD проигрывателе. Кстати, говоря о качестве, пожалуй отмечу, что оно конечно не может сравниваться с тем качеством, которое мы привыкли видеть на серийно выпускаемых DVD-Video дисках с фильмами, поскольку профессионально отснятые фильмы, на качественной аппаратуре и домашнее видео отснятое сами знаете как - это, все же, разные вещи. Разный уровень качества съемки несомненно сказывается на уровне сжатия и конечном качестве.
Canopus ProCoder имеет на мой взгляд два основных недостатка, с которыми к сожалению приходится мириться ради достижения максимального качества сжатия :
  1. Кодек Canopus ProCoder реализован в виде самостоятельной программы, по идеи необходимо иметь входящий AVI файл, что бы открыть его в этом кодировщике и запустить кодирование. Не знаю, почему разработчики не хотят выпустить кодировщик в виде интегрируемого в систему модуля, что бы при сохранении из видеоредактора можно было просто выбрать его и начать кодирование. Хотя может это и не так просто? Ситуация облегчается тем, что нашлись хорошие люди, написавшие небольшой плагин фреймсервера с поддержкой Ulead MediaStudio Pro, благодаря которому можно без проблем транспортировать видео из редактора сразу в кодировщик, без промежуточного сохранения. Это, конечно, значительно упрощает работу.
  2. Другой недостаток - это время. К сожалению, качество как обычно требует значительных временных затрат на кодирование, к тому же, как обычно, качество не обходится без двухпроходного кодирования. Для примера могу сказать, что на кодирование 10-15 минутного сюжета с максимально выставленным в кодеке качеством может потребовать до 4-5 часов обработки, компьютер у меня с процессором iP3-1000 MHz. Время так же зависит от сложности эффектов, которые вы использовали при монтаже, поскольку, конечно, они тоже требуют расчетов. Кстати в этом еще есть другой недостаток использования внешнего кодека в паре с фреймсервером, поскольку предполагается двухпроходное кодирование без сохранения промежуточного видео, при первом и втором проходе все эффекты, накладываемые на видео, просчитываются заново. Понятно, что можно этого избежать, используя для переноса не фреймсервер, а промежуточный файл, сжатый безпотерьным кодеком, но это тоже не просто, и, в принципе, там свои проблемы.
Скачав отсюда и установив плагин фреймсервера под Ulead MediaStudio Pro, при сохранении смонтированного видео, среди прочих форматов, в которые позволяет записать редактор, появится вариант PluginPac FrameServer. Вы выбираете его, указываете путь и название файла, на всякий случай можно заглянуть в настройки, и после нажимаете на сохранение. Появляется следующее окошко :

Это окно должно висеть во время всего кодирования, его нельзя закрывать. На самом же деле тот файл и путь, имя которого мы указали, не содержит видеоинформации, это всего лишь пустышка, но именно его нужно будет открыть в кодировщике Canopus ProCoder для последующего кодирования.
Интерфейс кодировщика довольно дружелюбный, понять, что нужно делать достаточно просто. Имеются три закладки :
  • Source - служит для выбора источника для сжатия, можно добавить сразу группу файлов, в нашем случае там необходимо выбрать тот файл, что получился на выходе у фреймсервера.
  • Target - основная закладка, здесь вы указываете параметры для сжатия. Имеются готовые пресеты, которые можно выбирать в зависимости от того, что вы ходите делать в дальнейшем с записью, если записать на DVD, то соответственно выбираете одноименный пресет. Хорошо, что имеется возможность на основе готовых пресетов создавать свои, таким образом, выбрав все необходимые параметры один раз, вы записываете установки и используете их в дальнейшем всегда.
  • Convert - отображает непосредственно процесс кодирования, там находится окошко в котором можно следить за текущей сценой и расчеты времени которые были и еще будут затрачены на кодирование.

Как вы уже знаете наверно, в зависимости от битрейта выбранного для кодирования видео в формат MPEG2, можно записать на стандартный DVD-Video диск от 1 до 2 часов видео стандартного формата. Соответственно, чем выше битрейт, тем больше величина потока отводится на единицу времени, и тем выше качество, но соответственно и меньше по продолжительности получится DVD видеодиск.
В принципе как понимаете, можно указать максимальный битрейт и получить на выходе максимально возможное качество. Кстати в этом случае можно вполне обойтись однопроходным кодированием, и в целом сильно сэкономить на времени кодировании, поскольку и качество кодировании ни к чему выставлять высоким. Может быть, вам в любом случае требуется записать на DVD-Video диск не более часа, тогда смело выбирайте максимальный битрейт и следуйте этому варианту.
В случае кода хочется получить и хорошее качество и записать на диск побольше видеоинформации, рекомендуется использовать двухпроходное сжатие и переменный битрет. Я использую битрейт для видео 6000-9000, он позволяет уместить на DVD диск примерно 1,5 часа видео с хорошим качеством. Время зависит от динамичности вашего видео, может быть у вас там нет резких рывков камерой, и вообще вы снимаете достаточно спокойно и не особо подвижные сюжеты, тогда время будет приближаться ближе к 2 часам, поскольку в основном будет использоваться битрейт ближе к нижнему заданному диапазону. Вообще это лишь мои рекомендации, можете сами поэкспериментировать, может быть, вас удовлетворит качество и более низкого максимального битрейта.
Что касается звука, то на этапе MPEG2 кодирования в Canopus ProCoder я предпочитаю его оставлять в WAV формате, это можно выбрать в кодировщике. К сожалению, Canopus ProCoder не умеет кодировать звук в AC3 формат, который, на мой взгляд, является более предпочтительным чем другие. Оставляя звук без сжатия, дополнительно к сжатым MPEG2 видеофайлам, создаются с тем же именем .WAV файлы. Хорошо, что программы, которые я буду дальше рекомендовать для подготовки и записи DVD-Video дисков, нормально относятся к такому варианту, они при необходимости могут самостоятельно сконвертировать звук в требуемый формат, в том числе AC3.
Чуть не забыл, есть еще один момент, с которым я вначале помучался. Необходимо строго соблюдать последовательность следования интерлейс полей. Видео, отснятое камерой, имеет чересстрочный вид, если в ходе монтажа или MPEG2 кодирования перепутать, и запустить верхнее или нижнее поле вперед того, что следовало по умолчанию у вашей камеры, то результатом будет дерганое видео. Причем уловить этот недостаток можно уже только на бытовом DVD проигрывателе, поскольку на экране компьютера, даже если была допущена ошибка, видео смотрится нормально. Рекомендую поступить следующим образом. Возьмите на пробу небольшой сюжет, секунд 30, лучше, где динамичная сцена, пропустите ее по всей цепочке монтажа, кодирования, и записи на диск. Если при просмотре на бытовом проигрывателе будет все нормально, то запомните все выставляемые в ходе обработки настройки и в частности установки полей (верхнее, нижнее в редакторе и в кодировщике), и используйте всегда те же опции при кодировании. Если же получится дерганое видео, то попробуйте изменить первое поле в редакторе, и снова сожмите, запишите на DVD и посмотрите. Думаю, со второй попытки все получится, тогда запомните, как вы все делали для последующего повторения. Камера выдает первым всегда одно и то же поле, но вроде бы, некоторые камеры в зависимости от предпочтений их производителей, могут выдавать первым разные поля. В этой ситуации радует одно, выяснив однажды очередность полей для своей конкретной камеры, уже не надо будет возвращаться снова к этому же вопросу...
После того как вы смонтировали и сжали видео в MPEG2, для последующей записи на DVD-Video диск, вы имеете группу видео файлов и группу аудио файлов, имена последних полностью соответствуют именам видео, отличаются лишь расширения. Звук на этом этапе может быть в чистом WAV виде, либо уже сжатый, на этапе MPEG2 кодирования. В общем, теперь необходимо заняться подготовкой к записи этой информации на DVD, причем нужно строго соответствовать стандарту, что бы наш DVD без проблем игрался на бытовом проигрывателе. Рекомендовать буду две программы :
  1. Sonic Solution ReelDVD - Довольно редкая программка, найти на CD было трудно, но если постараться, все же можно. Возможности программы позволяют создать DVD-Video диск с меню любой сложности и любых возможностей. Тут вам предоставляется полная свобода к творчеству, реализовать действительно можно все что угодно. Программа представляет собой лишь инструмент для подготовки диска, разработки и реализации навигации по нему, меню может быть любой структуры. Однако предполагается, что предварительно вы должны создать вид меню (статического, анимационного или видео) во внешнем редакторе. Например, я создавал статическое меню в PhotoShop, вырисовывал все кнопочки самостоятельно и т.д. Таким образом, за действительно безграничные возможности придется расплачиваться временем на подготовку DVD. Но если вы хотите создать шедевр, то эта программа - ваш выбор! Если же вам нужно просто периодически сбрасывать на DVD отснятое камерой видео, то, пожалуй, проще и эффективнее будет использовать следующую программу.

  2. Ulead DVD MovieFactory2 - Программа в довольно простой и наглядной форме в виде мастера позволяет очень быстро создать DVD-Video диск. Вы создаете новый проект, помещаете в него видео сюжеты в нужной последовательности, выбираете вид меню из имеющихся шаблонов, выбираете музыку на фон, делаете текстовые комментарии к сюжетам, и вот, собственно и все. Далее время на просчет и подготовку образа для записи, и непосредственно сама запись DVD диска. Этот вариант я сам сейчас предпочитаю использовать для создания дисков с любительским видео, поначалу использовал Sonic Solution ReelDVD, но потом надоело убивать уйму времени.
Обе программы подготовки DVD-Video дисков умеют сами же их и записывать, поэтому на этом моменте можно, в принципе, завершить эту вводную статью. На последок я лишь рекомендую вооружиться DVD-RW или DVD+RW диском, поскольку первый блин, он, как известно комом, и поэтому для первых проб и ошибок перезаписываемый диск будет как нельзя кстати. Удачи...



Совесть не отвечает или временно недоступна.

&
&
&



Virus вне форума   Ответить с цитированием
Старый 14.05.2007   #22
Модератор

 
Аватар для Virus
 
Регистрация: 03.06.2006
Сообщений: 1,501
Поблагодарили: 18 раз
Virus Приносишь большую пользу; 31%Virus Приносишь большую пользу, 31%Virus Приносишь большую пользу, 31%
Отправить сообщение для Virus с помощью ICQ

По умолчанию DivX: особенности сжатия видео в домашних условиях

DivX: особенности сжатия видео в домашних условиях


Введение

Данная статья не претендует на полное описание процесса сжатия видео в формат DivX. Тем более, что в интернете полно описаний процесса перевода видео с DVD или VCD в DivX или SVCD. Лично мне эта информация показалась недостаточной, что стало причиной собственных исследований. Ниже я опишу результаты, которые были получены мною в ходе решения конкретной практической задачи. Чтобы отыскать наиболее оптимальный режим сжатия, я проделал некоторую работу, провел различные тестирования и сравнения — их результаты будут приведены в полном объеме. Я далек от мысли «вывести универсальный для всех рецепт» — у каждого свои требования, свои предпочтения. Однако приведенная ниже информация поможет вам при решении аналогичных задач предоставит дополнительную информацию для выбора своего оптимума.
Предполагается, что читатель уже имеет определенные знания и навыки по нелинейному монтажу цифрового видео, хотя бы на базовом уровне. Также вся работа с видео будет проводиться при помощи программ VirtualDub и NanDub — навык их использования будет очень кстати.

От автора

Автор в полной мере понимает необходимость четкого структурирования материала. Однако на сегодня существует такое количество информации, посвященной сжатию видео при помощи DivX, что мне приходится идти на компромисс. Эта статья не претендует на всеохватывающее изложение всего, что касается данной темы. Последовательность изложения материала выбрана такой, чтобы максимально упростить для восприятия весь материал в целом. Я отдаю себе отчет в том, что многим неинтересны некоторые разделы этого изложения. В любом случае, я советую при первом чтении просмотреть весь материал — хотя бы ради того, чтобы запомнить, в каком разделе говорится об интересных для вас деталях. Также это важно для того, чтобы не пропустить объяснение какого-нибудь термина: все термины вводятся по мере необходимости прямо в тексте, их первое использование выделено курсивом.

Исходная задача

Итак, сверхзадача. Я захотел преобразовать видеоролики с сайта BMWfilms.com из формата Apple QuickTime 5 в DivX. Причин тому много. Это и много большая распространенность формата DivX (в частности, возможность проигрывания не только под Windows, но и под различными клонами Unix), и меньшая ресурсоемкость его декодеров (например, на моем домашнем iCel 433 исходные ролики в формате QuickTime не могут проигрываться без пропуска кадров, а результат в DivX — запросто), и наличие огромного количества программных проигрывателей на любой вкус (в контексте интересовала возможность наложения внешних субтитров: ролики-то на английском, который понимают далеко не все мои знакомые. Делать голосовой перевод у меня наглости не хватает, а вот перевести субтитры — запросто).

Распространено мнение о «нелегальности» DivX. Сам по себе формат не может быть нелегальным. Противозаконными могут быть лишь действия, противоречащие действующему законодательству — совершенно безотносительно использования формата сжатия видео DivX. Так, распространение в формате DivX видеопродукции, защищенной Законом об авторском праве, в нарушение прав распространителя является незаконным. Но не потому, что используется «нелегальный формат DivX», а потому, что нарушается закон: нарушаются права распространителя. Лицензионное соглашение с сайта BMWfilms.com позволяет для личного некоммерческого использования делать с этими материалами что угодно. Раз так — приступим!

Как прочесть видео в формате QuickTime?

Начну издалека. Этот вопрос имеет смысл осветить, так как он звучит слишком часто. В конференции FIDOnet ru.mpeg этот вопрос задается чуть ли не раз в две недели. Итак, поставим себе задачей конвертировать видео в формате Apple QuickTime в какой-либо другой формат.
Для чтения видео в формате QuickTime вам понадобится установленный проигрыватель Apple QuickTime. Номер необходимой версии зависит от содержимого файла, который вы хотите конвертировать — то есть, ваш файл должен проигрываться вашим проигрывателем. Собственно преобразование проводит программа RAD Video Tools — просто найдите нужный файл и нажмите Convert. RAD предложит вам выбрать параметры преобразования видео (я предпочитаю все преобразования делать потом — в Dub'е), после этого вы сможете выбрать кодек для сжатия видео. Я предпочитаю на этом этапе использовать сжатие видео без потерь — но это дело вкуса.
Кстати — для сжатия видео без потерь очень хорош кодек HuffYUV — его основное преимущество в том, что он обрабатывает видео в формате YUV (именно такое цветовое пространство используется в большинстве источников цифрового видео), а не RGB. Кодек сжимает видео почти вчетверо абсолютно без потерь качества.
Как ни хороша программа RAD Tools, но звук из файла QuickTime ей удается прочесть в очень редких случаях. Для записи звука из видеоролика я использовал программу Total Recorder. Эта программа устанавливает в вашу систему дополнительный драйвер устройства для вывода звука, который позволяет весь звук, издаваемый какой-либо программой, записать в файл. Установите программу, запустите проигрыватель QuickTime. В его параметрах (Edit | QuickTime Preferences… | Sound Out) установите вывод на устройство Total Recorder. Включите запись в Total Recorder'е (собственно запись начнется только после того, как проигрыватель QuickTime начнет издавать звуки). Запустите на проигрывание ваш видео клип. После окончания проигрывания остановите Total Recorder. Полученный файл вы можете сохранить как в формате wav, так и в формате mp3 (сжатие при помощи установленного в вашей системе ACM-кодека). Лично я предпочитаю сохранить звук в wav, а потом сжать его при помощи LAME.

В ходе работы я угробил приблизительно день на то, чтобы разобраться с неполадкой во взломанной версии Total Recorder 3.3. Бесплатная демонстрационная версия этой программы записывает только 40 секунд звука. После взлома программа записывает звук и дальше сороковой секунды, только вот секунды после 50-й звук безнадежно портится и тонет в хрипе и треске. Очевидно, это происходит из-за некорректного взлома программы (постфактум могу сказать, что версия программы без взлома работает отлично). Пусть это послужит иллюстрацией для любителей «ломанного» софта.
Таким образом, мы получили возможность извлечь из файла QuickTime как звуковую информацию, так и видеоряд. Что делать со звуком — ясно, об этом сказано и написано очень много. Разберемся теперь с видео.

Метод подбора параметров видео сжатия

Очевидно, что наилучшим методом подбора параметров процесса сжатия для любого видеоматериала будет «закодировать, посмотреть, оценить, скорректировать параметры, закодировать еще раз». Также очевидно, что такой метод займет неразумно много времени.
Я не претендую на новизну этого метода, однако на практике оказалось очень удобно вырезать около десяти фрагментов по 2-3 секунды из исходного материала с самыми разнородными сценами. Получился эдакий ролик длиной около тридцати секунд. Во-первых, его несложно просмотреть от начала до конца: даже с пристальным изучением некоторых кадров это не занимает много времени. Во-вторых, кодирование такого ролика занимает несравнимо меньше времени, чем кодирование всего материала. Сохраните такой ролик либо совсем без сжатия, либо в каком-то формате сжатия видео без потерь (опять же — очень хорош для этого HuffYUV). Естественно, что кодировать полученный ролик надо с тем же средним битрейтом, с которым вы планируете кодировать весь материал.
Какие сцены лучше включить в пробный ролик? Ответ на этот вопрос совсем не очевиден. Я считаю, что нужно включать максимально разнородные сцены: как с быстрыми эволюциями, так и с отсутствием движения в кадре — просто чтобы заставить кодер поработать в разных режимах. Отличным примером подбора сложных для сжатия сцен, в которых кодер выкладывается на все 100%, может послужить сравнение качества кодирования видеокодеров на сайте Doom9 - там автор предлагает сцены со взрывами, морским прибоем, множеством мелких частиц во всем кадре, ночные и подводные сцены.
Мне в некотором роде повезло: такие ролики были сделаны до меня. Для раскрутки своей продукции BMW of North America сделала 30-секундные рекламные ролики (trailers). Именно один из них я и использовал в своих изысканиях: Ambush. В качестве исходного материала я взял вариант высокого качества в формате Apple QuickTime, который вы можете скачать при помощи программы BMW film player. Этот ролик длится 30,063 секунд (24 кадра в секунду, 722 кадра) и имеет разрешение 800 на 340 точек (соотношение сторон 2,35:1). В дальнейшем изложении я буду приводить номера кадров именно из этого ролика — каждый из вас может повторить мои действия и проверить мои результаты. Этот ролик в формате HuffYUV 2.1 занимает около 180МБ (184 099 328 байтов).
На данном этапе у нас есть точная копия видеоряда, который содержался в исходном файле в формате Apple QuickTime. В следующем разделе будет предъявлено несколько кадров обработанного видео — во всех случаях использовалось сжатие видео без потерь информации.

Вычищение артефактов MPEG-сжатия

В нашем случае исходный видеоряд был уже подвергнут сжатию с потерями. При таком сжатии неизбежно возникают дефекты изображения, так называемые артефакты (artifacts). Взгляните, например, на этот кадр:


Невооруженным глазом видны квадраты, которые возникают при выделении кодером семейства MPEG недостаточного количества бит для данного кадра. При проигрывании видео со скоростью 24 кадра в секунду эти дефекты не так заметны, однако все же артефакты четко видны. Также стоит учитывать, что MPEG-видеокодеру (а семейство кодеров DivX использует алгоритмы стандарта MPEG-4) сложнее передать множество четких граней, чем поле с более-менее плавно меняющейся окраской: качество результата во втором случае будет визуально восприниматься значительно лучше. Потому для облегчения жизни кодеру эти четкие границы между квадратами нужно сгладить.
Попробуем подобрать видеофильтр, который позволит решить нашу проблему.
Видеофильтр — это программа, которая выполняет дополнительную обработку видео в процессе нелинейного монтажа. Действие фильтра аналогично различным эффектам в графическом редакторе: берется изображение на входе и с помощью некоторого алгоритма строится изображение на выходе. Некоторые видеофильтры могут оперировать не с одним кадром, а с цепочкой из нескольких кадров. VirtualDub содержит ряд стандартных фильтров. Также вы можете найти множество полезных фильтров для VirtualDub на сайте Дональда Графта.

2D Cleaner

Версия: Beta 0.6, автор — Джим Касабури, также проверялась версия 0.9, оптимизированная и доработанная Дональдом Графтом. Этот фильтр усредняет значения пикселов в заданном радиусе от исходного пиксела, если их значение не превосходит порога. Это позволяет избавиться от низкоуровнего шума, не смазывая резких границ. Даже из этого описания видно, что этот фильтр вряд ли нам подходит.
Посмотрим на результаты его работы: при низких значениях параметров (10 для порога и 2 для радиуса) получаем слишком слабое улучшение качества картинки:


При высоких значениях параметров (20 для порога и 5 для радиуса) картинка слишком сильно смазывается:


Ни при каких других значениях параметров я не смог получить удовлетворительных результатов.

Smoother

Это стандартный фильтр, он изменяет значение каждого пиксела в зависимости от среднего значения пикселов, которые его окружают. Этим фильтром не удалось добиться хоть сколько-нибудь заметных улучшений даже при высоком значении порога:


Однако уже при таком значении порога заметно сглаживание существенных деталей изображения (обратите внимание на лицо водителя):


Для сравнения — исходный кадр:


Temporal Smoother

Это также стандартный фильтр. Он должен усреднять значение пикселов из кадра в кадр — то есть в зависимости от времени, а не от пространственной координаты. Очевидно, что этот фильтр нам не подойдет:


Та же картина сохраняется при любых значения параметра (количества кадров для усреднения).
Тот же результат показал фильтр Temporal Cleaner, версия Beta 0.5, автор — Джим Касабури. По сути это сильно модифицированный и доработанный стандартный Temporal Smoother, однако и он нам не подходит.

Smart Smoother

Версия: 1.1, автор — Дональд Графт. Этот фильтр усредняет значения пикселов, однако сохраняет структуру изображения, что делает его идеальным для квадратных артефактов, характерных для сжатия MPEG/JPEG. Автор утверждает, что фильтр не то что не размывает изображение, а даже чуть повышает четкость.
Вроде как раз такой фильтр нам и нужен. Посмотрим, на что он способен:


Результат соответствует ожиданиям, однако не все так радужно. Вопреки утверждению автора, фильтр заметно размывает картинку:


Для сравнения — исходный кадр:
Я также попробовал использовать доработанный вариант этого фильтра, Smart Smoother HQ (High Quality), версии 2.11, написанный Клаусом Постом. Эта вариация содержит дополнительные возможности, призванные сохранить структуру исходного изображения и уменьшить размывание. Результат работы этого фильтра превзошел все ожидания.
Легко видеть, что квадраты в исходном видеоряде имеют размер 8 на 8, потому в качестве радиуса действия фильтра я выбрал 11 — с запасом больше размера артефакта, от которого я хочу избавиться. Порог срабатывания и оставил по умолчанию — 50. Качество получаемого результата не сильно зависит от этого параметра. Значение Amount, конечно, было максимальным — иначе зачем весь сыр-бор? Я выбрал взвешенный режим усреднения (Weighted average) пикселов — именно его автор советует для кино (кстати, в исходном фильтре Smart Smoother Дональда Графта используется только режим Average Pixels).
При выключенном параметре Weighed with difference этот фильтр смазывает изображение, пожалуй, еще больше, чем Smart Smoother:


Однако стоит нам включить Weighed with difference, как картина кардинально меняется, даже присутствует сетчатая структура на месте наших квадратов (Maintain Diffweight = 0):


Кстати, этот фильтр имеет прекрасную возможность: он умеет наглядно показывать, он делает. При включении параметра Visualize Blur весь кадр заливается белым цветом, а серым отмечаются области, где работает механизм повышения четкости. То есть, белые области размываются, черные — нет. Серые — пропорционально яркости. Этим методом очень удобно проверять, не размывает ли кодер важные для нас детали, и не сохраняет ли лишних артефактов. Главное — не забыть выключить этот параметр перед запуском процесса сжатия.
Так, картинка при выключенном Weighed with difference выглядит так:


При включенном Weighed with difference:


Эти две иллюстрации подтверждают увиденное ранее: при включении Weighed with difference изображение размывается намного меньше, причем даже сохраняется сетчатая структура от наших квадратов.
К счастью, мы можем управлять чувствительностью механизма определения деталей изображения при помощи параметра Maintain Diffweight. Если мы установим его значение в 5, то исчезнет сетка — с другой стороны, изображение все еще будет размываться много меньше, чем при выключенном Weighed with difference:


Также мы можем убедиться, что и в кадре 200 детали лица водителя не размыты:


Таким образом, для того, чтобы убрать артефакты MPEG-сжатия, лучше всего подходит фильтр Smart Smoother HQ в режиме Weighted average, Weighed with difference, а режим Visualize Blur позволяет наглядно и удобно подобрать необходимое значение параметра Maintain Diffweight. Полученный результат был записан в файл со сжатием без потерь — для того, чтобы не выполнять эту операцию каждый раз при сжатии DivX. Фильтр Smart Smoother HQ исключительно ресурсоемкий: обработка 30-секундного ролика на Intel Pentium 833 MHz длится 14 минут (исходный файл и результат сжаты HuffYUV). Также стоит помнить о том, что и этот фильтр сглаживает изображение — в моем случае, с этим можно смириться в силу огромного разрешения исходного материала. Если у вас на входе запись с ТВ-тюнера с разрешением в 384 пискела, вас вряд ли устроит такое снижение четкости. Как я уже говорил выше, не существует универсального рецепта: для каждого случая фильтры и настройки придется подбирать отдельно.
Интересно также привести такое косвенное подтверждение сказанного выше: все фрагменты после обработки разными фильтрами были сжаты кодером DivX 5 в режиме 1-pass quality based, quantizer 4 (quality 93%). Я получил файлы следующих размеров (в байтах):

2D Cleaner - 5 443 584
2D Cleaner optimized - 5 398 528
Smoother - 5 056 512
Temporal Smoother - 5 767 168
Temporal Cleaner - 5 783 552
Smart Smoother HQ - 4 755 456

В этом режиме сжатия размер файла тем меньше, чем больше сглажено изображение (тем проще кодеру сжимать). Тут мы видим, что некоторые фильтры сглаживают существенно лучше других — это Smoother и Smart Smoother. Выбор между ними был обоснован выше на основании качества результата.

Анализ многообразия DivX-кодеров

На сегодня в семействе DivX существуют кодеры версий 3, 4 и 5. Кодер 3-й версии представляет собой кодер Microsoft MPEG4 v.3 со взломанными ограничениями, как то: запрет записи в avi-файл и прочие. Собственно алгоритм сжатия не был изменен в процессе взлома, потому кодер DivX 3.x создает такой же поток данных, как и MS MPEG 4.3. Однако, DivX использует другую подпись кодера (FourCC) что приводит к тому, что видео в формате DivX не воспроизводится декодером MS MPEG 4.3. Последняя немодифицированная версия DivX кодера — 3.11. Позже кем-то была выпущена версия 3.20, которая содержала дополнение к алгоритму сжатия: механизм определения смены сцены (scene change detection). Также иногда в сети можно встретить DivX версии 3.22, которая по части сжатия видео ничем не отличается от 3.20.
Кодер DivX версии 4 был выпущен DivX Networks на основе завершившегося провалом проекта Open DivX — попытки создать MPEG-4 кодер с нуля (а, значит, полностью легальный — то есть без украденного кода Microsoft). Проект Open DivX работал по схеме с открытыми исходными кодами (open source), DivX Networks же свой код не разглашает. Первые версии кодера DivX 4 были весьма сырыми и давали более чем посредственный результат: это отрицательно сказалось на авторитете кодера DivX 4. Тем не менее, после вылова из кодера DivX 4 ошибок, мы получили отличный кодер видео: поддержка новых режимов кодирования, включая встроенную поддержку двухпроходного кодирования, множество настроек, ранее недоступных в DivX 3. Последняя версия кодера: DivX 4.12. На смену линии DivX 4 пришел DivX 5 — причем некоторые ошибки кодека DivX 4.12 так и перекочевали в более поздние версии, то есть DivX 5. Поэтому я настоятельно не рекомендую сегодня использовать кодеки DivX 4-й версии — даже минимально функциональная версия кодека DivX 5 полностью включает в себя функциональность DivX 4.12.
Следующая версия DivX-кодера в исполнении DivX Networks — версия 5.0, которая по сути своей продолжает линию DivX 4 (один из файлов поставки DivX 5.0 имел номер версии 4.13). В пятой версии нам предлагают еще больше сервисных возможностей, например, пресеты (preset), обрезка видео (cropping), deinterlace и так далее. Также пятая версия содержит существенные дополнения к алгоритмам кодирования видео: поддержка B-frames, Global motion compensation, работа с векторами движения с повышенной точностью (до четверти пиксела — quarter pixel). Впервые была представлена психовизуальная модель, которая учитывает особенности человеческого зрительного восприятия для определения областей видео, где можно сэкономить на размере: сделать картинку чуть похуже — ведь все равно глаз не заметит. Начальные версии DivX 5 содержали уйму ошибок в новом коде, которые часто приводили к краху программы сжатия видео или получению видео отвратительного качества. Последняя на сегодня версия — 5.02 — относительно стабильна и не замечена в создании откровенно провальных результатов.
Также заслуживает упоминания то, что DivX Networks решила начать получать деньги за свой видеокодер. DivX 5 поставляется в трех вариантах: DivX 5, DivX 5 Pro Ad, DivX 5 Pro Licensed. Каждая из версий содержит полнофункциональный декодер видео: то есть, если вы не планируете использовать кодер DivX 5 для сжатия видео, вам вполне достаточно минимальной версии DivX 5. Также первый из указанных вариантов кодера DivX 5 поддерживает сжатие видео во всех режимах, но дополнительные возможности сжатия ограничены в объеме кодера DivX 4 — нет поддержки поддержки B-frames, Global motion compensation, работы с векторами движения с повышенной точностью. Правда, психовизуальную модель использовать можно. Второй и третий вариант кодера абсолютно эквивалентны функционально и поддерживают все новинки DivX 5. Разница между ними в том, что Ad версия дополнительно устанавливает вам в систему программу для показа рекламных банеров — таким образом DivX Networks получает деньги за Pro-версию своего кодера. Licensed-версия рекламу не показывает, зато ее покупка стоит $30. В интернете можно найти множество программ для взлома DivX 5 Pro Licensed, однако лично я к ним отношусь более чем осторожно: не хочу для создания архивных копий видео пользоваться программой, в которой колупались шаловливые ручки какого-то хакера. Выше я уже приводил пример с Total Recorder 3.3: взлом программы привел к полной ее неработоспособности. DivX 5 Pro Ad функционально совершенно аналогична DivX 5 Pro Licensed, реклама показывается только в случае наличия соединения с интернетом — все не так уж и плохо. К тому же отключить программу для показа рекламы более чем просто.
Ради полноты картины замечу, что на сегодня существует и развивается проект по созданию видеокодера MPEG-4 с открытым кодом — речь идет о XviD. Однако этот кодер весьма далек от стабильности: то и дело выпускаются версии, которые дают абсолютно недопустимые результаты (см. сравнение качества кодирования видеокодеров на сайте Doom9). Мне кажется неразумным использовать такой кодер для создания архивных копий видеоматериала.

Выбор режима сжатия

Существует четыре режима сжатия, в которых работают кодеры стандарта MPEG-4 (в частности, DivX) — это однопроходный с постоянным битрейтом, однопроходный с переменным битрейтом, однопроходный с постоянным качеством и двухпроходный. Рассмотрим подробнее принципы работы каждого из режимов.

Однопроходный режим с постоянным битрейтом

Однопроходный режим с постоянным битрейтом самый простой: каждый кадр (или группа кадров — например, 25 последовательных кадров, это одна секунда видео) имеет одинаковый размер. Результирующий поток видеоданных имеет постоянный битрейт, что и определяет основное применение такого режима: цифровое видеовещание (digital video broadcasting). Также следует помнить, что алгоритм этого режима весьма простой, и, соответственно, нересурсоемкий — это может оказаться очень полезным в случае сжатия видео в реальном времени, например при оцифровке видео. Однако, результаты, полученные в таком режиме, существенно уступают результатам в других однопроходных режимах. На сколько мне известно, ни один из кодеров DivX не позволяет сжимать видео в таком режиме. Если вам необходим такой режим сжатия — а это, повторю, допустимо только в случае видео вещания — обратитесь, например, к решениям от Microsoft: их вещательный сервер содержит поддержку кодеров MS MPEG-4.

Однопроходный режим с переменным битрейтом

Однопроходный режим с переменным битрейтом реализует простейшую схему по избавлению от главного недостатка постоянного битрейта: одинаковое количество бит на каждую сцену, вне зависимости от сложности этой сцены для сжатия. Этот режим реализует простую схему: если кадр простой для сжатия, то мы используем лишь часть выделенных для нее битов. Остальные биты «откладываются» в своего рода копилку — резервуар (resevoir). Благодаря этому на сложных сценах мы можем использовать больше бит для сжатия кадра — заимствуется часть битов из резервуара. Данная схема проста и эффективна, потому с одной стороны она дает много лучшее качество изображения, чем в режиме с постоянным битрейтом. А с другой стороны — алгоритм сжатия не на много сложнее и вполне может использоваться для сжатия видео в реальном времени.
Не следует, однако, переоценивать эффективность данной схемы: объем резервуара ограничен, потому слишком часто встречаются проблемы такого рода: длинная статичная сцена, а резервуар полон. Нам бы кодировать кадры с малым количеством движения с низким битрейтом да откладывать биты в копилку — ан нельзя, алгоритм запрещает. Поэтому конец длинных статичных сцен всегда имеет слишком высокое качество (относительно среднего качества сжатого материала). Другая крайность — длинная динамичная сцена. Нам нужны дополнительные биты из резервуара, но резервуар уже исчерпан в начале быстрой сцены. Кадры кодируются со средним битрейтом, которого здесь слишком мало. Потому конец длинной динамичной сцены имеет слишком низкое качество.
Этот и только этот режим был в своем время реализован в кодере DivX 3.11 (3.20 лишь дополнил его механизмом определения начала новой сцены). Две вариации этого кодера — Fast motion и Low motion — это не более чем пресеты, оптимизированные под динамичные сцены и под сцены с малым количеством движения. Поскольку редкий материал включает в себя только динамичные или только статичные сцены, то использование любого из этих режимов не дает оптимального результата.
В свое время — когда не было альтернативы DivX 3 с его однопроходным режимом — был даже создан инструментарий, который позволял склеивать видеоматериал из кусочков: эта сцена лучше смотрится закодированная Low motion, а эта же — напротив, High motion. Можете себе представить, насколько утомительным был процесс монтажа видео по такой схеме — существовавшие тогда алгоритмы автоматизации такого процесса были далеки от совершенства.
В кодерах DivX 4 и 5 этот режим называется «1-pass». Основной параметр в этом режиме — средний битрейт результирующего видеопотока. Следует понимать, что в результате описанных выше манипуляций с резервуаром на отдельный кадр может быть отведено битов как меньше среднего, так и больше. Также стоит упомянуть о том, что DivX 3 считает, что 1 kbps = 1024 bps, а для DivX 4/5 1 kbps = 1000 bps.

Однопроходный с постоянным качеством

Название этого режима — «с постоянным качеством» — не совсем корректно. В процессе сжатия остается постоянным так называемый quantizer — численная характеристика степени сжатия кадра. В программе NanDub этот параметр менее лаконично, но более вразумительно называется степень игнорирования деталей (detail removal factor, DRF). Стандарт сжатия MPEG использует аналогичное стандарту JPEG сжатие графической информации в кадре. Особенность этой схемы сжатия состоит в том, что чем выше степень сжатия, тем больше на сжатом изображении заметно квадратных блоков. Именно эту степень сжатия и описывает степень игнорирования деталей — чем этот показатель выше, тем больше сжатие, тем ниже качество, тем более заметны квадраты. Значения этого показателя могут быть от 2 (максимальное качество) до 31 (минимальное качество).
Данный эффект легче всего проиллюстрировать на примере сцены в кадрах 275-286: машина проносится мимо камеры на фоне темного неба, которое местами освещено несколькими источниками света:


Qualtiy: 100%, quantizer — 2.


Qualtiy: 90%, quantizer — 5.


Qualtiy: 80%, quantizer — 8.

В кодерах DivX 4/5 такой режим сжатия называется «1-pass quality based», основной параметр — средний уровень качества. В кодере DivX 5 также можно непосредственно указать значение quantizer — это позволит нам легко составить таблицу соответствия «уровня качества» в понимании DivX 5 и «степени игнорирования деталей»:

Quality, %_!_100_!_97_!_93_!_90_!_86_!_83_!_79_!
Quantizer__!___2_!__3_!__4_!__5_!__6_!__7_!__8_!

Использовать более низкие значения quantizer'а я настоятельно не советую: квадраты будут очень заметны.
Кодер DivX 3 не поддерживает такой режим. Мне неизвестны программы, которые бы заставляли этот кодер работать в таком режиме.
Режим с постоянным качеством использует наиболее простой алгоритм сжатия, потому этот режим в первую очередь рекомендуется для сжатия видео в реальном времени — такой способ кодирования самый быстрый. Основной недостаток этого режима — мы не можем узнать заранее (до сжатия), какой размер будет иметь результат. Так, мы можем захотеть переписать час видеозаписи вечеринки с видеокамеры и записать его на один CD-R. Используя однопроходный режим с постоянным качеством мы рискуем получить как слишком маленький, так и слишком большой файл.

Двухпроходный режим

Как вы могли догадаться из названия, сжатие видео в этом режиме проводится в два прохода и, соответственно, занимает примерно вдвое больше времени. В первый проход собирается статистика о сжимаемости видео материала. Во втором проходе эта статистика используется для перераспределения битов, причем биты могут перераспределяться не только в пределах некоторого небольшого промежутка времени, как было в случае однопроходного режима и схемой с резервуаром битов, а на протяжении всего материала.
Очевидно, что именно двухпроходный режим обеспечивает максимальное качество сжатия видео. В сравнении с однопроходным режимом с переменным битрейтом он лучше, потому что по сути позволяет иметь резервуар сколь угодно большого размера, четкую стратегию «какой сцене сколько бит из резервуара можно отдать» и, как следствие, отличную точность предсказания размера результата сжатия. По сравнению с однопроходным режимом с постоянным качеством двухпроходный режим может использовать кадры с меньшей степенью игнорирования деталей там, где это более заметно, и с большей — там где это менее заметно. Это приводит к более экономному использованию битов и, соответственно, к меньшему размеру результата сжатия при том же видимом качестве.
Кодеры DivX 4 и 5 содержат встроенную поддержку двухпроходного режима: у них есть два режима, для первого (2-pass, first pass) и второго проходов (2-pass, second pass) соответственно. Таким образом вы можете пользоваться двухпроходным кодированием при помощи любого видео редактора, который позволяет выбрать кодер видео.
Для использования кодера DivX 3 в двухпроходном режиме была создана модификация редактора VirtualDub, которая называется NanDub. Учтите, что NanDub был создан на основе относительно старой версии VirtualDub, потому в нем не содержатся исправления ряда ошибок, в частности для корректной работы с DivX 5. Использовать NanDub имеет смысл только там, где VirtualDub бесполезен: двухпроходное кодирование в DivX 3, создание avi файлов с двумя звуковыми дорожками и использование в avi VBR mp3 звуковой дорожки. Также следует учесть то, что NanDub требует наличия в системе кодера именно версии 3.11 — усовершенствования версий 3.20 и 3.22 полезны только для однопроходного режима, а в двухпроходном режиме они лишь мешают и портят результат.
К сожалению автор программы NanDub избрал простейший для программирования, но далеко не самый простой для использования, путь: он просто вывел в несколько окон настройки уйму параметров: как собственно кодера, так и алгоритма двухпроходного сжатия. Часто эти параметры влияют друг на друга вплоть до взаимного исключения. Некоторые параметры влияют на граничные режимы работы, которые практически никогда не встречаются на практике — эти параметры практически бесполезны. Долгое время NanDub был наилучшим решением для двухпроходного кодирования видео, за это время накоплено огромное количество опыта по выбору параметров сжатия. На русском языке информация наиболее полно представлена в руководстве Алексея Шашкова. Среди руководств по NanDub хочу выделить руководство, подписанное Koepi.
Обращаю ваше внимание также на такую очень важную тонкость: при первом и втором проходе необходимо использовать один и тот же источник видео материала. Это достаточно прозрачно, когда вы загружаете в редактор один и тот же файл. Однако следует помнить, что на вход кодера поступает результат обработки видео различными фильтрами — то есть набор фильтров для первого и второго проходов должен быть одинаковым и фильтры должны использовать абсолютно одинаковые настройки. В противном случае при втором проходе будет использоваться файл статистики, который не соответствует сжимаемому видео материалу. Результаты в таком случае непредсказуемы, наверняка вы не получите хороший результат.

Так какой режим выбрать?

Лично я являюсь сторонником максимально качественного сжатия видео, потому для меня выбор однозначен: двухпроходный режим. Даже если задача состоит в оцифровке видео, я считаю вполне доступным на сегодня организовать захват видео в какой-либо формат сжатия без потерь (например, HuffYUV) — при нынешних ценах на жесткие диски это более чем доступно. В этом случае вы потратите намного больше времени, чем в случае оцифровки и параллельном сжатии видео в реальном времени, зато качество результата будет несравнимо лучше. Также такой режим существенно снижает требования к тактовой частоте процессора, на котором будет проводиться захват видео.

Размер видео

Наиболее объективной числовой характеристикой качества сжатого видео из известных мною на сегодня является среднее количество бит на пиксел (с учетом частоты кадров). Впервые я столкнулся с этой характеристикой в пакете для создания сжатых DivX копий DVD дисков GordianKnot. Эта величина отлично отражает качество сжатого видео для однородных источников видео: согласно моей статистике в почти 200 пиратских копий фильмов, для цифрового источника высокого качества (например, DVD) эта величина должна быть равна как минимум 0,20 для отсутствия в видеоряде явных огрехов кодирования. В случае, когда эта характеристика превышает 0,26, результат сжатия в DivX визуально идеален. В случае кодирования с VHS или видеокамеры (из-за наличия намного большего количества шумов) лишь результат сжатия при значениях выше 0,35 не вызывает отвращения. Таким образом, эта характеристика отражает степень передачи мелких деталей, а точнее — степень потери мелкий деталей в результате сжатия DivX.
Очевидно, что если мы снизим разрешение исходного видеоряда, то мы получим возможность выделить больше бит на каждый пиксел в кадре, а, значит повысим среднее количество бит на пиксел. С другой стороны понятно, что сильно уменьшая разрешение видеоряда мы будем терять мелкие детали. В некотором диапазоне эти две тенденции компенсируют друг друга и выбор компромиссного варианта зависит скорее от выбирающего. Так, я встречал человека, который предпочитает уменьшать размер видео до примерно 460 пикселов в ширину, что позволяет ему добиться значения около 0,35-0,40 для среднего количества бит на пиксел. Другие же считают, что уменьшение размера кадра привносит недопустимое количество искажений — хотя при высоком разрешении будет больше искажений за счет сжатия DivX (ведь среднее количество бит на пиксел получается меньше).
Для себя выбор размера видео я обосновываю другими причинами, которых существует целая уйма. Ниже я приведу все известные мне — возможно есть еще какие-то соображения. Учитывая сказанное выше, в первом приближении будем считать допустимым размер кадра по горизонтали от 460 до 800 пикселов.

Разрешение исходного материала

Причина первая — разрешение исходного материала. Очевидно, что не имеет смысла увеличивать размер видео: новых деталей это не добавит. Из-за того, что телевизионный сигнал обеспечивает четкость по горизонтали примерно в 500 точек, а стандарт DVD — примерно в 700 (720 или 704), то про 800 пикселов по горизонтали можно забыть. Разве что вы сами создаете видеоролик — например в 3D Studio. Или кодируете ролики с сайта BMWfilms.com ;-) В любом случае исходный материал в 800 пикселов в ширину -- это исключительная ситуация.

Разрешение монитора

Вторая причина — разрешение монитора. Знатоки считают — и с ними можно согласиться — что наивысшего качества воспроизведения видео на компьютере можно достичь, используя разрешение по горизонтали равное разрешению видео материала. В этом случае не используется масштабирование видеоряда, которое может привести к некоторому снижению качества картинки. Вы наверняка знаете, что все видеокарты поддерживают разрешение в 640 или 800 пикселов по горизонтали. Изредка также возможно выставить разрешение в 512 пикселов, однако я ни разу не слышал про видеокарты, способные выдавать разрешение в 704 или 720 пикселов. Честно говоря, поскольку подавляющее большинство народу не напрягает себя уменьшением разрешения ради просмотра видео, а смотрит прямо в рабочем разрешении (800, 1024, 1280 — у кого как), то эта причина носит скорее теоретический характер. Тем не менее для полноты картины я упомянул и ее.

Делимость чисел

Еще одна причина — делимость чисел. Дело в том, что на размер сжатого видео кодер DivX накладывает некоторые ограничения: макроблоки, на которые разбивается кадр в процессе сжатия, имеют размер 16х16 пикселов. Таким образом крайне желательно, чтобы размер результата сжатия имел целое количество макроблоков по горизонтали и вертикали — то есть делился на 16. Нарушение этого правила приводит иногда к весьма интересным и очень заметным артефактам, посмотрите, например, на кадр из фильма Snatch, закодированного в веселом состоянии одним моим знакомым в размер 592х321. Так его показывает декодер DivX 3.11:


А теперь посмотрите, как этот же кадр показывает декодер версии 5.02 (да и любая другая версия из линейки 4.х/5.х):


На протяжении всего фильма несколько раз снизу кадра появляются то голубые, то фиолетовые, то желтые пятна. Безусловно — это ошибка декодера. Декодеры версии 3 не содержат такой ошибки.
Также обращаю внимание, что DirectShow совместимые декодеры версий 4 и 5 при воспроизведении видео, которое имеет нечетный размер по вертикали, добавляет снизу кадра зеленую полоску высотой в один или три пиксела (чтобы высота кадра стала кратна 4), которая также здорово портит впечатление:


Кстати, всех описанных выше недостатков лишен DirectShow MPEG-4 декодер ffdShow. Он поддерживает воспроизведение видео в форматах DivX 3, 4, 5 (включая поддержку всех новый возможностей формата DivX 5), MS MPEG 4 v.1, v.2, v.3 и XviD. Этот декодер оптимизирован по скорости и работает примерно на 20-40% быстрее штатного декодера DivX. Он лишен основного недостатка DivX 4/5: в случае нехватки мощности процессора декодер пропускает кадры, а не воспроизводит видео с меньшей скоростью, что приводит к потере синхронизации между звуком и видео. Также декодер содержит исключительно разумное решение для выставления уровня постпроцессинга видео: уровень постпроцессинга регулируется автоматически в зависимости от загрузки процессора. В ffdShow вы сможете найти дополнительные фильтры по сглаживанию видео и для подчеркивания деталей, по добавлению шума для улучшения визуального восприятия низкокачественного видео и, конечно же, возможность регулировать яркость, контраст, цветность. Этот декодер разрабатывается по схеме с открытыми исходными кодами. На компьютерах некоторых конфигураций этот декодер работает медленее декодера DivX — однако будьте же снисходительны: проект пока только развивается. В любом случае вам стоит его попробовать — если у вас он будет работать нормально, то вы останетесь им довольны.
Очень распространено мнение, что кратный 16 размер видео нужен для того, чтобы при воспроизведении включались аппаратные возможности видеокарты по масштабированию видеоряда — т. н. оверлей (overlay). Это не так: в нормальном случае оверлей включается всегда при воспроизведении видео, вне зависимости от размеров кадра. Данное мнение сложилось из-за того, что многие достаточно распространенные видеокарты (Matrox G100, G200, G400, G450, некоторые модели nVidia Riva TNT) содержали ошибку в драйверах, которая позволяла использовать оверлей только для видео записей с горизонтальным размером кадра кратным 16 или 32. Для исправления этой ситуации была создана программа DivX G400 — она автоматически увеличивает размер видеоряда до числа, кратного 16 или 32 (за счет добавления черных полос по краям). Позже эта программа обросла большим набором удобных и полезных функций — например показ субтитров поверх видео, изменение соотношения сторон видео или частоты кадров «на лету» — так что теперь многие используют эту программу, даже если их видеокарта верно работает с оверлеем.
Вы можете сказать: «ну предположим, теперь у нас в 16 раз меньше вариантов, но и в этом случае между 460 и 800 их остается более чем достаточно: 20 штук». Давайте вспомним про соотношение сторон кадра. Как вы наверняка знаете, в подавляющем большинстве случаев видео записи имеют соотношение сторон 4:3, 16:9 или 2,35:1. Таким образом нам нужно выбрать такой размер по горизонтали, чтобы и размер по вертикали (полученный при помощи простой пропорции исходя из заданного соотношения сторон) также делился на 16. Легко видеть, что для соотношения 4:3 наилучшими вариантами получаются 768х576, 704х528, 640х480, 576х432 и 512х384. Для соотношения 16:9 (1,77:1) хороши 768х432, 656х368 и 512х288. Для 2,35:1 подойдут 752х320, 640х272 и 528х224. Иногда также встречается материал с соотношением сторон в 5:3 (1,66:1) — тогда подойдут 800х480, 720х432, 640х384, 560х336 и 480х288; а для 1,85:1 сгодятся 800х432, 624х336 и 592х320. По причине, указанной выше в замечании, не кратные 32 размеры по горизонтали не пользуются популярностью — хотя эта мера предосторожности совершенно излишняя — кратности 16 вполне достаточно.

Скорость декодирования

Вы наверняка не раз слышали, что видео записи, сжатые DivX, не могут нормально воспроизводится на слабых компьютерах. «Слабый» — это достаточно неточная характеристика, попробуем разобраться в этом вопросе подробнее.
Экспериментальным путем было установлено, что ресурсоемкость декодирования видео в DivX зависит от размера кадра — по сути от количества блоков, которые необходимо декодировать в единицу времени. Так, на моем домашнем Intel Celeron 433 MHz воспроизводятся все видеоролики в формате DivX, которые мне приходилось видеть, с размером вплоть до 800х340 (если не используется DivX 5 Qpel). Естественно, что для видео с большим размером кадра уровень постпроцессинга минимален, тогда как для видео с меньшим кадром вполне возможно и повысить качество декодирования. (Кстати, я уже и забыл, когда я в последний раз делал это вручную: декодер ffdShow позволяет регулировать уровень постпроцессинга автоматически в зависимости от загрузки процессора). На другой доступной мне для исследований машине — Intel Celeron 333 MHz — нормально можно воспроизвести только видео размера меньше, чем 496х372, 512х368 или 640х272 — то есть не более 190 тыс. пикселов в кадре. Естественно, все это при минимальном уровне поспроцессинга, использовании оптимизированного по скорости ffdShow и звуковой дорожке у видеоряда в формате mp3 — никакими ухищрениями невозможно повысить вычислительную мощность процессора: именно к ней декодирование DivX предъявляет повышенные требования.

Так какой размер выбрать?

В моем случае видео имеет соотношение сторон 2,35:1, причем размер по вертикали (340) не кратен 16. Очевидно, мне нужно уменьшить размер кадра. Абсолютно всем приведенным выше требованиям удовлетворяет разрешение 640х272, потому я остановился именно на нем. Так бывает не всегда, потому я в первую очередь советую выбирать разрешения кратные 16 — они перечислены в разделе Делимость чисел — и не увеличивать размер кадра. Требованием из раздела Разрешение монитора вполне можно пренебречь.
Обращаю ваше внимание, что уменьшение ширины на 20% позволяет практически на 40% уменьшить количество пикселов в кадре, что, в свою очередь, при том же битрейте приводит к примерно 60% увеличению среднего количества бит на пиксел. И, конечно же, пропорционально уменьшается требования к ресурсам процессора при декодировании видео.

Изменение размера видео

В каждом графическом редакторе используется два основных метода изменения размера изображений: линейная и кубическая интерполяция — bilinear и bicubic. Первую надо использовать при уменьшении размера, вторую — при увеличении. Нарушение этого правила приводит к нежелательным искажениям изображения, которые наиболее наглядно проиллюстрированы на сайте Nicky Pages. В предыдущем разделе мы уже договорились, что мы всегда уменьшаем размер кадра — значит нам нужно использовать линейное сглаживание. Выбор метода однозначен при работе со статическими изображениями — а вот в обработке видео не все так просто.
При использовании кубического сглаживания на границах объектов будут появляться четкие границы. Это, однако, совсем не плохо для подготовки к сжатию MPEG-4 — скорее наоборот. Революционное новшество стандарта сжатия MPEG-4 по сравнению с предыдущими (MPEG-1 и MPEG-2) состоит в том, что алгоритм способен обнаруживать в кадре движущиеся объекты, после чего проводится разделение кадра на статичные и подвижные области и сообразно этому делению разным областям кадра раздаются биты. Так вот подчеркивание границ объектов в результате кубической интерполяции играет на руку механизму нахождения движущихся объектов. С другой стороны алгоритму MPEG-4 куда как легче сжать изображение с более плавными цветовыми переходами: например в моем случае сжатый 1-pass quality based 100% quality DivX 5 видеоряд уменьшенный до 640х272 при помощи линейной интерполяции занимает приметно на 10% меньше места в сравнении с таким же видеорядом, уменьшенным при помощи кубического алгоритма. Конечно, не стоит забывать и о личных предпочтениях каждого: кому-то нравится подчеркивать детали, а кому-то нравится картинка с плавными цветовыми переходами.
Именно по описанным выше причинам до сих пор не устоялось единое мнение о том, какой метод интерполяции надо использовать при уменьшении размера видеоряда. Также нельзя не упомянуть о возникновении нескольких модификаций кубического метода, которые в разной мере подчеркивают детали, например bicubic soft, bicubic sharp.
Еще хочу упомянуть о таком распространенном заблуждении: кубическая интерполяция более точная (в частности, требует больших вычислительных ресурсов), чем линейная — а значит она лучше. Это неверно: на сайте Nicky Pages показан типичный пример — по-моему вполне достаточно посмотреть своими глазами и убедиться в превосходстве линейного метода при уменьшении размера.

Выбор кодера

Следующий вопрос — какой кодер выбрать и какие параметры использовать. Лучшее из известных мне на сегодня сравнение качества кодирования видео кодеров на сайте Doom9 лично меня не вполне устраивает: в нем используются настройки кодеров по умолчанию и совсем нет анализа влияния отдельных параметров на качество результата. Это сравнение лишь выявляет явных аутсайдеров (RealVideo 9, Windows Media Video 8, vp4, XviD) и оставляет нас все с тем же набором кодеров, который я привел выше: DivX версий 3 и 5 (поскольку DivX 5 по сути является продолжением линии DivX 4, не имеет ни малейшего смысла сегодня использовать какую-либо версию из линейки DivX 4).

Обратная совместимость

Отдельно хочу оговорить такой вопрос, как совместимость. Массовое распространение форматов MPEG-4 началось в эпоху DivX 3. Именно этот формат понимают проигрыватели под большинство из известных мне ОС: это Windows и достаточно популярный Linux, также и менее распространенные FreeBSD, MacOS, другие unix-клоны. Поскольку именно Windows сегодня самая популярная ОС на планете, то версии новых DivX кодеров выпускаются в первую очередь именно для Windows. Практически наверняка у каждого, кто хоть чуть-чуть разбирается в видео сжатии, сегодня установлен кодек DivX 5. На сайте DivX Networks доступна также версия кодека для Linux и MacOS — правда в обоих случаях функциональность кодера ограничена: в кодере для Linux нет возможностей DivX 5 Pro, а под Mac сейчас есть только декодер. А что делать владельцам других ОС? А что делать тем, кто когда-то установил себе под Windows DivX 3 кодек и горя не знал — а тут он вдруг получает файл, который не воспроизводится?
Я остановлюсь чуть подробнее на вопросах обратной совместимости кодеков DivX. Все декодеры DivX имеют поддержку декодирования старых форматов: то есть DivX 4 отлично справляется с воспроизведением материала, сжатого DivX 3, а DivX 5 отлично показывает DivX 3 и 4. С совместимостью в противоположном направлении не все так просто. Несмотря на то, что все версии DivX используют разные подписи кодера («DIV3», «DIVX» и «DX50» соответственно) их поведение при декодировании несколько неожиданно. Декодер DivX 3 просто не возьмется воспроизводить видео DivX 4 или 5. А вот декодер DivX 4 с радостью берется декодировать видео DivX 5, хотя далеко не всегда он это делает верно. Вернее Video for Windows совместимый декодер (который используют редакторы видео, например VirtualDub) откажется открывать неизвестный файл с подписью «DX50». А вот DirectShow совместимый декодер, который используют все программы проигрыватели видео, с радостью берется за воспроизведение видео, сжатого DivX 5. Если при создании такого видео не использовались новые возможности формата DivX 5, то видео воспроизводится корректно и без проблем. Если при создании сжатого DivX 5 видео были использованы B-frames, то верно показываются только ключевые кадры (key frames). Во всех остальных кадрах полно квадратов с мусором, точнее с фрагментами соседних кадров. В любом случае, смотреть такое невозможно.
Если при создании сжатого DivX 5 видео использовалась компенсация движения (global motion compensation, GMC), то попытка воспроизвести такой файл при помощи декодера DivX 4 приводит к краху программы проигрывателя. А если использовался режим Quarter pixel, то в кадре будут появляться маленькие квадратики с мусором на границах движущихся объектов (такое тоже смотреть невозможно).
Обобщая: проблема совместимости имеется, и о ней следует помнить тем, для кого она важна. Предположим, вы делаете рекламный ролик для размещения в сети. Одно дело скачать ролик и посмотреть его, совсем другое — скачать, убедиться в том, что он не воспроизводится и начать разбираться (если на это хватит терпения и любопытства). Даже подсказка типа «необходим DivX 5» сможет отпугнуть часть потенциальных зрителей.

Параметры сжатия DivX в двухпроходном режиме

Итак, мы добрались до самого интересного раздела: какие параметры использовать для двухпроходного сжатия при помощи DivX 3 и 5? Возможно, в ходе этого исследования мы сможем выявить явного лидера среди этих двух кодеров. Правда, до окончания исследования я обещать этого наверняка не могу. ;)

DivX 3

Мы будем использовать программу NanDub для того, чтобы заставить работать кодер DivX 3.11 в двухпроходном режиме — технология Smart Bitrate Control (SBC).
Как уже говорилось выше, автор этой программы избрал далеко не самый простой для использования вариант настройки режимов работы кодера: программа предоставляет массу настроек без каких-либо рекомендаций по их использованию. Изучение назначения всех настроек — задача нетривиальная, но вполне выполнимая. Начать имеет смысл с руководства Алексея Шашкова иди руководства, подписанного Koepi. Изучить же влияние наиболее важных настроек на качество результата — задача требующая огромного количества времени — как машинного для выполнения собственно сжатия, так и моего для изучения результатов.
Посему, подробное описание настроек NanDub'а я приведу позже. Часть материала уже накоплена — в частности о таких часто встречающихся особенностях сжатия DivX 3, как выпадение одного-двух блоков на крупных надписях в кадре, так называемые «плывуны» (переход текстуры статичного объекта на движущийся объект, в результате чего текстура фона уплывает в сторону) и так далее. Я не хочу излагать этот материал сейчас, до тех пор, пока я не соберу и не систематизирую всю возможную информацию о поведении кодера DivX 3 в двухпроходном режиме.

DivX 5

DivX Networks проделали отличную работу, в частности по конструированию интерфейса кодера. Так, в пятую версию было включено множество сервисных возможностей, которые традиционно являются привилегией редакторов видео, а не кодеров. Можно спорить об уместности этого шага, использовать эти возможности или нет — тем не менее это еще один плюс программистам DivX Networks. Они сделали свой кодер еще более функциональным, они еще раз опередили конкурентов.
Разница по сравнению с NanDub'ом огромна — в настройках кодера вы найдете только самые важные параметры, грамотное использование которых позволит вам выдавить максимум возможностей из кодера. Ничего лишнего, ничего дублирующего или исключающего друг друга. Ниже я рассмотрю назначение каждого из параметров, его влияние на результат, и дам некоторые рекомендации по использованию на практике.

Основные параметры

Bitrate
Variable bitrate mode — режим сжатия. Как уже обсуждалось выше, в разделе Выбор режима сжатия, мы будем использовать двухпроходный режим. Соответственно, выбираем 2-pass, first pass для первого и 2-pass, second pass второго проходов.
Encoding bitrare — собственно желаемый средний битрейт результата. Совсем не обязательно, чтобы эта цифра была одинакова для двух проходов. Однако, как предостерегает документация, слишком большая разница между значениями битрейта при первом и втором проходе приводит к ухудшению соответствия размера результата заданному размеру. Таким образом, вполне допустимо в случае, когда вас не устраивает размер результата, немного увеличить или уменьшить значение битрейта и повторить второй проход сжатия. Обратите внимание — первый проход повторять не нужно (если, конечно, вы не стерли файлы со статистикой, созданные DivX 5 на первом проходе).
Two pass encoding files
В этом разделе указывается расположение файлов со статистикой, в которые кодер DivX 5 записывает информацию о сжимаемости видеоряда во время первого прохода сжатия.
Если вы кодируете файлы строго по очереди (file1-pass1, file1-pass2, file2-pass1, file 2-pass2, file3-pass1, …) и уверенны в том, что вам не придется переделывать второй проход (например для получения результата с чуть большим или чуть меньшим размером) — то вы вполне можете использовать имена файлов по умолчанию. В противном случае задайте для каждого видео свои имена файлов со статистикой. Естественно, что для выполнения первого и второго проходов одного видеоряда должны использоваться одни и те же файлы.
Также учтите, что по умолчанию эти файлы пишутся в корень диска C: -- в некоторых системах у вас может не быть прав доступа на запись к этому каталогу.
Log file — имя файла со статистикой сжимаемости. Размер этого файла равен примерно 250 кБ на минуту сжимаемого видео, то есть примерно 15 МБ на час видеоряда.
Use MV file — включает создание/использование файла с записями о векторах движения. Этот параметр включает режим, в котором на первом проходе информация о векторах движения в кадре записывается в файл. На втором проходе эти вектора не рассчитываются заново, а читаются из файла, что сокращает время выполнения второго прохода примерно на треть. Учтите, что для того, чтобы иметь возможность пользоваться этой возможностью, настройки кодера для первого и второго прохода должны быть абсолютно одинаковыми (кроме среднего битрейта и уровня пре-процессинга, подробнее см. документацию). Использование этого режима настоятельно рекомендуется.
MV file — имя файла с рассчитанными векторами движения. Размер этого файла больше раз в 6-8 размера файла статистики, то есть примерно 50-70 МБ на час видеоряда.
Protect log/MV file — включает защиту файлов статистики. Защита заключается в том, что если файл с указанным именем уже существует, то кодер выдаст запрос вида «перезаписать файл, да/нет?». Очевидно, что если вы используете имена файлов статистики по умолчанию, то кодер будет только надоедать вам. Использование этого параметра — по вкусу. Помните только, что в случае запуска кодирования в пакетном режиме включение этого параметра вполне может привести к тому, что компьютер будет всю ночь ждать ответа на вопрос, вместо обработки видео материала.
Psychovisual Enhancements
Психовизуальная модель — это передний край технологии сжатия видео. Модель оказывает влияние на параметры сжатия таким образом, чтобы сэкономить на размере как раз в том месте, где человеческий глаз менее чувствителен к ухудшению качества изображения. Так, например, она увеличивает степень игнорирования деталей на темных сценах. Очевидно также, что этот код в силу своей новизны тестировался меньше всего, использование психовизуальной модели потенциально может привести к появлению нежелательных искажений результата сжатия видео. В версии 5.02 были исправлены явные промахи ранних версий кодера DivX 5, которые приводили к получению откровенно провальных результатов. Сегодня большинство специалистов по сжатию видео советуют использовать психовизуальную модель с значением Strong. Учтите, что если в вашем видеоряде нет очень темных или очень светлых мест (где в основном и работает психовизуальная модель) то результат сжатия вполне может совпадать один в один с тем, что вы получите без использования психовизуальной модели.
Keyframe

Примечание: подробное разъяснение того, что такое ключевой и промежуточный кадр приведено ниже, в разделе Двунаправленные кадры (Bidirectional frames).
Max. keyframe interval — максимально возможное количество промежуточных кадров подряд. За добавление в выходной поток ключевых кадров отвечает механизм определения начала новой сцены. В случае длинной статичной сцены кодер вполне может использовать только промежуточные кадры, которые имеют размер меньший, нежели ключевые кадры. Использование одних только промежуточных кадров не совсем удобно именно из-за их природы. В промежуточном кадре содержатся только изменившиеся по сравнению с предыдущем кадром блоки. Потому для отрисовки промежуточного кадра необходимо найти предыдущий ключевой кадр (в котором записан кадр целиком) и проанализировать все промежуточные кадры после него — аж до необходимого нам кадра. Именно этим объясняется задержка при перемотке DivX видео — она тем больше, чем больше расстояние между ключевыми кадрами (говоря совсем строго — математическое ожидание задержки пропорционально среднему расстоянию между ключевыми кадрами).
Соответственно, от этого параметра зависит комфорт при просмотре полученного результата. Следует учитывать также тот факт, что добавление слишком большого числа ключевых кадров приведет к нерациональному использованию битов: как правило при прочих разных промежуточный кадр занимает в 5-10 раз меньше места по сравнению с ключевым. Этим я хочу вас предостеречь от установки слишком короткого расстояния между ключевыми кадрами.
Таким образом имеет смысл ограничивать максимальное расстояние между ключевыми кадрами, но это расстояние не должно быть слишком маленьким. Величина этого расстояния целиком зависит от вашим предпочтений. Наиболее часто используются значения от 3 до 10 секунд. Умножьте это число на количество кадров в секунду в вашем видеоряде и укажите это значение кодеру.
Scene change threshold управляет чувствительностью механизма определения смены сцены в видеоряде. Значение по умолчанию — 50% — вполне подходит для использования в большинстве случаев. Изменение этого значения в большую или меньшую сторону может привести к получению лучших результатов, однако оптимальное значение будет различным для разных видеорядов.
Data Rate control (RC)
Эти параметры отвечают за тонкую настройку двухпроходного кодирования. Часть из них используется также и в других режимах.
Maximum quantizer — максимальное значение степени игнорирования деталей. В конечном видеоряде не окажется ни одного кадра с качеством хуже, чем указано в этой графе. Таким образом, уменьшая это значение можно получить более качественный результат сжатия видео — вплоть до максимального качества при указании здесь «2» (так мы получим аналог режима 1-pass quality based с качеством в 100%). С другой стороны это заставит кодер использовать больше бит в тех кадрах, где вполне можно было бы обойтись и менее качественным кадром. Это уничтожает смысл двухпроходного режима: кодер сам по себе достаточно умный, чтобы использовать качественные кадры там, где это необходимо — зачем его заставлять использовать качественные кадры там, где это не нужно?
Нельзя не упомянуть о том, что разработчики кодера не рекомендуют менять значение по умолчанию — «12». Они говорят о том, что алгоритм кодера оптимизирован под значения по умолчанию всех параметров из группы Data Rate control (кроме RC averaging period). Нарушение этого правила может, например, привести к некорректной работе психовизуальной модели, которая ориентирована на значения «12» и «2» для maximum и minimum quantizer соответственно.
Обращаю ваше внимание, что это значение означает не более чем ограничение: при достаточно высоком битрейте кодер может ни разу не создать кадра с минимальным качеством — вплоть до использования минимальной степени игнорирования деталей «2» во всех кадрах. Это, кстати, накладывает ограничение сверху на размер результата сжатия видео при помощи DivX — оно соответствует примерно 0,40 бит на пиксел.
Minimum quantizer — соответственно, минимальное значение степени игнорирования деталей. Ума не приложу, в каком случае может появиться необходимость увеличить значение по умолчанию — «2». Пожалуй, только разве что в случае экстремально низкого битрейта. То есть в нашем случае — стремимся к качественному результату — тут должно быть »2» и только «2».
RC averaging period, frames — указывает интервал, в пределах которого в двухпроходном режиме перераспределяются биты между кадрами. Очевидно, что наилучшим вариантом будет использовать перераспределение битов в пределах всего видеоряда. Так, разработчики кодера рекомендуют использовать значение в половину количества кадров сжимаемого видеоряда. Соответственно, имеет смысл установить это значение в «500000» — это больше 4 часов — и забыть про него навсегда. Значение по умолчанию — «2000» — соответствует примерно одной минуте и вряд ли может считаться удовлетворительным. Очевидно, что это значение подразумевает использование однопроходного режима.
RC reaction period, frames — указывает интервал, в пределах которого кодер игнорирует изменение количества движения в кадре. Соответственно, чем это значение меньше, тем лучше будут переданы короткие рывки, с другой стороны это может привести к слишком расходу бит для кодирования, скажем, случайных шумов в пределах нескольких кадров. Слишком высокое значение приведет к слишком медленному реагированию кодера и, как следствие, к нерациональному расходу битов в начале медленной сцены и низкому качеству начала динамичной сцены.
Значение по умолчанию — «10», его и рекомендую оставить, следуя рекомендациям разработчиков кодера.
Rate control down/up reaction — отвечает за скорость увеличения/уменьшения битрейта при изменении количества движения в кадре. Значение по умолчанию — «20», его и рекомендую оставить, следуя рекомендациям разработчиков кодера.
Use data partitioning
Этот параметр имеет смысл использовать только в некоторых случаях при вещании видео. У нас этот параметр должен быть всегда выключен.
Perfomance / quality
Этот параметр регулирует скорость работы кодера, точнее позволяет ускорить работу кодера за счет более низкого качества результата. Этот параметр имеет смысл изменять только в случае сжатия видео в реальном времени. Во всех остальных случаях установите его в Slowest — максимальное качество.
Write conversion log file
Указывает кодеру на необходимость создать файл с описанием полученного результата — сжатого видеоряда. В этом файле раскрывается работа кодера на втором проходе: какова сжимаемость каждого кадра, с каким качеством в итоге каждый кадр был сжат и тому подобное. По умолчанию кодер создает файл с именем analyse.log в текущем каталоге. Вы также можете указать любое другое место расположения и имя этого файла.

Новые возможности кодера DivX 5

Как уже говорилось выше, кодер DivX 5 впервые среди MPEG-4 видео кодеров реализует некоторые новые функции, в частности поддержку B-frames, Global motion compensation и работа с векторами движения с повышенной точностью (до четверти пиксела — quarter pixel). Как, опять же, упоминалось выше, эти возможности доступны лишь в Pro версии кодера DivX 5.

Двунаправленные кадры (Bidirectional frames)
Согласно стандарту MPEG-4, в потоке видео данных могут присутствовать кадры трех типов:
  • полные (intra, I-frame) — их содержимое сохраняется целиком, часто их называют ключевыми кадрами (key frames);
  • предсказуемые (predictable, P-frame) — часть содержимого этих кадров предсказывается на основании содержимого предыдущих кадров, безразлично I или P, часто их называют промежуточными кадрами (delta frames);
  • двунаправленные кадры (bidirectional, B-frames) — часть содержимого этих кадров предсказывается на основании содержимого предыдущих кадров (так же, как и у предсказуемых кадров), а часть — на основании содержимого последующих кадров.
Кодеры DivX версий 3 и 4 умели формировать поток только из I и P кадров. DivX 5 предоставляет возможность использовать и кадры типа B. На практике использование такого режима сжатия означает небольшое увеличение ресурсоемкости кодирования и декодирования потока (порядка 10%) и существенное — от 10 до 20% -- уменьшение размера сжатого видео при том же уровне качества. Это каждый может элементарно проверить, закодировав дважды какой-нибудь видео фрагмент в режиме 1-pass quality based: с использованием B-frames и без них.
Таким образом этот параметр предоставляет возможность существенно уменьшить размер сжатого видео при том же уровне качества или, соответственно, существенно повысить качество при заданном размере (например в двухпроходном режиме) — и все это ценой мизерных временных затрат при кодировании и при практически неизменной ресурсоемкости процесса декодирования. Очевидно, что использование этого режима сжатия более чем желательно.

Компенсация движения (Global motion compensation)
Этот режим позволяет использовать еще одну не задействованную ранее возможность стандарта MPEG-4. Компенсация движения создана для описания сцен с плавным панорамированием в стороны, вверх/вниз (например, титры) или в глубину (наезд/отъезд камеры). Промежуточные кадры формируются специальным образом, чтобы максимально использовать уже имеющуюся в предыдущих кадрах информацию о сцене — это дает существенный выигрыш в объеме результата. Конечно, этот режим применяется кодером только в сценах определенного типа — потому вполне возможно, что на видео материале, в котором подобных сцен мало, выигрыш в размере окажется мизерным. Тем не менее, эта возможность позволяет вам экономить на размере результата (или повышать качество других кадров, если размер результата фиксирован) с минимальными дополнительными затратами: увеличение ресурсоемкости кодирования и декодирования всего лишь около 10% Использование этого режима скорее желательно, чем нет.

Четверть пиксельная точность
Кодер DivX 5 позволяет работать с векторами движения с повышенной точностью: до четверти пиксела — quarter pixel. Старые версии DivX позволяли проводить расчеты с точностью лишь до половины пиксела. Теоретически такая технология позволит более точно описывать движение блоков в кадре, соответственно, повысить качество отображения границ движущихся объектов. На практике использование этого режима увеличивает размер результата на пару процентов, а вот ресурсоемкость как кодирования, так и декодирования подскакивает больше чем на четверть. Не могу сказать, что качество полученного результата настолько лучше, насколько больше ресурсов оно потребляет. А при таком среднем количестве бит на пиксел, которое я обычно использую, визуально разницу видно лишь при сравнении кадров один к одному — на скорости в 24 кадра в секунду все выглядит совершенно одинаковым. Таким образом этот режим себе же дешевле не использовать — ну разве что вы во что бы то ни стало хотите достичь максимального качества и у вас компьютер существенно быстрее 1 GHz (на Intel Pentium III 833 MHz видео размером 800х340, сжатое DivX 5 с включенными Qpel, B-frames и GMC, декодируется с полной загрузкой процессора на нулевом уровне постпроцессинга).

Прочие параметры

Опция Write DivX MP4 file позволяет создавать файлы не в формате avi, а в формате DivX MP4. В частности это позволяет обойти ограничение системы Video for Windows, которая требует одинаковой частоты кадров у видео на входе и на выходе кодера — то есть это реально необходимо в случае осуществления IVTC силами DivX 5 кодера. На практике файлы в формате avi куда как более распространены — так что эту опцию вам вряд ли придется когда-то включать.
В строке Quick config CLI (command line interface) вы можете видеть командную строку, которая будет использоваться для передачи выбранных вами параметров кодеру. Вы также можете вручную редактировать эту строку, в частности для указания таких параметров, которые невозможно выбрать при помощи оконного интерфейса — подробнее см. документацию кодера DivX 5.
Crop позволяет обрезать кадр перед кодированием — однако мне кажется намного удобнее и нагляднее делать это в какой-то программе, которая поддерживает режим предварительного просмотра: например VirtualDub или GordianKnot.
Resize позволяет изменить размер кадра видео перед кодированием. Опять же — мне намного удобнее сделать это при помощи фильтра в VirtualDub, тем более что фильтр Smart Resize содержит много полезных и удобных дополнений, облегчающих расчет размера результата.
Pre Processing Source позволяет провести обработку входного видеоряда, в частности провести сглаживание изображения и усреднение значений пикселов по времени. По сути это эквивалентно обработке фильтрами типа Smooth и Temporal Clean. Лично я считаю намного более удобным и гибким в настройке использование фильтров для VirtualDub — тут вы можете подобрать значения параметров для каждого из фильтров индивидуально, вместо абстрактных «Light», «Normal», «Strong» и «Extreme». Не забывайте также про возможность предварительного просмотра результата работы фильтра в VirtualDub'е.
Source Interlace позволяет провести обработку исходного видео перед сжатием: deinterlace и inverse telecine (IVTC). И снова — для этих более чем нетривиальных процедур существует несколько разнообразных фильтров для VirtualDub с огромным количеством настроек — зачем использовать простенький вариант от DivX кодера?
DivX MP4 Creator позволяет преобразовать готовые avi файлы, в которых записано видео с DivX 5 сжатием, в файлы формата MP4. Опять же — в силу повсеместной распространенности именно файлов в формате avi — вряд ли вам эта возможность понадобится.
Закладка Manage settings позволяет создавать и использовать пресеты кодера DivX 5. Это достаточно удобно для использования — однако вы вполне можете и игнорировать эту функциональность. На качество получаемого результата это не повлияет ;)

Заметки о настройке DivX 5

Обобщая приведенные выше сведения о настройках кодера DivX 5 мы еще раз убеждаемся в том, что интерфейс кодера доведен практически до совершенства. Я не советую использоавть возможности кодера, описанные в разделе Прочие настройки — куда как лучше и удобнее использовать для этих целей видео редактор. Это также позволит вам раз и навсегда отключить эти настройки и никогда не возвращаться к их конфигурированию. Подавляющее большинство других настроек устанавливается раз и навсегда в оптимальное значение, которое оптимально для любого видео материала. Из настроек, которые зависят от видео материала, остаются Max keyframe interval и Scene change threshold — но и их вполне можно один раз установить в универсальные значения и забыть об их существовании.
Таким образом конфигурирование кодера DivX 5 в двухпроходном режиме сводится к выбору среднего битрейта, первого или второго прохода и имен файлов со статистикой (кстати, если вы не кодируете несколько файлов сразу, то вполне можете использовать имена файлов со статистикой по умолчанию). Для расчета среднего битрейта исходя из желаемого размера результата можно использовать программу Advanced Bitrate Calculator — хотя он, в отличие от встроенного калькулятора NanDub'а, не понимает VBR mp3.

Как преобразовать MPEG-2 в DivX?

Этот вопрос задают мне, пожалуй, слишком часто — хочу ответить на него раз и навсегда. ;-)
Вы, вероятно, слышали, что видеоряд на DVD диске записан в формате MPEG-2. Именно потому процесс преобразования видео из MPEG-2 в DivX подробно описан в каждом руководстве по преобразованию видео с DVD в DivX. В последнее время все чаще видео в формате MPEG-2 появляется вне контекста DVD: это и файлы, полученные при захвате видео с некоторых карт видеозахвата, и файлы, переписанные с SVCD дисков, и файлы скачанные с интернета.
Я не хочу вдаваться в длинную дискусию «стоит ли преобразовывать видео из хорошего формата MPEG-2 — который включает поддержку черезстрочного видео (interlaced video) — в плохой формат MPEG-4 — который черестрочное видео не умеет, что влечет за собой необходимость применять deinterlace, который ухудшает качество видеоряда….» Ниже я просто отвечаю на вопрос, который мне часто задают. Если человек хочет преобразовать MPEG-2 в DivX — пускай. Его мотивы меня мало интересуют, он имеет право хотеть такого.
Для реализации задуманного вам понадобится пакет GordianKnot. Запустите программу DVD2AVI, которая входит в этот пакет. Откройте файлы в формате MPEG-2: программа позволяет открыть несколько файлов, при этом видеоряд будет склеен встык. Таким образом вам не нужно беспокоится о том, что видеоряд разрезан на несколько vob файлов на DVD диске или состоит из нескольких SVCD дисков. Про настройку преобразования видео (deinterlace, inverse telecine) сказано более чем достаточно в руководствах по копированию DVD и в руководстве самого GordianKnot'а — не буду повторяться. Выберите Demux all tracks — для того чтобы выделить все аудио потоки; они будут записаны каждый в свой файл вне зависимости от формата аудио: mp2, ac3 2.0 или 5.1, dts, … Выберите пункт Save project и сохраните файл d2v — при этом DVD2AVI просканирует весь видеоряд и запишет в d2v файл информацию о его структуре: в каком порядке идут промежуточные и ключевые кадры и по какому адресу их искать.
Что делать с полученными звуковыми файлами зависит в первую очечредь от их формата. Как правило они преобразуются в набор несжатых wav файлов, а потом сжимаются в желаемый формат — обычно это mp3 или ac3. Подробно этот процесс описан в руководствах по копированию DVD.
Следующим шагом будет открытие d2v файла в GordianKnot'е, при этом откроется окно с возможностью предварительного просмотра видеоряда. Вам нужно переключится в основное окно GordianKnot'а и выставить параметры видеоряда: пропорции видео, обрезку кадра и желаемый размер кадра (все параметры находятся на вкладке Resolution). Пропорции видео вы можете выставить исходя из информации о формате исходного видео или же на глаз, включив опцию показа размера видео после преобразований в окне предварительного просмотра видеоряда. Очень удобна возможность автоматической установки образки кадра, даже не смотря на то, что как правило после ее использования размер срезаемой области нужно увеличить на пиксел-другой. Изменять размер я лично предпочитаю в VirtualDub'е, потому на этом шаге слежу, чтобы коэффициент увеличения был ровно 100% — правда, это вопрос скорее личных пристрастий.
Дальше у вас есть возможность провести весь последующий процесс пережатия видео при помощи GordianKnot'а — как это сделать подробно описано в многочисленных руководствах. Я же предпочитаю сохранить так называемый avi script в файл и дальнейшую обработку проводить при помощи Dub'а. Для этого в окне с предварительным просмотром видеоряда нажмите Save и сохраните файл avs. Этот файл содержит в понятном для Dub'а формате информацию о местонахождении исходного видео (в формате MPEG-2), местонахождении d2v файла с информацией о структуре видеоряда, ссылку на библиотеку для декодирования MPEG-2 (часть комплекта GordianKnot — вы наверняка знаете, что Dub не умеет читать видео в формате MPEG-2 напрямую). За описанием параметров в окне сохранения avs опять же отправляю вас к руководствам по GordianKnot'у, я предпочитаю не использовать никаких фильтров кроме deinterlace при необходимости.
Полученный avs файл откройте в Dub'е как обычный avi — теперь вы имеете возможность обрабатывать видео как обычно при работе с Dub'ом, в том числе и сохранить в DivX используя ваши любимые фильтры.

Ссылки

Что почитать по теме

Doom9 — без сомнения лучший на сегодня сайт, посвященный сжатию видео (и, поскольку сложно себе представить видео без звукового ряда, сжатию звука). Тесты, сравнения, пошаговые руководства и описания принципов работы, огромный архив программ.
Сравнение качества кодирования видеокодеров на сайте Doom9.
Nicky Pages — сборник статей о видеомонтаже и цифровом редактировании видео.
Документация по использованию кодера DivX 5.

На русском языке информация наиболее полно представлена в руководстве от Алексея Шашкова.
Среди руководств по NanDub хочу выделить руководство, подписанное Koepi.
Cтатья об использовании пресетов mp3 кодера LAME.
Последняя версия этой статьи.

Программы

VirtualDub — без сомнения самый популярная и одна из самых мощных программ для нелинейного видео монтажа.
NanDub — вариация программы VirtualDub, созданная для сжатия в два прохода при помощи кодера DivX 3.11. Содержит также ряд полезных функций, недоступных для VirtualDub'а.
Сайт Дональда Графта — тут находится коллекция плагинов для VirtualDub'а.
Сайт Джима Касабури также содержит несколько полезных плагинов для VirtualDub'а.
DivX Networks — сайт производителя наилучшего на сегодня MPEG-4 видео кодера — DivX 5.
XviD — сайт проекта по созданию MPEG-4 видео кодера с открытыми исходными кодами, бесплатная альтернатива DivX.
HuffYUV — один из наиболее эффективных кодеков для сжатия видео без потерь качества.
GordianKnot — интегрированный пакет для создания копий DVD-дисков при помощи формата сжатия DivX.
RAD Video Tools — программа для преобразования видео с поддержкой форматов BIN, Smacker, QuickTime и других.
ffdShow — лучший из виденных мною на сегодня декодер видео в формате MPEG-4.
DivX G400 — программа для принудительного включения оверлея при воспроизведении видео, также содержит множество полезных функцию, как-то: отображение субтитров, изменение соотношения сторон и частоты кадров видеоряда.
Advanced Bitrate Calculator — программы для расчета среднего битрейта исходя из заданного размера результата. Пожалуй, более убогая, чем встроенный калькулятор NanDub'а, но многим нравится: если вы используете DivX 5, то NanDub'а у вас может вообще не быть.
Total Recorder — программа для захвата звука, который издает какая-нибудь программа, и записи его в файл.
LAME — наилучший на сегодня кодер звука в формат mp3.

Заключение

Как вы могли видеть, этот материал далек от совершенства. Совершенно не раскрыты возможности кодера DivX 3.11. Честно говоря, совсем недавно заинтересовался технологиями сжатия видео — примерно около года назад. И хоть за это время было изучено множество информации и проведена масса экспериментов, безусловно я еще не досконально владею материалом. Часть материала уже собрана и подготовлена, часть экспериментов только лишь задумана. Плюс я планирую еще организовать перевод домашнего видео архива с VHS видеокассет в файлы с DivX сжатием: бытовой видеомагнитофон и плата ТВ-тюнера с возможностью захвата видео — достаточно распространенная аппаратура. В ходе освоения технологии этого процесса будет появляться масса наработок, которые я также планирую оформить в виде статьи.
Таким образом, мне будет чрезвычайно интересно услышать ваше мнение об уже готовом материале. Возможно кто-то уже занимался подобными вещами и готов поделиться со мной своим опытом. Безусловно, приветствуется критика в любом виде.
В случае же если вы считаете, что знаете меньше меня и хотите обратиться ко мне за советом — прошу вас, прежде чем написать мне, просмотрите эту статью еще раз. Как я уже говорил во введении, этому материалу не хватает четкой структуры. Поэтому вполне может оказаться, что ответ на ваш вопрос уже содержится в статье, просто при первом чтении вы его не заметили или не поняли. Также заранее предупреждаю, что я не намерен учить всех и каждого пользоваться VirtualDub'ом или разжевывать какой-либо еще тривиальный вопрос. В качестве ответа в таком случае вы получите ссылку на материал, изучения которого по моему мнению достаточно, чтобы вы получили ответ на свой вопрос.



Андрей Гуле(krolyk@hotmail.com)



Совесть не отвечает или временно недоступна.

&
&
&



Virus вне форума   Ответить с цитированием
Поблагодарили:
Старый 05.03.2009   #23
Читатель

 
Аватар для lilak
 
Регистрация: 01.02.2006
Сообщений: 3
Поблагодарили: 0 раз
lilak Хорошее начало; 0%lilak Хорошее начало, 0%lilak Хорошее начало, 0%

По умолчанию Re: Видеомонтаж

Virus, огромное спасибо за эти уроки, всё получается с VirtualDub-супер!
Но возник вопрос: как вставить музыкальный фрагмент не в весь фильм, а в определённую часть без того, чтобы его разрезать - склеивать. Пытался сам - не получилось, звук вставляется в нужное место,но и сохраняется только это место, которое отмечено, а не весь фильм. Спасибо.
Неужели только с серьёзным редактором? Если можно, хотелось бы пошаговое описание, как в этих уроках по Дабу.
Всем спасибо и успехов.
lilak вне форума   Ответить с цитированием
Ответ


Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 
Опции темы
Опции просмотра

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Часовой пояс GMT +4, время: 23:54.
Работает на vBulletin® версия 3.8.5.
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd.
Перевод: zCarot
Kопирование разрешено при размещении активной ссылки на источник: http://www.friendsworld.ru

vbsupport.org
aRuma бесплатная регистрация в каталогах тендерный кредит
Доставка грузов