24 - 25 апреля на кафедре видеотехники Санкт-Петербургского государственного университета кино и телевидения состоялась 6-я Международная научно-техническая конференция и конкурс студенческих работ «Цифровые и информационные технологии в электронной медиаиндустрии – 2008».
В этом году впервые конференция проводилась в рамках Недели науки СПбГУКиТ при непосредственном участии студенческого научного общества СПбГУКиТ и студенческой секции Института инженеров электротехники и радиоэлектроники IEEE (Institute of Electrical and Electronics Engineers). Как всегда, к участию принимались работы, посвященные технике и технологиям телерадиовещания, кино- и медиабизнеса, выполненные студентами и аспирантами университетов Санкт-Петербурга.
Информацию о конференциях, проходивших в предыдущие годы, можно найти здесь: 2003 г. , 2004 г. , 2005 г ., 2006 г. , 2007 г.
Программа
24 - 25 апреля 2008 г., СПбГУКиТ, кафедра видеотехники
Светлана Сергеева , гр. 616; Кирилл Павлов, гр. 554, СПбГУКиТ
Влияние преобразований формата изображения на восприятие аудиовизуального произведения.
Тезисы
С.А.Сергеева, К.В.Павлов
Влияние преобразований формата изображения на восприятие аудиовизуального произведения
Svetlana Sergeyeva, Kirill Pavlov
The Influence of Aspect Ratio Conversion on Audiovisual Content Perception
Развитие систем широкоформатного телевидения, внедрение телевидения высокой чёткости привело к появлению у населения некоторого парка широкоформатных ТВ приёмников. Большинство аналоговых телевизионных систем имеют соотношение сторон изображения 4:3. В новых системах формат экрана увеличен по сравнению с обычным ТВ. В кинематографе он варьируется от 1,33 до 2,35 для формата CinemaScope и даже 2,77 в широкоэкранном формате Dynavision 3D. Различные сочетания формата экрана и формата изображения дают форматы отображения: обычный, широкоэкранный, анаморфотный, Letter box-A, Letter box-B. Изменение формата кадра представляет собой частный случай преобразования стандартов. В последнее время функция преобразования формата кадра стала настолько важной, что выпускается ряд аппаратов, преобразующих только формат кадра без изменения стандарта разложения и формата сигнала.
В работе рассмотрены возможные форматы отображения и способы их преобразования. При трансляции кинофильмов на телевизионный экран существует выбор между показом фильма в заниженном режиме Letter box с дополнением изображения чёрными полями и панорамным режимом с потерей части изображения.
В зависимости от сюжетной составляющей фильма зрители могут по-разному воспринимать подобные трансформации. Необходимо выявить особенности субъективного восприятия изображения транслируемого в различных режимах. Для этого была проведена серия экспериментов, в которой представители различных целевых групп выбирали наиболее комфортный режим просмотра видеоматериала в зависимости от режима просмотра, формата экрана и сюжетной составляющей тестируемого материала. Оценка проводилась методом парных сравнений. Для эксперимента было выбрано 3 эпизода по 15 секунд из кинофильмов различной жанровой направленности: киноэпопея с преобладанием батальных сцен и общих планов (формат изображения 16:9), телесериал с доминированием крупных и средних планов (4:3) и детектив с чередованием крупных, средних и общих планов (4:3). Видеоматериал демонстрировался на экранах с соотношением сторон 4:3 и 16:9 в различных режимах. Результаты эксперимента показали разницу в предпочтениях зрителями режимов просмотра одного и того же материала в зависимости от формата экрана. Так, например, режим Letter box в случае показа кинофильма на экране 4:3 оказался более комфортным для просмотра, чем панорамный режим с потерей части информации по горизонтали. В то время как для просмотра видеоматериала формата 1,33 на широком экране большинство экспертов предпочло режим Pan&Scan.
Мария Лепнева , гр. 314, СПбГУКиТ
Телевизионное вещание по IP-сетям.
Тезисы
М.А.Лепнёва
Телевизионное вещание по IP-сетям
Maria Lepneva
IP-Networks Television Broadcasting
Понимать под телевидением только традиционное вещание было бы не-справедливо. Широкий эфир – исторически первая технология. За ним мир по-коряли кабельные и спутниковые системы, имеющие сравнительно большие возможности. Но, по сути, они не изменили концептуальных основ – человек у экрана остается только потребителем аудиовизуального контента, ограниченно-го и ориентированного на относительно массовую аудиторию. Технология ка-бельного телевидения успешно осваивает двусторонние (DOCSIS), интерактив-ные, цифровые способы передачи данных.
В настоящее время DVB-сети практически не рассматриваются как плат-форма для внедрения интерактивных услуг, т.к. для реализации таких услуг для коммерчески значимого числа абонентов ёмкости DVB-С сети с единым видео-сервером не хватает. Идеологи внедрения интерактивных телевизионных услуг постепенно пришли к мысли об использовании Интернет-протокола (IP), в са-мой идеологии которого заложена полная интерактивность.
Triple Play – это предоставление услуг телефонии (голос), передачи данных и доступа к Internet (данные), а также телевидения (видео). Но телевидение в составе услуг Triple Play приобретает совершенно иные свойства по сравнению с традиционным эфирным вещанием. Благодаря наличию канала обратной свя-зи с абонентом, помимо предоставления услуг широковещания по IP-протоколу (IPTV), возможна организация интерактивных сервисов.
• Услуга «Почти видео по запросу» или «виртуальный кинотеатр» (near Video on Demand – nVoD) – это трансляция фильмов с видеосервера c жестко определенным расписанием сеансов, когда абонент покупает удобный ему по времени сеанс для просмотра фильма.
• «Видео по запросу» (Video on Demand – VoD) – фильм с видеосервера пер-сонально транслируется абоненту в любой произвольно выбранный абонентом момент времени.
• «Персональный видеомагнитофон» (Personal Video Recorder – PVR) – на видеосервере абоненту выделяется определенный объем памяти и предоставля-ется интерфейс с аналогичными видеомагнитофону функциями для цифровой записи и воспроизведения телепередач.
• «Платный просмотр» (Pay per View – PPV) – покупка и просмотр абонен-том отдельно выбранных программ. Трансляция ведется в режиме реального времени.
• «Телевидение со сдвигом по времени» (Time Shifted TV) – абонент покупа-ет услугу просмотра заранее записанных на видеосервере программ. Услуга и реализуемые в ней сервисные функции близки к «видео по запросу».
• «Сервисы по запросу» (Services on Demand, SoD) – это заказ товаров и ус-луг на дом, различная справочная информация, расписание транспорта, гости-ничный сервис и т.п. Данные услуги близки к аналогичным сервисам в Интер-нете.
Таким образом, IP-телевидением называют цифровую технологию много-программного интерактивного телевизионного вещания в IP-сети с помощью пакетной передачи видеоданных по IP-протоколу (Video over IP).
Существует три основных метода передачи трафика в IP-сетях: Unicast, Broadcast и Multicast. Каждый из этих трех методов передачи использует раз-личные типы назначения IP-адресов в соответствии с их задачами. Существует существенная разница в степени их влияния на объем потребляемого трафика.
Unicast-трафик (одноцелевая передача пакетов) используется прежде всего для сервисов «персонального» характера, таких как «Видео по запросу», «Пер-сональный видеомагнитофон» и «Телевидение со сдвигом по времени». Unicast-трафик направляется из одного источника к одному IP-адресу назначе-ния.
Broadcast-трафик (широковещательная передача пакетов) использует спе-циальный IP-адрес, чтобы посылать один и тот же поток данных ко всем або-нентам данной IP-сети. Вroadcast-трафик принимается всеми включенными компьютерами (или STB) в сети независимо от желания пользователя. Поэтому этот вид передачи используется в основном для служебной информации сетево-го уровня или для передачи другой исключительно узкополосной информации.
Multicast-трафик (групповая передача пакетов) используется для передачи потокового видео, когда необходимо доставить видеоконтент неограниченному числу абонентов, не перегружая сеть, т.е. для предоставления таких интерак-тивных сервисов, как «Виртуальный кинотеатр» и «Платный просмотр». Это наиболее часто используемый тип передачи данных в IPTV сетях, когда одну и ту же программу смотрят большое число абонентов. В отличие от случая broadcast-передачи за абонентом остается выбор – принимать данные или нет.
Архитектура решения IPTV имеет распределенную структуру. Основными ее элементами являются:
1. Головная станция – программно-аппаратный комплекс, который обеспе-чивает прием сигнала от радио- и телевизионных станций и спутников, обеспе-чивает декодирование и демультиплексирование цифровых сигналов и MPEG-кодирование аналоговых сигналов с последующим мультиплексированием под-готовленных материалов в IP-потоки.
2. Middleware – программно-аппаратный комплекс, который обеспечивает управление всеми компонентами решения «IPTV», обрабатывает запросы от абонентских устройств, обеспечивает взаимодействие с системами оператора связи.
3. Система защиты контента от несанкционированного доступа (CAS/DRM) – обеспечивает безопасность услуг и защиту видеоматериалов от несанкционированного просмотра и цифрового копирования (соблюдение ав-торских прав).
4. Абонентское устройство Set top box (STB) – является связующим звеном между системами формирования и доставки аудио- и видеоматериалов и теле-визором абонента. Представляет собой миникомпьютер с операционной систе-мой и WEB-браузером.
5. Система распределения контента – получает от middleware запросы або-нентов на доступ к контенту, определяет, на каком сервере с минимальной за-грузкой и в максимальной близости к абоненту находятся требуемые данные и разрешает абоненту получить их с выбранного сервера.
6. Видеосерверы – используются для реализации интерактивных сервисов типа «Виртуальный кинотеатр» (NVoD), «Видео по запросу» (VoD), «Персо-нальный видеомагнитофон» (PVR).
Ещё 4…5 лет назад IP-телевидение воспринималось в нашей стране как эк-зотическая и дорогая цифровая технология, перспективы которой весьма неоп-ределенны. Однако в последнее время технические и экономические проблемы, препятствующие массовому внедрению IPTV, хотя и не исчезли полностью, но во многом потеряли свою остроту. Уже через 3…4 года можно ожидать пере-хода IPTV в разряд широко распространенных и высокодоходных технологий.
Анна Новикова , аспирант каф. Телевидения и Видеотехники СПбГУТ им проф. М.А.Бонч-Бруевича
Контроль качества изображения на уровне услуг IPTV.
Тезисы
А.Е.Новикова
Контроль качества изображения на уровне услуг IPTV
Anna Novikova
Image Quality Monitoring on IPTV-Service Level
Одним из самых перспективных вариантов использования мультисервисных сетей является передача телевизионного и видеотрафика по Интернет-протоколу. Внедрение решений по передаче видеотрафика позволяет операторам более эффективно использовать свою сеть за счет предоставления современных интерактивных сервисов, таких как обычное «Вещание», «Видео по запросу», «Видео с расписанием» и т.д.
Казалось бы, простая задача – облечь в цифры качество услуги IPTV – оказывается довольно сложной: возникает проблема введения определенной метрики. Для ее решения разработано множество различных подходов. В настоящее время используются две стратегии и, соответственно, два способа введения метрики качества услуг IPTV – MDI и MPQM. Помимо этого, безусловно, ведутся поиски более совершенных методов, о которых также будет упомянуто в докладе.
Юлия Михедова , магистрант каф. видеотехники СПбГУКиТ
Мобильные устройства в ТВ производстве: интерфейсы и публикация.
Тезисы
Ю.А.Михедова
Мобильные устройства в ТВ производстве: интерфейсы и публикация
Julia Mikhedova
Mobile Devices in TV Production: Interfaces and Publication
В современном мире важно уметь быстро производить телевизионные про-граммы, особенно в тех случаях, когда событие не может быть освещено жур-налистом с профессиональной техникой. И в этом случае могут быть полезны мобильные устройства со встроенными камерами – такие как сотовые телефо-ны, смартфоны, коммуникаторы, медиаплееры, портативные компьютеры и т.п. Таким образом, каждый обладатель подобного устройства может стать журна-листом-стрингером (stringer), сняв уникальное событие, свидетелем которого он стал.
Использование такой технологии как в традиционном телевидении, так и в мобильном предоставляет возможности расширения ассортимента контента, а следовательно, и расширения зрительской аудитории. Но возникает два вопро-са: что снимать и как передавать с помощью таких мобильных устройств. На первый вопрос ответ прост – то, что будет интересно зрителю. А второй вопрос требует более детального рассмотрения.
В докладе рассматриваются интерфейсы, необходимые для соединения мо-бильного устройства с камерой и ПК (Wi-Fi, USB 2.0, Bluetooth) и передачи ви-деоданных с ПК на другие устройства (Wi-Fi, Ethernet, приводы для записи на оптические диски, IEEE1394, USB 2.0 и Bluetooth). Представлены сравнитель-ные данные по скорости передачи данных по рассматриваемым интерфейсам, а также возможные пути распространения отснятого видео: публикация на ви-деосервисах (You Tube, Video Google и др.), запись на оптические диски и т.д.
Сергей Чернышов , гр. 413, СПбГУКиТ.
Разработка метода компрессии для HDTV.
Тезисы
С.В.Чернышов
Разработка метода компрессии для HDTV
Sergey Chernyshov
Development of Compression Method for HDTV
Телевидение высокой четкости (ТВЧ, HDTV) – одна из самых популярных и обсуждаемых тем в телевизионной среде. Многие специалисты приравнивают значимость внедрения ТВЧ к значимости начала цветного ТВ вещания. Сторонники немедленного внедрения HDTV говорят о необходимости скорейшего начала вещания, создания контента и увеличения числа программ с целью привлечения зрителей. В то же время существует целый ряд факторов, мешающих развитию HDTV. Наряду с малым объемом HD-контента одной из главных проблем внедрения телевидения высокой четкости является неготовность существующих вещательных сетей к передаче информации со скоростями свыше одного гигабита в секунду.
Одним из вариантов решения данной проблемы является использование существующей кабельной инфраструктуры и коммутационно-распределительного оборудования, изначально предназначенных для передачи цифровых видеосигналов формата SD SDI со скоростью 270 Мбит/с. Для обеспечения возможности передачи сигналов ТВЧ по существующим сетям требуется уменьшение скорости цифрового потока приблизительно в 5 раз. В докладе представлены результаты разработки алгоритма видеокомпрессии, эффективно решающего данную задачу.
Разрабатываемый метод компрессии должен удовлетворять следующим требованиям:
• малая задержка при кодировании и декодировании;
• малые искажения и, как следствие, снижение качества изображения;
• алгоритм должен быть реализован с использованием небольших структурных блоков с целью ограничения распространения ошибок и устранения пространственной перекрестной модуляции;
• простота реализации для скорейшего внедрения.
В основе алгоритма лежит разбиение каждого кадра на 32 400 макроблоков, каждый из которых в свою очередь разбивается на блоки размером 4х4. Полученные блоки подвергаются целочисленному преобразованию, масштабированию, преобразованию Адамара, квантованию и энтропийному кодированию словами переменной длины. В итоге данные каждого макроблока размещаются в пакете, состоящем из 512 битов, после чего используется специальная процедура совместимости изображения.
Алгоритм, представленный в докладе, обеспечивает требуемое сжатие информации, причём заметность артефактов компрессии – ниже порогового уровня. Сохраняется возможность введения сигналов звукового сопровождения и других данных.
Кирилл Гусев , аспирант каф. видеотехники СПбГУКиТ
Исследование методов компенсации неравномерности освещенности кадра в фильм-сканере.
Тезисы
К.О.Гусев
Исследование методов компенсации неравномерности освещенности кадра в фильм-сканере
Kirill Gusev
Research of Illuminance Nonuniformity Correction Methods in Film Scanners
Фильм-сканеры находят применение в системах производства кинофиль-мов с промежуточным цифровым этапом, при реставрации архивных кино-фильмов цифровыми методами, а также при создании фильмов, предназначен-ных для показа в цифровых кинотеатрах, когда в фильм должны войти сцены, снятые как традиционными, так и цифровыми кинокамерами.
Одним из параметров, определяющих качество перевода киноизображения в цифровой вид в фильм-сканерах, является неравномерность освещенности кадра в кадровом окне. Неравномерность яркости полученного с фильм-сканера изображения обусловлена как несовершенством оптических систем, имеющих более низкое светопропускание по краям, так и особенностями конструкции ос-ветительной части. Для более равномерного освещения кадрового окна прини-маются специальные меры, например, осветитель строится по схеме сферы Ульбрихта. Но даже несмотря на эти меры, добиться идеально равномерной ос-вещенности кадра невозможно. Остаточную неравномерность можно скомпен-сировать цифровыми методами.
В основу такой коррекции предлагается положить перемножение отсчетов файлов изображений, получаемых с фильм-сканера, на корректирующую дву-мерную матрицу коэффициентов. Такая матрица может быть получена из изо-бражений открытого кадрового окна, то есть изображений, полученных съем-кой кадрового окна без кинопленки. Однако эти изображения характеризуются зашумленностью, и для получения корректирующих матриц необходимо про-вести их фильтрацию. При этом к фильтрации не предъявляется настолько же жестких требований, как при шумоподавлении на сюжетном изображении, так как неравномерность носит низкочастотный характер, полезные высокочастот-ные детали отсутствуют. Еще один способ борьбы с шумом – накопление серии изображений и их последующее усреднение. Если усреднение производится по n кадрам, то отношение сигнал/шум улучшается в vn раз. Кроме того, изобра-жение открытого кадрового окна можно рассматривать как двумерную функ-цию, отсчеты которой взяты с некоторой ошибкой. Для получения корректи-рующей матрицы можно произвести аппроксимацию такой функции при по-мощи сплайнов.
В работе рассмотрены методы коррекции неравномерности, получение корректирующих матриц в которых осуществляется с применением:
• фильтрации изображения открытого кадрового окна;
• усреднения по нескольким кадрам;
• аппроксимации бикубическими сплайнами.
Изложены математические основы этих методов; выявлены достоинства и не-достатки. Приведены и проанализированы практические результаты их приме-нения.
Денис Давыдов , магистрант каф. звукотехники СПбГУКиТ.
Автоматическая оптимизация АЧХ системы звуковоспроизведения .
Тезисы
Д.А.Давыдов
Автоматическая оптимизация АЧХ системы звуковоспроизведения
Denis Davydov
Automatic Optimization of Amplitude-Frequency Response of Sound Reproduction System
Настройка амплитудно-частотной характеристики системы необходима для достижения высокого качества звуковоспроизведения. Это позволяет до-биться более правильного звучания, более точной передачи звуковой картины, передать эмоциональную составляющую музыки. Особенно эта проблема за-метна в системах домашнего кинотеатра. В такой системе обычно используется не менее 6 акустических систем – 5 широкополосных громкоговорителей и из-лучатель сверхнизких частот, именуемый сабвуфером, который расширяет диа-пазон воспроизводимых частот до 20 Гц снизу. Необходимость коррекции АЧХ в таких системах очевидна – 99% пользователей не имеют либо возможности, либо достаточных технических знаний, чтобы расположить громкоговорители должным образом. Предлагаемая система позволяет снять с пользователя часть действий, связанных с частотной настройкой и расположением излучателей, ав-томатически настраивает задержки для каждого канала, которые влияют на ло-кализацию кажущегося источника звука, и оптимизирует амплитудно-частотную характеристику, которая отвечает за точность и адекватность вос-произведения всего диапазона воспроизводимых частот. Для решения данной задачи необходимо определить АЧХ тракта и поме-щения прослушивания и получить АЧХ корректора, которая будет обратной измеренной АЧХ. В большинстве помещений прослушивания невозможно обеспечить равномерную АЧХ на низких частотах и на нижней середине. При-чина – стоячие волны в помещении. Тем не менее, баланс между уровнями вос-произведения низких и средних частот надо соблюдать, и дело это довольно тонкое. В качестве тестового сигнала наиболее удобен в данном случае «белый шум»: этот сигнал имеет равномерно распределенные спектральные состав-ляющие, отчего и получил свое название по аналогии с белым светом. Он по-зволяет «размазать» картину стоячих волн в помещении, т.к. реальный сигнал, в отличие от синусоидального, тоже «размазывает» эту картину. Для получения такого сигнала цифровыми методами наиболее удобно использовать так назы-ваемые генераторы псевдослучайных чисел, которые и формируют соответст-вующие спектральные составляющие. Предлагается использовать генератор Парка-Миллера как наиболее удобный для программной реализации. Соответ-ствующие константы были предложены и опробованы Парком и Миллером в 1969 году, по именам которых и был назван алгоритм. Для правильной оценки АЧХ и точной звукопередачи необходимо соблю-дать правильность фазирования каналов друг относительно друга. Если громко-говорители будут включены в противофазе, возникают сильные искажения АЧХ в области низких частот. Предложенная схема обеспечивает правильное фазирование громкоговорителей. При прохождении тракта изменяется спектральное распределение мощно-сти сигнала. Вклад в этот процесс вносят усилитель мощности, громкоговори-тель, акустические условия прослушивания. «Тонким местом» является взаи-модействие громкоговорителя и акустики помещения. Для коррекции АЧХ производится спектральный анализ сигнала с применением процедуры быстро-го преобразования Фурье. Быстрое преобразование Фурье представляет собой набор алгоритмов, направленных на сокращение числа операций по вычисле-нию дискретного преобразования Фурье. На основе вычисленной АЧХ коррек-тора осуществляется синтез цифровых фильтров. Выход тестового сигнала подключается к усилителю мощности, усилитель подключен к излучающим звук громкоговорителям. Подвергшись влиянию всех компонентов тракта, акустический сигнал поступает на микрофон. Далее сигнал, будучи оцифрованным и записанным, подвергается обработке: вычис-ляется его спектральная плотность, которая и будет соответствовать АЧХ трак-та; на ее основе синтезируется АЧХ корректора, которая обратна АЧХ тракта с небольшим отклонением – она вычисляется относительно среднего значения полученной спектральной плотности сигнала. Окончательным результатом вы-числений является разностное уравнение, на основе которого синтезируется цифровой фильтр, «записываемый» в корректор. Помимо своей основной задачи, устройство может проводить оценку за-паздывания сигнала одного громкоговорителя относительно другого и вводить компенсирующую задержку. Это позволяет проводить настройку звукового тракта в таких условиях, где принципиально невозможна правильная установка громкоговорителей. Целью данной инженерно-технической работы является разработка уст-ройства, в реальном времени формирующего сигнал, обработанный с учетом АЧХ помещения. Реализовать такое устройство можно на базе сигнального процессора, ПЛИС и т.д. или же использовать для анализа и коррекции персо-нальный компьютер.
Дмитрий Новиков , гр. 354, СПбГУКиТ
Программно-аппаратный комплекс для трехмерного
сканирования объектов.
Тезисы
Д.С.Новиков
Программно-аппаратный комплекс для трехмерного сканирования объектов
Dmitry Novikov
3D-Scanning@Home : Low-Cost Laser Scanner and Hi-Resolution Surface Reconstruction
За последние двадцать лет разработано множество способов анализа формы поверхностей и построения трехмерных моделей, но все они используют сложное и дорогостоящее оборудование. В данной работе я представляю систему трехмерного сканирования объектов в высоком разрешении, состоящую из лазера, вращающегося предметного столика и видеокамеры. Анализ отснятого материала и построение трехмерной модели осуществляется по специальному алгоритму. Также система восстанавливает текстуру объекта.
Трехмерные сканеры нашли широкое применение в таких областях как компьютерная графика, системы искусственного зрения, медицина, археология, игровая индустрия, компьютерный контроль качества и т.д. Существующие методы анализа поверхностей разделяются на контактные и бесконтактные. Бесконтактные методы реконструирования трехмерных объектов на основе плоских двумерных изображений – до сих пор широко исследуемая область. Одним из самых распространенных способов трехмерного сканирования является метод лазерной триангуляции. В нем используются видео- или фотокамера и лазерный луч (или лазерная плоскость). Восстановление поверхности основано на алгоритме триангуляции, т.е. на анализе расположения точки пересечения лазерного луча и сканируемого объекта в плоскости проекции видеокамеры.
Аппаратная часть сканера включает в себя фотокамеру и источник лазерного излучения. В системе использована цифровая камера Canon digital IXUS 50 и полупроводниковый лазер красного цвета безымянного производителя из Китая. Вертикально ориентированный плоский расходящийся лазерный луч сформирован короткофокусной цилиндрической линзой. Лазер и линза смонтированы на одном основании и жестко соединены между собой. Сканируемый объект устанавливается на вращающийся с постоянной скоростью предметный столик. Ось лазерного луча проходит через центр вращения столика с целью минимизаций геометрических искажений изображения сканируемого объекта. Под углом в 45 градусов относительно столика установлена видеокамера, которая снимает полный оборот объекта. Отснятый материал кадр за кадром анализируется специальным алгоритмом. В каждом кадре для каждой строки изображения находятся пиксели с изображением лазерного луча. Берется среднее значения x-координат этих пикселей в экранной плоскости. Смещение получившейся точки от проекции оси вращения объекта – это X-координата трехмерной вершины. Y-координата вершины совпадает с y-координатой этой точки на экранной плоскости. Корректируется угол, под которым камера находилась к оси лазерного луча (45 градусов в нашем случае). Все полученные в кадре вершины находятся в плоскости XY и представляют одно сечение сканируемого объекта. Каждое сечение поворачивается относительно оси Y на угол, равный углу поворота предметного столика в этом кадре. Яркость каждой вершины вычисляется взвешенной суммой яркостей каждого пикселя в строке. После обработки всех кадров программа сохраняет файл формата xyzrgb с массивом точек, готовый для использования.
Дальнейшее совершенствование устройства включает в себя применение двух лазеров для сканирования «мертвых зон», использование шагового двигателя с компьютерным управлением для увеличения точности и детализации трехмерной модели, использование фотокамеры с программно управляемым спуском.
Электронную версию Сборника материалов конференции, включающего программу конференции и тезисы докладов участников, можно скачать здесь .
ОРГКОМИТЕТ:
• К.Ф.Гласман – заведующий кафедрой видеотехники СПбГУКиТ,
член Комитета конференции IBC, председатель оргкомитета
• А.В.Белозерцев – научный руководитель студенческого научного общества СПбГУКиТ
• А.В.Бабаян – председатель профкома студентов и аспирантов СПбГУКиТ
ЖЮРИ КОНКУРСА:
• А.Ф.Перегудов – проректор по научной и инновационной деятельности СПбГУКиТ, генеральный директор фирмы «ДИП», председатель жюри
• М.Солтер – эксперт по вопросам планирования сектора телерадиовещания IABM
• О.С.Березин – генеральный директор компании «Невафильм»
• Л.Н.Баланин – начальник научно-производственного комплекса 41 ФГУП «Научно-исследовательский институт телевидения»
• К.Ф.Гласман – заведующий кафедрой видеотехники СПбГУКиТ,
член Комитета конференции IBC
Учредителями призов в этом году являются:
ПОБЕДИТЕЛИ КОНКУРСА СТУДЕНЧЕСКИХ РАБОТ:
Светлана Сергеева , студентка гр. 616 факультета аудиовизуальной техники СПбГУКиТ, с докладом «Влияние преобразований формата изображения на восприятие аудиовизуального произведения». Награждена поездкой на выставку и конференцию IBC от IABM. Приз от компании «Невафильм» – мультимедийный плеер Apple iPOD.
Светлана Сергеева
Светлана Сергеева
Студентка 2 курса факультета аудиовизуальной техники Санкт-Петербургского государственного университета кино и телевидения (гр. 616). Вместе с Кириллом Павловым участвует в научной работе по оценке качества аудиовизуального контента в цифровых кинотелевизионных системах, проводимой на кафедре видеотехники СПбГУКиТ.
В конференции участвует впервые. Награждена полностью оплаченной поездкой в Амстердам на выставку и конференцию IBC (International Broadcasting Convention) в сентябре 2008 г. от Международной ассоциации производителей вещательного оборудования IABM.
Влияние преобразований формата изображения на восприятие аудиовизуального произведения
Развитие систем широкоформатного телевидения, внедрение телевидения высокой чёткости привело к появлению у населения некоторого парка широкоформатных ТВ приёмников. Большинство аналоговых телевизионных систем имеют соотношение сторон изображения 4:3. В новых системах формат экрана увеличен по сравнению с обычным ТВ. В кинематографе он варьируется от 1,33 до 2,35 для формата CinemaScope и даже 2,77 в широкоэкранном формате Dynavision 3D. Различные сочетания формата экрана и формата изображения дают форматы отображения: обычный, широкоэкранный, анаморфотный, Letter box-A, Letter box-B. Изменение формата кадра представляет собой частный случай преобразования стандартов. В последнее время функция преобразования формата кадра стала настолько важной, что выпускается ряд аппаратов, преобразующих только формат кадра без изменения стандарта разложения и формата сигнала.
В работе рассмотрены возможные форматы отображения и способы их преобразования. При трансляции кинофильмов на телевизионный экран существует выбор между показом фильма в заниженном режиме Letter box с дополнением изображения чёрными полями и панорамным режимом с потерей части изображения.
В зависимости от сюжетной составляющей фильма зрители могут по-разному воспринимать подобные трансформации. Необходимо выявить особенности субъективного восприятия изображения транслируемого в различных режимах. Для этого была проведена серия экспериментов, в которой представители различных целевых групп выбирали наиболее комфортный режим просмотра видеоматериала в зависимости от режима просмотра, формата экрана и сюжетной составляющей тестируемого материала. Оценка проводилась методом парных сравнений. Для эксперимента было выбрано 3 эпизода по 15 секунд из кинофильмов различной жанровой направленности: киноэпопея с преобладанием батальных сцен и общих планов (формат изображения 16:9), телесериал с доминированием крупных и средних планов (4:3) и детектив с чередованием крупных, средних и общих планов (4:3). Видеоматериал демонстрировался на экранах с соотношением сторон 4:3 и 16:9 в различных режимах. Результаты эксперимента показали разницу в предпочтениях зрителями режимов просмотра одного и того же материала в зависимости от формата экрана. Так, например, режим Letter box в случае показа кинофильма на экране 4:3 оказался более комфортным для просмотра, чем панорамный режим с потерей части информации по горизонтали. В то время как для просмотра видеоматериала формата 1,33 на широком экране большинство экспертов предпочло режим Pan&Scan.
Дмитрий Новиков , студент гр. 354 факультета экранных искусств СПбГУКиТ, с докладом «Программно-аппаратный комплекс для трехмерного сканирования объектов». Награжден поездкой в Амстердам на выставку и конференцию IBC в сентябре 2008 г. от IABM.
Дмитрий Новиков
Дмитрий Новиков
Студент 5 курса факультета экранных искусств Санкт-Петербургского государственного университета кино и телевидения (гр. 354). Увлекается научно-техническим творчеством, исследованием и созданием технических средств для компьютерной анимации, синтеза комбинированных кадров.
В конференции участвует впервые. Награждён полностью оплаченной поездкой в Амстердам на выставку и конференцию IBC (International Broadcasting Convention) в сентябре 2008 г. от Международной ассоциации производителей вещательного оборудования IABM.
Программно-аппаратный комплекс для трехмерного сканирования объектов
За последние двадцать лет разработано множество способов анализа формы поверхностей и построения трехмерных моделей, но все они используют сложное и дорогостоящее оборудование. В данной работе я представляю систему трехмерного сканирования объектов в высоком разрешении, состоящую из лазера, вращающегося предметного столика и видеокамеры. Анализ отснятого материала и построение трехмерной модели осуществляется по специальному алгоритму. Также система восстанавливает текстуру объекта.
Трехмерные сканеры нашли широкое применение в таких областях как компьютерная графика, системы искусственного зрения, медицина, археология, игровая индустрия, компьютерный контроль качества и т.д. Существующие методы анализа поверхностей разделяются на контактные и бесконтактные. Бесконтактные методы реконструирования трехмерных объектов на основе плоских двумерных изображений – до сих пор широко исследуемая область. Одним из самых распространенных способов трехмерного сканирования является метод лазерной триангуляции. В нем используются видео- или фотокамера и лазерный луч (или лазерная плоскость). Восстановление поверхности основано на алгоритме триангуляции, т.е. на анализе расположения точки пересечения лазерного луча и сканируемого объекта в плоскости проекции видеокамеры.
Аппаратная часть сканера включает в себя фотокамеру и источник лазерного излучения. В системе использована цифровая камера Canon digital IXUS 50 и полупроводниковый лазер красного цвета безымянного производителя из Китая. Вертикально ориентированный плоский расходящийся лазерный луч сформирован короткофокусной цилиндрической линзой. Лазер и линза смонтированы на одном основании и жестко соединены между собой. Сканируемый объект устанавливается на вращающийся с постоянной скоростью предметный столик. Ось лазерного луча проходит через центр вращения столика с целью минимизаций геометрических искажений изображения сканируемого объекта. Под углом в 45 градусов относительно столика установлена видеокамера, которая снимает полный оборот объекта. Отснятый материал кадр за кадром анализируется специальным алгоритмом. В каждом кадре для каждой строки изображения находятся пиксели с изображением лазерного луча. Берется среднее значения x-координат этих пикселей в экранной плоскости. Смещение получившейся точки от проекции оси вращения объекта – это X-координата трехмерной вершины. Y-координата вершины совпадает с y-координатой этой точки на экранной плоскости. Корректируется угол, под которым камера находилась к оси лазерного луча (45 градусов в нашем случае). Все полученные в кадре вершины находятся в плоскости XY и представляют одно сечение сканируемого объекта. Каждое сечение поворачивается относительно оси Y на угол, равный углу поворота предметного столика в этом кадре. Яркость каждой вершины вычисляется взвешенной суммой яркостей каждого пикселя в строке. После обработки всех кадров программа сохраняет файл формата xyzrgb с массивом точек, готовый для использования.
Дальнейшее совершенствование устройства включает в себя применение двух лазеров для сканирования «мертвых зон», использование шагового двигателя с компьютерным управлением для увеличения точности и детализации трехмерной модели, использование фотокамеры с программно управляемым спуском.
Кирилл Павлов , студент гр. 554 факультета экранных искусств СПбГУКиТ, с докладом «Влияние преобразований формата изображения на восприятие аудиовизуального произведения». Награждён поездкой на выставку и конференцию IBC от фирмы «ДИП».
Кирилл Павлов
Кирилл Павлов
Студент 3 курса факультета экранных искусств Санкт-Петербургског о государственного университета кино и телевидения (гр. 554). Вместе со Светланой Сергеевой участвует в научной работе по исследованию влияния параметров видео- и звукоряда на мультимодальное качество восприятия аудиовизуального контента в цифровых кинематографических и телевизионных системах, проводимой на кафедре видеотехники СПбГУКиТ.
В конференции участвует впервые. Награждён полностью оплаченной поездкой в Амстердам на выставку и конференцию IBC (International Broadcasting Convention) в сентябре 2008 г. от фирмы «ДИП».
Влияние преобразований формата изображения на восприятие аудиовизуального произведения
Развитие систем широкоформатного телевидения, внедрение телевидения высокой чёткости привело к появлению у населения некоторого парка широкоформатных ТВ приёмников. Большинство аналоговых телевизионных систем имеют соотношение сторон изображения 4:3. В новых системах формат экрана увеличен по сравнению с обычным ТВ. В кинематографе он варьируется от 1,33 до 2,35 для формата CinemaScope и даже 2,77 в широкоэкранном формате Dynavision 3D. Различные сочетания формата экрана и формата изображения дают форматы отображения: обычный, широкоэкранный, анаморфотный, Letter box-A, Letter box-B. Изменение формата кадра представляет собой частный случай преобразования стандартов. В последнее время функция преобразования формата кадра стала настолько важной, что выпускается ряд аппаратов, преобразующих только формат кадра без изменения стандарта разложения и формата сигнала.
В работе рассмотрены возможные форматы отображения и способы их преобразования. При трансляции кинофильмов на телевизионный экран существует выбор между показом фильма в заниженном режиме Letter box с дополнением изображения чёрными полями и панорамным режимом с потерей части изображения.
В зависимости от сюжетной составляющей фильма зрители могут по-разному воспринимать подобные трансформации. Необходимо выявить особенности субъективного восприятия изображения транслируемого в различных режимах. Для этого была проведена серия экспериментов, в которой представители различных целевых групп выбирали наиболее комфортный режим просмотра видеоматериала в зависимости от режима просмотра, формата экрана и сюжетной составляющей тестируемого материала. Оценка проводилась методом парных сравнений. Для эксперимента было выбрано 3 эпизода по 15 секунд из кинофильмов различной жанровой направленности: киноэпопея с преобладанием батальных сцен и общих планов (формат изображения 16:9), телесериал с доминированием крупных и средних планов (4:3) и детектив с чередованием крупных, средних и общих планов (4:3). Видеоматериал демонстрировался на экранах с соотношением сторон 4:3 и 16:9 в различных режимах. Результаты эксперимента показали разницу в предпочтениях зрителями режимов просмотра одного и того же материала в зависимости от формата экрана. Так, например, режим Letter box в случае показа кинофильма на экране 4:3 оказался более комфортным для просмотра, чем панорамный режим с потерей части информации по горизонтали. В то время как для просмотра видеоматериала формата 1,33 на широком экране большинство экспертов предпочло режим Pan&Scan.
Кирилл Гусев , аспирант кафедры видеотехники СПбГУКиТ, с докладом «Исследование методов компенсации неравномерности освещенности кадра в фильм-сканере». Приз от ФГУП «Научно-исследовательский институт телевидения» – карманный компьютер Hewlett-Packard.
Кирилл Гусев
Кирилл Гусев
Аспирант кафедры видеотехники Санкт-Петербургского государственного университета кино и телевидения. В 2007 году защитил магистерскую диссертацию по направлению «Радиотехника», в том же году поступил в аспирантуру СПбГУКиТ. Научные интересы сосредоточены в области цифрового кинематографа, сканирования и цифровой обработки киноизображений.
В конференции участвует в четвертый раз. Награждён призом от компании «Невафильм» – мультимедийным плеером Apple iPOD.
Исследование методов компенсации неравномерности освещенности кадра в фильм-сканере
Фильм-сканеры находят применение в системах производства кинофильмов с промежуточным цифровым этапом, при реставрации архивных кинофильмов цифровыми методами, а также при создании фильмов, предназначенных для показа в цифровых кинотеатрах, когда в фильм должны войти сцены, снятые как традиционными, так и цифровыми кинокамерами.
Одним из параметров, определяющих качество перевода киноизображения в цифровой вид в фильм-сканерах, является неравномерность освещенности кадра в кадровом окне. Неравномерность яркости полученного с фильм-сканера изображения обусловлена как несовершенством оптических систем, имеющих более низкое светопропускание по краям, так и особенностями конструкции осветительной части. Для более равномерного освещения кадрового окна принимаются специальные меры, например, осветитель строится по схеме сферы Ульбрихта. Но даже несмотря на эти меры, добиться идеально равномерной освещенности кадра невозможно. Остаточную неравномерность можно скомпенсировать цифровыми методами.
В основу такой коррекции предлагается положить перемножение отсчетов файлов изображений, получаемых с фильм-сканера, на корректирующую двумерную матрицу коэффициентов. Такая матрица может быть получена из изображений открытого кадрового окна, то есть изображений, полученных съемкой кадрового окна без кинопленки. Однако эти изображения характеризуются зашумленностью, и для получения корректирующих матриц необходимо провести их фильтрацию. При этом к фильтрации не предъявляется настолько же жестких требований, как при шумоподавлении на сюжетном изображении, так как неравномерность носит низкочастотный характер, полезные высокочастотные детали отсутствуют. Еще один способ борьбы с шумом – накопление серии изображений и их последующее усреднение. Если усреднение производится по n кадрам, то отношение сигнал/шум улучшается в vn раз. Кроме того, изображение открытого кадрового окна можно рассматривать как двумерную функцию, отсчеты которой взяты с некоторой ошибкой. Для получения корректирующей матрицы можно произвести аппроксимацию такой функции при помощи сплайнов.
В работе рассмотрены методы коррекции неравномерности, получение корректирующих матриц в которых осуществляется с применением:
• фильтрации изображения открытого кадрового окна;
• усреднения по нескольким кадрам;
• аппроксимации бикубическими сплайнами.
Изложены математические основы этих методов; выявлены достоинства и недостатки. Приведены и проанализированы практические результаты их применения.