Андрей Путилин: «Надо приучать людей вылавливать информацию из трехмерности»

Author:

Алексей Андреев

Зависшие в воздухе фантомы, чьё отсутствие физической реальности можно проверить, проведя через них руку, давно стали неотъемлемой частью интерфейсов футуристических компьютеров. Однако подобные технологии доступны уже сегодня — например, в лабораториях компании «Нейрок». О настоящем и перспективах фантоматики рассказывает вице-президент организации Андрей Николаевич Путилин.

Это интервью имеет свою небольшую предысторию. В прошлом году на выставке Comdex Fall компания Dimentional Media демонстрировала впечатляющее устройство, позволяющее создавать трёхмерные проекции объектов, «висящие в воздухе». Аппарат имел вид тумбы: внутрь помещался предмет, а над ней возникал его «фантом». Журнал Wired сразу заявил, что вокруг загадочных стереопроекторов с интересом вращаются русские девушки, очарованные их магией. Позже в издании DZ Online эту необычную тумбу даже охарактеризовали как секретную военную технологию. В ответ было высказано предположение, что скрещивание технологии миража с перископом вряд ли может быть скрытным.

Тем временем более подробное описание устройства от Dimentional Media появилось в газете «Компьютерра»: там Сергей Леонов называл загадочные стереопроекции «голограммами» и с удивлением отмечал, как его ручка отражалась в голографическом фантоме. Заинтересовавшись, автор стал обсуждать эту технологию с различными специалистами в IT-сфере. Большинство из них с лёгкостью вспоминали «голограмму, отражающую ручку», но в отношении криволинейных зеркал высказывали сомнения, считая невозможным существование настолько совершенного зеркала. Собственные сомнения в этом возникали и у автора. Ведь какое именно должно быть это зеркало? В памяти всплывал разве что параболоид из «Гиперболоида».

В итоге автор обратился к заведующему лабораторией сверхбыстродействующей оптоэлектроники и обработки информации ФИАН Андрею Николаевичу Путилину. Он развеял сомнения — никаких голограмм там нет, а зеркало имеет форму выемки, схожей с яйцом. Он даже напомнил школьные знания по геометрии: у эллипса два фокуса, и лучи, исходящие из одного, собираются во втором. Кроме того, специалист рассказал о других разработках в той загадочной области, которую Лем называл «фантоматикой», а автора для простоты условно обозначил термином «внешняя трёхмерка», чтобы отличать её от традиционной компьютерной трёхмерной графики.

— Андрей Николаевич, начнём с самого загадочного — со слова «голограмма», которое в последнее время используется по отношению к разным явлениям. Что же это на самом деле?
— Свет, окружающий нас, в основном некогерентен. Можно зафиксировать амплитуду — положить фотопластинку или поставить камеру. Однако фазу отследить сложно, она меняется очень быстро. Габор предложил подавать на фотоприёмник вспомогательную — опорную — волну, позволяющую фиксировать фазу. Позже появились подходящие когерентные источники света (лазеры) и регистрирующие среды. В отличие от обычной фотографии, голограммы, созданные с их помощью, при обычном освещении не показывают изображения. Для его воспроизведения необходимо осветить пластинку тем же лазером, что и при записи, и тогда там, где был объект, появляется трёхмерное изображение.
Следующий шаг был сделан нашим соотечественником Денисюком. Он предложил создавать голограммы так, чтобы опорная волна, нужная для получения изображения, проходила селекцию самой голограммой. Это позволило осветить её чем угодно — голограмма сама выбирает необходимую волну. Такие называют отражательными голограммами.
Позже появился Бентон, который заметил, что человеческому зрению больше всего важен горизонтальный параллакс, поскольку у человека два глаза расположены по горизонтали. Если бы было три глаза, мы бы видели глубину и по вертикали. Бентон предложил устранить избыточный вертикальный параллакс, что позволило создавать объёмные изображения для просмотра при обычном белом свете без необходимости в селективности. Это так называемые пропускающие или радужные голограммы, которые недороги и могут штамповаться на пластике — уже не нужна специальная объёмная среда.

— Наверное, именно такие голограммы-логотипы штампуют на банковских картах, чтобы подтвердить подлинность?
— Именно так. У нас также есть технология, планируемая для защиты информации. Один из наших изобретателей, по имени Никашин, предложил иной способ снижения избыточности. Он создаёт голограммы, хотя я их называю растрограммами, на металлических пластинах алмазным резцом, без применения оптики и лазеров. Для этого нужен только графопостроитель, рисующий дуги. При обычном освещении они выглядят как царапины на металле, а при точечном свете каждый штрих формирует отдельную точку, подобно линзе Френеля в традиционной голограмме. Эта техника позволяет рисовать рекламу и вывески, которые проявляются при солнечном свете и исчезают с его уходом. Подобные эффекты известны с древности — китайцы вырезали насечки на металлических зеркалах.

— Как заставить голограмму двигаться?
— Необходимо применить описанные технологии к динамическим средам. Они отличаются высокой скоростью записи и стирания, позволяющей быстро обновлять изображение кадр за кадром. Эксперименты с динамическими голограммами проводились, как правило, на термопластах: лента проходила через зоны записи, воспроизведения и нагрева для стирания изображения, затем процесс повторялся. Главная же трудность заключается в отсутствии долговечных и энергоэффективных динамических сред.

— Внёс ли цифровой подход вклад в развитие этой области?
— Цифровые голограммы существуют, воспроизводимые с помощью трёх лазеров. Однако синтез таких изображений требует огромного объёма данных — сначала объект оцифровывается, потом обрабатывается, после чего создаётся голограмма и выводится на дисплей. В Массачусетском технологическом институте разработали подобную сложную систему для полной эмуляции трёхмерного мира по заказу военных. Результат впечатляет, но подобные технологии очень дороги.

— Недавно на «Комтеке» демонстрировали дисплеи, которые назывались «голографическими». Что именно подразумевается под этим термином?
— На самом деле там используются простые линзы. Это не голография в смысле трёхмерного изображения, а применение голографической линзы для формирования необходимого угла обзора. Такие линзы выглядят как прозрачное стекло, но при взгляде под определённым углом создают эффект «висящего в воздухе» изображения — своего рода технология «скрытого экрана». Если использовать несколько проекторов и сделать линзу селективной, можно создать настоящий стереоэкран, где изображение для правого и левого глаза будет сформировано отдельно.

— Похоже, что теперь разговор идёт о более доступных методах создания трёхмерного эффекта — автостереоскопических дисплеях?
— Да, такие дисплеи формируют несколько зон, каждая из которых отводит отдельное изображение для правого или левого глаза. Дополнительные устройства не нужны — отсюда приставка «авто». Наиболее распространённые подходы основаны на параллакс-барьере или микролинзовом растре. Исходное изображение разделяется по столбцам — одна полоска для левого глаза, следующая — для правого и так далее. Затем накладывается микролинзовый растр: каждая линза представляет собой вертикальный цилиндр, закрывающий сразу два столбца, и под разными углами глаз видит разные участки. При применении параллакс-барьера вместо линз используется амплитудная решётка, блокирующая нежелательные зоны и направляющая изображения для каждого глаза.

— Но это работает только при фиксации позиции зрителя, верно?
— Да, и именно с этим связан существенный недостаток стереодисплеев с параллакс-барьерами и микролинзами: наличие так называемых инверсных зон. Смещение на несколько градусов вызывает ошибочный приём изображения — картинка правого глаза попадает в левый, и наоборот, меняя перспективу с выпуклой на вогнутую. Чтобы устранить эти зоны, была разработана технология нейростереодисплея.

— Когда я впервые посмотрел на ваш сайт и попытался представить, как одновременно работают нейросети и стереодисплеи, у меня возникла киберпанковская картина: нейрошунты и интерфейс «мозг-компьютер».
— Нет, нейросеть используется для решения иной задачи. Стереомонитор состоит из двух LCD-дисплеев, расположенных друг над другом в «бутерброде». Если представить два стекла с группами светлых и тёмных точек, то при взгляде сквозь них под разными углами каждый глаз видит отдельную картинку: свет, проходящий через одну точку заднего экрана, идёт через разные точки переднего. Это похоже на параллакс-барьер, но с нерегулярной сеткой точек на LCD-дисплее. Задача — подобрать прозрачность каждого пикселя так, чтобы каждый глаз увидел свою половину стереопары. Для таких вычислений применяется нейросеть: каждая точка — узел сети, и её «вес» — степень прозрачности.

— Зачем именно нужна нейросеть?
— Нет универсального аналитического решения для нашей задачи. Мы строим виртуальную модель стереоэффекта для каждого конкретного случая, учитывая положение наблюдателя. Если рядом появляется ещё один зритель, нейросеть пересчитывает модель, чтобы обеспечить стереоэффект для обоих. Всё зависит лишь от разрешения и вычислительных мощностей.

— Вероятно, такое устройство будет дорогостоящим?
— Изначально была идея создать приставку для обычного монитора. Пользователи, не желающие покупать дорогой стереомонитор, могли бы использовать дополнительный экран. Правда, при этом стереоэффект достигается ценой уменьшения разрешения — экран делится на две зоны, и изображение получается вдвое менее чётким.

— А можно ли синхронизировать картинку с движениями человека?
— Да, систему легко дополнить трекингом. В более простых вариантах борьба с инверсными зонами осуществляется именно так. На одном из прошлых CEBIT показывали разработку студентов из Дрездена: вместо движения параллакс-барьера или линзового растра они поворачивали весь дисплей вслед за пользователем с помощью сервопривода. Простое и недорогое решение.

— Раз уж заговорили о движущихся экранах, как вы оцениваете киберсферы?
— Там действует иной эффект. Человеческое восприятие глубины обусловлено сложными физиологическими процессами и работает лишь в определённых пределах. Глаз не перенастраивается мгновенно, а вычисляет дистанцию до одного объекта и ориентируется на неё для всей сцены. Киберсферы и другие широкоформатные проекции создают объёмность за счёт отсутствия краёв экрана, а человеку не к чему «привязаться». Это нарушает его восприятие масштаба, вызывая чувство, что одни объекты ближе, а другие дальше, но одновременно создаёт неприятные ощущения. Автор видел подобное в одном из центров НАСА, после чего испытал головную боль.

— Может, тогда приближать экран к глазам — например, разносить стереопару на очки?
— Это упрощает задачу, но есть ограничения. Во-первых, людям неудобно постоянно носить на голове тяжёлые устройства. Во-вторых, зрение формируется не только движением глаз, но и головы. Если отсутствует качественный трекинг, и пользователь закрывается шлемом, мозг быстро замечает неестественность, что приводит к головным болям, а иногда даже к обморокам.

— Какие мысли по поводу проекции изображения прямо в глаз, без дисплея?
— Любые заявления о «проекциях без дисплея» — это скорее заблуждение. Чтобы создать изображение на сетчатке, нужно физически направить свет, а для этого требуется какой-то оптический элемент — линза или рассеиватель. Это не исключает наличие дисплея, просто он переподключён к глазу.

— А если подавать сигнал напрямую на зрительный нерв?
— Подобные эксперименты есть, подключая электроды к нервным окончаниям, но лично я не хотел бы, чтобы кто-то вмешивался в глаз или мозг. Кроме того, зрительная система устроена так, что по пути от глазного яблока к зрительным центрам мозга происходит большая часть обработки информации. Мозг распознаёт объекты на разных уровнях, и обмануть эту систему крайне сложно. Создавать объёмные изображения снаружи, с помощью стереодисплея, легче.
Человеку для восприятия объёмности нужно совсем немного. Ранее выпускались стереокасcеты с «Камасутрой», которые продавались как 3D-кино — с особыми очками для объёма. На деле объёма не было, но создавался интересный эффект: глаз, освещённый ярким светом, обрабатывал изображение иначе, чем при слабом освещении. Если один глаз закрыт, а сцена крутится, возникает иллюзия объёма.

— Каковы дальнейшие перспективы «внешней трёхмерки»? Насколько она изменит мир?
— Значительных изменений ждать не стоит, это похоже на телевидение — люди к нему быстро привыкают. Кроме того, необходимо приучать пользователей извлекать информацию из трёхмерности. Объёмность даёт не так много дополнительной информации по сравнению с плоской картинкой — примерно десять процентов. Все эффекты строятся именно на этой небольшой части.

— Можно предположить, что данная технология найдёт применение в индустрии развлечений, эффектов?
— Скорее так: с ростом объёмов информации, поступающей к людям, придётся добавлять объём. Уже сейчас некоторые профессионалы используют по два-три монитора, чтобы разместить одновременно несколько окон, и даже при этом путаница сохраняется. Люди сами создали двумерный информационный мир, но естественное для нас трёхмерное восприятие остаётся более удобным. С ростом важности пространственного восприятия в ряде профессий объёмные дисплеи будут востребованы. Что касается компьютерных игр, я считаю, что они скорее мешают воспроизводить естественные рефлексы. Лучше, чтобы трёхмерность несла реальную пользу.

— Беспокоит ли вас перспектива всеобщей фантомизации? К примеру, стоит старый дом, требующий ремонта, а вокруг него создаётся лишь красивый голографический фасад в стиле барокко…
— Виртуализация окружающего мира — очень опасное явление. Добавление трёхмерности увеличит число «зомбированных». Кроме того, появятся новые проблемы, связанные с исчезновением грани между реальностью и виртуальностью. Сейчас хотя бы можно различать двумерный компьютерный мир и настоящую трёхмерность. С внедрением трёхмерных дисплеев эта грань размоется. Хотя такие технологии могут расширить возможности части населения, есть риск, что люди утратят стремление к познанию реального мира. Я опасаюсь именно этого.


P.S. «Нетоскоп» благодарит сотрудников «Нейрока» Константина Канашина и Сергея Молочкова за демонстрацию нейростереодисплея.
Небольшой комментарий: стереодисплей действительно производит впечатление. Даже с двумя LCD-дисплеями в «бутерброде» — а их число можно увеличить для более реалистичного эффекта. Предложенная модель нейровычислений наверняка найдёт множество применений, например, позволяя создавать дисплеи, изображение на которых видит только один человек, находящийся в определённом месте (например, при снятии денег в банкомате, чтобы никто за спиной не подсматривал).
Однако реализация нейросетевого алгоритма в аппаратуре, равно как и организация производства многослойных LCD-дисплеев, потребует времени. Вероятно, пройдёт не менее пяти лет, прежде чем стереодисплеи станут массовыми и доступны по цене, сравнимой с мобильными телефонами. К тому же потребуется значительная работа по созданию специального трёхмерного видеоконтента. В итоге хорошая новость: ещё около десяти лет будет легко отличать плоский компьютерный мир от настоящей трёхмерной реальности.