Андрей Путилин: "Надо приучать людей вылавливать информацию из трехмерности"

Алексей Андреев

[email protected]
Зависающие в воздухе фантомы, в нереальности которых можно убедиться, лишь просунув сквозь них руку, давно стали частью интерфейса фантастических компьютеров будущего. Но подобные системы существуют уже сейчас — например, в лабораториях компании «Нейрок». О настоящем и будущем фантоматики рассказывает вице-президент компании Андрей Николаевич Путилин.

У этого интервью есть маленькая предыстория. В прошлом году на выставке Comdex Fall компания Dimentional Media демонстрировала впечатляющее устройство, которое позволяет получать трехмерные проекции предметов, «висящие прямо в воздухе». Устройство выглядело как тумба: внутрь кладется предмет, над тумбой появляется его «фантом». Журнал Wired сразу сообщил, что вокруг загадочных стереопроекторов бегают, как безголовые курицы, очарованные русские девушки. Чуть позже в DZ Online хитрую тумбу назвали даже секретной военной технологией. В ответ на это я в одной из своих заметок пошутил, что в скрещивании технологии миража с технологией перископа вообще-то не должно быть ничего секретного.

Тем временем еще более интересное описание тумбы из Dimentional Media появилось в «Компьютерре»: там Сергей Леонов называл загадочные стереопроекции «голограммами». И очень удивлялся, как это его ручка отразилась в голографическом фантоме. После этого я, будучи увлечен темой, стал время от времени обсуждать загадочную технологию с разными высокообразованными знакомыми, работающими в сфере IT. Большинство из них легко вспоминали «голограмму, в которой отражается ручка», но на мои замечания о технологии кривых зеркал отвечали, что не может быть такого крутого зеркала. Надо признать, я и сам уже начал сомневаться. Действительно, а какое же оно должно быть, это зеркало? В памяти всплывал разве что параболоид из «Гиперболоида».

Кончилось тем, что я пошел к специалисту, заведующему лабораторией сверхбыстродействующей оптоэлектроники и обработки информации ФИАН Андрею Николаевичу Путилину. И он меня успокоил — действительно, никаких там голограмм, просто зеркало в форме выеденного яйца. И даже напомнил школьную геометрию: у эллипса два фокуса, лучи из одного попадают в другой. Заодно специалист рассказал мне и о других разработках в той загадочной области, которую Лем называл «фантоматикой», а я для простоты назову «внешней трехмеркой», чтобы отличать ее от обычной компьютерной трехмерки.

— Андрей Николаевич, давайте начнем с самого загадочного — со слова «голограмма», которое в последнее время употребляется в отношении довольно разных вещей. Что же это на самом деле?

— Наш окружающий свет в основном некогерентный. Можно отследить его амплитуду — положить фотопластинку, поставить камеру. А вот фазу очень трудно отследить, она очень быстро меняется. Габор придумал подать на фотоприемник еще одну — опорную — волну, под которой фаза и отсчитывается. Вскоре нашлись подходящие источники когерентного света (лазеры прежде всего), нашлись регистрирующие среды… Но в отличие от обычной фотографии, на таких голограммах при обычном свете никакого изображения не видно. Для воспроизведения изображения нужно воспроизвести ту опорную волну, которая использовалась при записи. То есть осветить пластинку тем же лазером. Тогда в той области, где был объект, возникнет трехмерное изображение.

К следующему прорыву в этой области имеет отношение наш соотечественник, Денисюк. Он сказал: давайте запишем голограмму так, чтобы опорная волна, которая нам нужна для получения изображения, селектировалась самой голограммой. Тогда можно будет осветить чем угодно, а голограмма сама выберет, что ей нужно. Это так называемые отражательные голограммы.

Потом еще был такой хитрый мужик Бентон. Он заметил, что для человека более всего важен горизонтальный параллакс. Потому что у человека два глаза, расположенных горизонтально. Было бы три глаза — тогда бы мы видели «глубину» и по вертикали. Бентон предложил убрать избыточный вертикальный параллакс. Это позволило записывать объемные изображения, которые читаются в обычном белом свете и вообще без всякой селективности. Это пропускающие голограммы, или радужные. Они недорогие, их можно штамповать на пластике, и уже не нужны специальные объемные среды.

— Это видимо как раз те голограммы-логотипы, которые на кредитных карточках штампуют, чтобы подлинность засвидетельствовать.

— Да, это они. У нас, кстати, тоже есть технология, которую мы планируем использовать для защиты информации. Один наш изобретатель, некто Никашин, придумал другой интересный способ уменьшения избыточности. Он делает голограммы — хотя я их называю растрограммами — на металлических пластинках алмазным резцом. Без всякой оптики и лазеров. Нужен только графопостроитель, который рисует дуги. В нормальном свете это выглядит как обычные царапины на металле. А когда вы освещаете точечным светом, каждый штрих формирует свою отдельную точку — как линза Френеля в обычной голограмме. Можно таким способом рисовать рекламу, вывески. Солнце выходит — вы видите объемную картину. Солнце ушло — ничего нет. Вообще говоря, подобные эффекты были знакомы даже древним китайцам. Они делали насечки на металлических зеркалах.

— Как заставить голограмму двигаться?

— Нужно экстраполировать те технологии, о которых мы говорили, на динамическую среду. Динамическая среда отличается от статической тем, что у нее время записи и стирания очень маленькое. Она должна позволять быструю перезапись, кадр за кадром. И такие эксперименты были. В общем случае это делалось на термопластах. Лента проходит через ту область, где идет запись, потом попадает в область, где она воспроизводится, потом нагревается — изображение стирается, и все снова. Но вообще с динамическими средами большая проблема: до сих пор практически нет таких сред, которые долго выдерживали бы, и были бы не очень энергоемкими, и так далее.

— А цифровые технологии внесли какой-нибудь вклад в это дело?
— Бывают и цифровые голограммы, которые можно воспроизводить тремя лазерами. Но синтезированные голограммы предполагают очень большой объем записи. Нужно сначала оцифровать объект, передать куда-то, записать, синтезировать из этого голограмму и отобразить ее. Это очень большие потоки данных. В Массачусетском технологическом институте пошли по этому пути — у них были серьезные заказчики, военные. Ну, они сделали такую довольно сложную систему полной эмуляции трехмерного мира. Данные обсчитывались на суперкомпьютерах. Эффектно, конечно, но стоит очень дорого.

— Недавно на «Комтеке» показывали некие дисплеи, которые назывались «голографическими». Что здесь имеется в виду под словом «голографический»?

— Ну, скажем так — это просто линзы. Это не голография в смысле стереоизображения, а использование голографической линзы для того, чтобы сформировать нужный вам угол обзора. Голографический рассеиватель отличается тем, что производит впечатление просто прозрачного стекла. И вдруг, глядя на него с определенного угла, вы видите изображение, как бы висящее в воздухе. Такая вот технология «скрытого экрана». Его, конечно, можно сделать настоящим стереоэкраном, если использовать несколько проектов, а линзу сделать селективной, чтобы изображение, проецируемое на это стекло под одним углом, попадало в правый глаз, а с другого проектора, соответственно, в левый.

— Как я понимаю, мы отошли от динамических голограмм и уже говорим о более дешевом методе создания эффекта трехмерности — о стереодисплеях.
— Это так называемые автостереоскопические дисплеи, которые формируют несколько зон, а эти зоны формируют для каждого глаза свое изображение. Рассматривать их можно без очков, потому и «авто». Есть несколько схем для создания таких мониторов. Самые распространенные — параллакс-барьер или микролинзовый растр. На исходном мониторе изображение нарезывается по столбцам: полоска для левого глаза, полоска для правого, и так далее. А потом на это надевается микролинзовый растр. Каждая линзочка — это такой вертикальный цилиндрик, закрывающий как раз два столбца. Поскольку глаза смотрят на линзу под разным углом, то один столбец оказывается виден только правому глазу, а соседний с ним — только левому. В случае с параллакс-барьером вместо микролинз ставится амплитудная решетка: черный столбец, белый столбец… И период такой же, как у столбцов, на которые нарезано изображение. Решетка блокирует определенные зоны, и так же, как микролинза, позволяет видеть одним глазом одно изображение, другим — другое.

— Но это только если сидеть в определенном месте, как я понимаю…

— Да, и с этим связан один большой минус стереодисплеев с параллакс-барьерами и с микролинзами. У них есть так называемые инверсные зоны. Вы смещаетесь всего на несколько градусов, на половину зоны — и у вас картинка для правого глаза попадает в левый глаз, а картинка для левого — в правый. И то, что было выпуклым, стало вогнутым. Чтобы бороться с этими инверсными зонами, мы и придумали нейростереодисплей.

— Когда я впервые поглядел на ваш сайт и попытался мысленно совместить две технологии, которые там упоминались — нейросети и стереодисплеи — у меня возникла такая очень киберпанковская картика: нейрошунты в голову и прямой интерфейс «мозг-компьютер».

— Нет, у нас нейросеть используется для другого. Стереомонитор представляет собой два LCD-дисплея, сложенных вместе «бутербродом». Представьте два стекла, на каждом — группа светлых и темных точек. Если сложить их и посмотреть на просвет, левый глаз увидит несколько иную картинку, чем правый. Ведь они смотрят на это «перекрытие» под разным углом — так что свет, идущий в разные глаза через одну точку на заднем экране, проходит через разные точки на переднем экране. Получается почти так же, как в случае с паралакс-барьером, только вместо регулярной решетки — нерегулярный паттерн из точек на LCD-дисплее. Остается подобрать прозрачность каждого пикселя таким образом, чтобы каждый глаз видел свою половинку стереопары. Для этих расчетов и используется нейросеть. Каждая точка на экране — это узел сети, а ее «вес» — это степень прозрачности.

— А зачем здесь нужна нейросеть?

— Потому что не существует общего аналитического решения нашей задачи. Вместо этого мы используем сетевой метод, то есть на каждый конкретный случай строим своего рода виртуальную модель стереоэффекта, который будет возникать у наблюдателя, сидящего в заданной области. Сел где-то рядом второй человек — нейросеть может тут же пересчитать модель так, чтобы стереоэффект возникал у обоих. И так далее, там уже дело техники — насколько разрешения хватит.

— Но это, конечно, будет недешевое устройство…

— У меня вообще была идея сделать приставку для обычного монитора. Человек, который не может себе позволить дорогой стереомонитор, купит просто еще один экранчик. Правда, в данном случае стереоэффект разменивается на разрешение. Мы разбиваем экран на две зоны, соответственно, получаем стереоизображение вдвое меньшего разрешения.

— Кстати, а можно ведь корректировать картинку вслед за движениями человека?

— Да, к нашей системе можно легко прикрутить трекинг. В более простых моделях именно так и борются с проблемой инверсных зон. На прошлом CEBIT’е показывали одну интересную разработку. Студенты, кажется, из Дрездена это придумали. Вместо того, чтобы двигать параллакс-барьер или линзовый растр, они просто поставили сервопривод и поворачивали весь дисплей вслед за человеком. Очень простое и недорогое решение.

— Раз уж мы заговорили о движущихся экранах — что вы думаете о киберсферах?

— Там используется несколько иной эффект. Дело в том, что у человека представление о глубине сцены возникает в результате достаточно сложных физиологических процессов. И работает это лишь в определенных пределах. Человек не может, как фотоаппарат, перенастраиваться одинаково хорошо и быстро на что угодно. Вместо этого он вычисляет расстояние до одного объекта — и сразу экстраполирует на эту плоскость все остальное. А киберсферы и прочие широкоэкранные проекции создают эффект объемности за счет того, что края экрана отсутствуют, человеку не к чему привязаться. От этого настройка человека рушится, сбивается масштаб — и вроде бы возникает такой эффект, что одни вещи дальше, потому что меньше, а другие ближе. Но такой обман чувств создает неприятные ощущения. Я видел такое в одном из центров НАСА. Вышел оттуда с головной болью.

— Не приблизить ли тогда экран к глазам? Разнести стереопару на очки, скажем…

— Да, это упрощает дело. Но во-первых, чисто технически человек не привык, когда у него на голове лишние килограммы висят. Во-вторых, человек получает информацию от многих вещей — не только от движения глаз, но и от движения шеей. И если у вас нет хорошего трекинга, а вы закрываетесь в шлеме — мозг сразу замечает, что нет естественности. И опять сигнализирует головной болью. Иногда даже обмороки случаются.

— А что вы думаете насчет проекции прямо в глаз и избавления от дисплея вообще?

— На самом деле, когда говорят о «проекциях без дисплея» — это некий обман. Все равно ведь нам нужно где-то сформировать изображение! Луч электронно-лучевой трубки рисует картинку на экране, а здесь нужно точно так же нарисовать картинку на сетчатке. Тогда возникает вопрос — каким образом это сделать? Все равно нужен какой-то физический рассеиватель, линза.

— А если прямо на зрительный нерв картинки сливать?

— Да, можно конечно впрямую через мозг действовать, к нервным окончаниям электроды подключить, есть и такие проекты. Но я, во-первых, не хотел бы, чтобы у меня кто-то копался в глазу или в мозгах. А во-вторых, у человека так устроен зрительный аппарат, что по пути от глазного яблока к глазным долям мозга уже происходят многие процессы обработки информации. Какие-то признаки объектов человек распознает прямо в потоке, разные отделы мозга занимаются разными вещами… Обмануть эту систему очень сложно. Эмулировать объемное изображение снаружи, с помощью стереодисплея, гораздо легче.

Вообще, человеку нужно очень мало, чтобы представить себе объемность. В свое время выпускались такие кассеты с «Камасутрой». Тоже говорили, что это стереокино — очки специальные одеваешь и видишь объем. На самом деле, это обман. Объема там конечно нет. Но есть интересный эффект: когда глаз человека освещается ярким светом, время обработки изображения не такое, как при плохом освещении. Если вы крутите сцену, а человеку даете очки, у которых одно стекло затемнено, то получается, что он разными глазами видит разные кадры. Вот и стереоэффект.

— Как вам видятся дальнейшие перспективы «внешней трехмерки»? Насколько она изменит мир?

— Сильно не изменит. Это как с телевидением — все привыкают. И потом, надо еще приучать людей вылавливать информацию из трехмерности. На самом деле, в объемности ненамного больше информации, чем в двумерной картинке. У меня один студент занимался сжатием трехмерных картинок и смотрел, сколько добавочной информации — чисто объективно — в них содержится. Оказывается, не очень-то много — процентов десять. Все красивые эффекты на этих десяти процентах и держатся.

— Можно предположить, что это найдет применение в индустрии эффектов, то есть развлечений?

— Я бы сказал иначе. Если поток информации, сваливающейся на людей, увеличится, поневоле придется добавить объем. Уже сейчас некоторым профессионалам требуется два-три дисплея, чтобы разместить все окна, в которых они работают. И все равно они путаются. Человек сам себя загнал в этот двумерный мир, хотя на самом деле представление в трехмерном виде для нас более естественно. Более того, сейчас становится все больше профессий, где важно пространственное восприятие. Что же касается компьютерных игрушек… Я вообще считаю, что игрушки мешают человеку воспроизводить естественные рефлексы. Лучше, конечно, чтобы трехмерность действительно несла полезную информацию.

— Вас не пугает возможность всеобщей фантомизации? Скажем, стоит старый дом, который надо бы подремонтировать — а вместо этого вокруг него просто создается красивый голографический фасад в стиле барокко…

— Виртуализация мира вообще очень опасна. И конечно, трехмерность, добавленная к этой виртуализации, только увеличит количество «зомбированных». Кроме того, появятся дополнительные проблемы, связанные с тем, что у человека вообще не будет грани между мирами. Сейчас он, по крайней мере, еще различает, где двумерный компьютерный мир, и где трехмерный настоящий. С внедрением трехмерных дисплеев грань будет стираться. Поставив это на поток, мы, может быть, добавим какой-то части населения новых возможностей. Но с другой стороны, с большой вероятностью загубим естественное стремление человека к познанию реального мира. По крайней мере, я этого опасаюсь.

P.S. «Нетоскоп» выражает благодарность сотрудникам «Нейрока» Константину Канашину и Сергею Молочкову за демонстрацию нейростереодисплея.
И маленький комментарий напоследок. Стереодисплей действительно впечатляет. Даже в случае всего двух LCD-дисплеев в «бутерброде» — а ведь их число можно увеличить, что даст совсем реалистичное стереоизображение. Кроме того, предложенная модель нейровычислений, очевидно, будет иметь еще много приложений. В частности, помимо стереоэффекта, та же система позволяет создавать дисплеи, изображение на которых может увидеть только один человек, стоящий в определенном месте (например, во время снятия денег с банкомата — тогда никто другой не считает ваши данные из-за спины).
В то же время реализация нейросетевого алгоритма «в железе», так же, как налаживание производства многослойных LCD-дисплеев, потребует времени. Видимо, пройдет еще не менее пяти лет, прежде чем стереодисплеи будут поставлены на поток и станут не дороже мобильников. Не говоря уже о том, что кому-то придется много поработать над созданием специальной видеопродукции, которая будет на этих дисплеях демонстрироваться. В общем, есть хорошая новость — еще лет десять мы все-таки будем легко отличать плоский компьютерный мир от трехмерной реальности.