» » D-ID запускает ‘Говорящий портрет " - способ превращения фотографий в пользовательские фотореалистичные видео. (Видео)

D-ID запускает ‘Говорящий портрет " - способ превращения фотографий в пользовательские фотореалистичные видео. (Видео)

25


Компания, чьи технологии привели в действие сенсационное приложение MyHeritage, превратившее классические семейные фотографии в реалистичные движущиеся портреты, вернулась с новой реализацией своей технологии: преобразованием неподвижных фотографий в ультрареалистичное видео, способное говорить все, что вы хотите.

Говорящие портреты D-ID могут выглядеть как пресловутые “фейки”, которые появились в заголовках за последние пару лет, но базовая технология на самом деле совершенно иная, и для базовой функциональности не требуется никакой подготовки.

D-ID, который фактически дебютировал на TechCrunch Battlefield в 2018 году с совершенно другим фокусом (технология распознавания лиц), дебютировал в своем новом продукте "Говорящие портреты" в прямом эфире на TechCrunch Disrupt 2021. Компания продемонстрировала ряд примеров использования, в том числе использование своей новой технологии для создания многоязычного телеведущего, способного выражать различные эмоции; создание виртуальных персонажей-чат-ботов для взаимодействия со службой поддержки клиентов; разработка учебных курсов для повышения квалификации; и создание интерактивных диалоговых киосков видеорекламы.

Как этот новый продукт, так и партнерство D-ID с MyHeritage, в результате которого приложение последней компании ненадолго заняло первое место в чартах Apple App Store, очевидно, являются серьезными отклонениями от первоначального фокуса компании. Вплоть до мая прошлого года D-ID все еще привлекала финансирование на основе своего более раннего подхода, но ее партнерство с MyHeritage дебютировало в феврале, после чего последовала аналогичная сделка с GoodTrust и яркая связь с Warner Bros. о фильме Хью Джекмана “Воспоминание”, который позволил фанатам вставить себя в его трейлер.

Поворот D-ID может показаться более драматичным, чем у большинства, но с технической точки зрения его новый акцент на оживлении фотографий не так далек от его программного обеспечения для деидентификации. Генеральный директор и соучредитель D-ID Гил Перри сказал мне, что компания выбрала новое направление, потому что было очевидно, что существует очень большой адресный рынок, когда речь заходит о такого рода приложениях.

Такие известные клиенты, как Warner Bros., а также доминирующее в App Store приложение от относительно неизвестного бренда, похоже, поддерживают эту оценку. Однако Speaking Portraits ориентирован как на больших, так и на маленьких клиентов и позволяет любому создавать видео в формате full HD из исходного изображения, а также записанной речи или набранного текста. D-ID запускает продукт с поддержкой английского, испанского и японского языков, но в будущем планирует добавить и другие языки, поскольку клиенты запрашивают поддержку для них.

D-ID предлагает две основные категории говорящего портрета, включая “Одиночный портрет”, который может быть сделан с использованием только одного неподвижного изображения, в котором есть анимированная голова, но другие части остаются статичными. Этот также будет работать только с существующим фоном на фотографии.

Для немного более жуткой реальности есть опция “Обученный персонаж”, которая требует отправки 10-минутного обучающего видео запрошенного персонажа в соответствии с рекомендациями компании. Это имеет то преимущество, что оно может работать с настраиваемым фоном, который можно менять, и содержит некоторые предустановленные параметры анимации для тела и рук персонажа.

Посмотрите пример диктора с говорящим портретом, созданного с использованием метода обученного персонажа ниже, чтобы понять, насколько реалистичным он может быть:


Демо-версия, которую Перри показал нам сегодня в прямом эфире в Disrupt, была создана на основе его фотографии в детстве. Фотография была сопоставлена с выражением лица, выполненным своего рода кукловодом-человеком, который также озвучил сценарий того, что в итоге сказала Говорящая Портретная версия Гила во время взаимодействия между его нынешним и более молодым "я". Вы можете посмотреть видео того, как выражение лица оратора было отражено на анимированной фотографии ниже:

Очевидно, что возможность создавать фотореалистичные видео всего из одной фотографии, которые могут убедительно передать любые нужные вам линии,-это немного ошеломляющая перспектива. Мы уже видели далеко идущие дебаты об этике глубоких подделок, а также усилия отрасли, направленные на то, чтобы попытаться снять отпечатки пальцев и определить, когда ИИ генерировал реалистичные, но искусственные результаты.

Перри сказал в Disrupt, что D-ID “стремится убедиться, что он используется во благо, а не во вред”, и что для достижения этой цели они собираются выпустить обещание в конце октября вместе с партнерами, в котором изложены их обязательства по “прозрачности и согласию”, когда дело доходит до использования технологий, таких как Говорящие портреты. Цель указанного обязательства состоит в том, чтобы гарантировать, что “пользователи не будут сбиты с толку тем, что они видят, и что вовлеченные люди дадут свое согласие”.

В то время как D-ID хочет дать гарантии в своих условиях использования и публичной позиции в отношении неправильного использования такого рода технологий, Перри говорит, что “не может сделать это в одиночку”, поэтому он призывает других участников экосистемы объединить усилия в усилиях по предотвращению злоупотреблений.

https://techcrunch.com/2021/09/23/d-id-launches-speaking-portrait-a-way-to-turn-photos-into-custom-photo-realistic-videos/

новости | Ошибка? Вторник,12:00 0 Просмотров:30
Другие новости по теме:
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.