ИИ (искусственный интеллект) улучает фотографии
Искусственный интеллект (ИИ) проникает почти во все сферы нашей жизни. Он в наших смартфонах, а многие из нас пользуются им дома в виде голосовых помощников в умных колонках.
И это лишь самые заметные реализации ИИ, и в ближайшие годы он будет все чаще использоваться в других местах, в сетях, которые будут поддерживать жизнь крупных городов.
Тем не менее, именно в изображении и фотографии можно увидеть, как ИИ работает наиболее продуктивно. Рассмотрим некоторые из лучших примеров этой новой технологии, активно улучшающей фотографию.
ИИ в камере смартфона
Больше всего ИИ продается именно в камерах смартфонах. Многие новые модели имеют вспомогательные функции с искусственным интеллектом, которые используют различные виды распознавания сцен и объектов для улучшения фотографий.
Производители телефонов имеют различные подходы, и есть очень даже интересные решения.
ИИ от Huawei
Немногие компании так активно говоярт об ИИ в телефонах, но для Huawei это вопрос маркетинга, если говорить о модели Huawei P20 Pro. В приложении камеры есть отдельный режим съемки AI, который в Mate 20 Pro может распознавать 1500 различных сцен и ситуаций. Затем происходит обработка с применением цветового и контрастного профиля к композиции, чтобы сделать фотографии потрясающими.
Цель не состоит в достижении естественности. ИИ смартфона работает с насыщенностью цвета для большего воздействия. Такие результаты хорошо смотрятся в социальных сетях.
Освещения портеров в Apple
Портретное освещение является одной из функций в камере Apple и эмулирует эффект различных видов студийного освещения. Несколько других телефонов, таких как Huawei P20 Pro, также пытались проработать эту концепцию, но Apple сделала лучшую реализацию на сегодняшний день.
Так причем тут ИИ? Портретное освещение включает в себя создание трехмерной карты глубины лица объекта, а затем применение 3D-фильтра для добавления световых эффектов, которые следуют контурам объектов, как если бы они освещались студийным светом.
В Apple называет это “карманной студией”. Конечно, решение не заменит настоящую студию, но результаты могут быть удивительными.
Google Lens
Google является самым плодовитым разработчиком в сфере ИИ-технологий, и некоторые из режимов камеры в смартфонах компании плотно взаимодействуют с обработкой искусственным интеллектом.
Например, на фотографии сверху изображен Pixel 3. Фото сделано с использованием режима серийной съемки, который захватывает серию изображений, а затем выбирает те, которые он считает лучшими. Утилита Photobooth делает то же самое, но на фото должны быть лица.
Однако Google Lens является более динамичной демонстрацией ИИI. Это режим камеры, который подключается к сервису распознаванию изображений и текста Google. Вы можете направить смарфтон на продукты, ориентиры и даже рисунки обоев, и Lens попытается найти их в интернете и предоставить соответствующую информацию.
Google Фото
Существует более практичное и почти незаметное использование нейросети, которая входит часть сервиса по распознаванию изображений Google.
В верхней части приложения Google Фото вы увидите панель поиска. Туда можно ввести интересующие объекты или темы и алгоритмы ИИ Google сделают все, чтобы найти соответствующие изображения. Попробуйте ввести запросы, вроде “Собаки”, “Рождество” и даже “сыр” и приложение покажет фотографии, если они находятся в вашей библиотеке.
Фотографии также могут отдельно выбираться и конвертироваться в GIF, их можно улучшить и объединить в коллажи. Все это основано на продвинутом виде распознавания изображений, при котором задействован ИИ.
Восстановление изображений от Nvidia
Некоторые реализации ИИ могут казаться достаточно обыденными, но есть такие приложения, которые действительно кажутся футуристичными.
Методы улучшения изображений Nvidia являются одними из самых впечатляющих визуальных демонстраций контекстуализированного ИИ, и есть три способа, при помощи которых они реализует технологию.
Первое – это удаление шума с изображений. Используется метод глубокого обучения для восстановления данных изображения, испорченных шумом или даже текстом. Это очень продвинутая версия того, что делают камеры смартфона при удалении шума изображения с фотографии.
Метод работает с нейронной сетью, обученной воздействию на другие изображений, что помогает ему распознавать шаблоны и интерполировать данные, отсутствующие в исходном изображении.
Есть и более впечатляющая демонстрация нейронной сети Nvidia, в виде рисования ИИ. В демонстрации части исходного изображения удаляются и перерисовываются, недостающая информация интерполируется через обученную нейросеть.
Также технологии Nvidia позволяют сделать из видео, снятого в 30 кадров в секунду или 60 кадров в секунду в slow-mo при 480 кадрах в секунду, в 16 раз медленнее. Как и в технике рисования, ИИ используется для создания данных изображения, которых просто нет в исходном кадре.
Телевизоры фактически имеют сопоставимые режимы интерполированных кадров. Тем не менее, ИИ от Nvidia может обрабатывать, например, ткань намного лучше, и добиваться более естественных результатов.
Iconem
Текущий ИИ в основном представлен небольшими решениями, но если искусственный интеллект задействован в крупных проектах, то результат удивляет.
Это описание, безусловно, верно и для Iconem, стартапа, использующего ИИ от Microsoft.
Цель Iconem состоит в том, чтобы запечатлеть изображения важных исторических мест, находящихся под угрозой войны, эрозии или других видов ущерба, создавая живую запись их текущего состояния.
Задача ИИ состоит в обработке десятков тысяч фотографий с последующим наложением всего этого на трехмерную модель, используя дронов для захвата изображений. Iconem посещает труднодоступные или опасные места, такие как Великая мечеть в Алеппо, что находится в истерзанной войной Сирии.
Вы можете увидеть некоторые из сканов Iconem на YouTube, и места в Алеппо можно посмотреть в приложении, которые можно скачать на Google Play.
Google BigGAN
Вы можете знать Google за свой поисковый движок и мобильную операционную систему Android, но компания также разрабатывает множество инновационных технологий, используя свои лаборатории и другие комплексы.
DeepMind является подразделением по работе с ИИ и принадлежит материнской компании Google – Alphabet, и BigGAN является одним из ее последних проектов, разработанных стажером. Это часть программного обеспечения ИИ, которое генерирует изображения с использованием алгоритмов.
Сначала изображение генерируется алгоритмически из случайного числа. Затем оно сравнивается с “реальным” аналогом, чтобы проанализировать, насколько они похожи. Затем создается новая версия изображения, чтобы сделать его характеристики ближе к реальным.
Вы можете проверить некоторые результаты BigGAN в интернете. Решение может создавать некоторые удивительно реалистичные естественные текстуры, такие как линии травы и дерева. Тем не менее, человеческие лица, созданные BigGAN, по-прежнему выглядят как кошмары Фрэнсиса Бэкона.