Product University

Как создавать изображения с помощью ИИ
пошаговый мини-курс

10-шаговый мини-курс и полезные шаблоны в Excel и Notion
Помните, были такие профессии — «художник» и «иллюстратор»? Ещё пару лет назад говорили, что ИИ не сможет заменить креативные профессии, но с приходом доступных нейросетей многие поменяли точку зрения. DALL-E и Stable Diffusion уже могут создавать картинки, забирающие призы на конкурсах художников.

Это приведёт к тому, что к 2025 году ИИ отберёт работу у 85 млн человек. Но в то же время создаст огромное количество новых рабочих мест и возможностей для бизнеса. Поэтому сегодня в мини-курсе — обзор самого яркого направления ИИ на сегодня: генерации и редактирования изображений.


10 шагов:

1. Получаем доступ к DALL-E
2. Учимся писать запросы к ИИ
3. Генерируем изображения с помощью Stable Diffusion
4. Генерируем арт в MidJourney
5. Используем inpainting для редактирования изображений
6. Удаляем фон и ненужные объекты на изображении
7. Используем дипфейки для замены лиц
8. Генерируем 3D-изображения
9. Создаём дипфейк-видео
10. Изучаем основы машинного обучения

1. Получаем доступ к DALL-E
Технология генерации изображений из текста совершила мощный рывок за последний год. OpenAI первыми произвели фурор с их моделью DALL-E. 
На днях они открыли доступ без листа ожидания: регистрироваться здесь, также доступен API. К сожалению, не для всех стран — при попытке создать аккаунт с номером телефона РФ/Беларуси/Украины выходит ошибка.

Поэтому план действий таков:
  • Подключаем VPN с туннелем из поддерживаемой страны
  • Указываем виртуальный номер телефона при регистрации — есть много сервисов по типу OnlineSim, Receive SMS и других. Лучше купить платный номер — большинство бесплатных забанены. 
  • После регистрации будет доступно 50 бесплатных генераций, ещё 15 будут давать ежемесячно. Когда триал закончится, попросят привязать карту из «дружественной страны». Для коммерческих проектов придётся открывать счет за рубежом.

2. Учимся писать запросы к ИИ
Основной навык, который требуется при работе со всеми генераторами — написание текстовых запросов (промтов). Появилась целая наука «prompt architecture» — как спросить у нейросетки, чтобы получить интересные результаты.

Вкратце, процесс можно описать так:

  • «Сырой запрос» — описываем объект, который мы хотим сгенерировать, на английском языке. Примеры: panda, a warrior with a sword, skeleton.
  • Добавляем к сырому запросу требуемый стиль изображения. Примеры: realistic, oil painting, pencil drawing, concept art. 
  • Стиль художника. Может полностью преобразить изображение. Например, если вы хотите что-то абстрактное, можно добавить «made by Pablo Picasso».
  • Завершающие штрихи. Тут фантазия может разыграться, что приводит к запросам длиннее этой рассылки. Вы можете добавить к промту что угодно, вот некоторые популярные штрихи: surrealism, the most beautiful image ever seen, 4K, dramatic lighting, epic composition. В общем, алгоритму можно сказать что-то вроде «максимальное количество деталей» и он их нарисует.

Для более полного погружения рекомендуем эти гайды:

  • DALL-E Prompt Book — подробный гайд на 80 страниц про архитектуру запросов к DALL-E 2.
  • Руководство по использованию нейросети Midjourney — как правильно писать запросы, какие параметры прописывать и т.д. 
  • Prompt Builder — пошаговый конструктор запросов к популярным генераторам. 
  • Prompt Base — маркетплейс промтов для DALL-E, Stable Diffusion и GPT-3. За пару баксов можно узнать выигрышные запросы по разным категориям. Можно продавать и свои удачные промты. 

3. Генерируем изображения с помощью Stable Diffusion
Технология генерации изображений из текста совершила мощный рывок за последний год. OpenAI первыми произвели фурор с их моделью DALL-E.
На днях они открыли доступ без листа ожидания: регистрироваться здесь, также доступен API. К сожалению, не для всех стран — при попытке создать аккаунт с номером телефона РФ/Беларуси/Украины выходит ошибка.
Поэтому план действий таков:
  • Подключаем VPN с туннелем из поддерживаемой страны.
  • Указываем виртуальный номер телефона при регистрации — есть много сервисов по типу OnlineSim, Receive SMS и других. Лучше купить платный номер — большинство бесплатных забанены.
  • После регистрации будет доступно 50 бесплатных генераций, ещё 15 будут давать ежемесячно. Когда триал закончится, попросят привязать карту из «дружественной страны». Для коммерческих проектов придётся открывать счет за рубежом.

Продолжение (шаги 4-10) см. в полной версии этого 10-шагового мини-курса.


Подписка включает более 60 мини-курсов.
Плюс каждый месяц — ещё 4 новых курса (выпуски по средам)

Годное чтиво
  1. Почему сейчас? События, после которых начинается рост или падение продукта: кризисы, новые технологии, изменение поведения и др.
  2. История взлёта индийского e-commerce проекта —Shiprocket.
  3. Какие делать тарифы для продуктов, чтобы сохранялись и рост и маржа.
  4. Переписка Илона Маска (pdf), которую обязали сделать публичной в рамках сделки по Twitter.
  5. Как использовать токены для создания сообщества.
Вам понравилось?

10-шаговые мини-курсы
Доступ к 60 мини-курсам и 700+ чек-листам в Notion и Excel

Нажимая кнопку, вы принимаете условия «Политики конфиденциальности»

Читать другие статьи