Статья #7: Расширяем возможности Fooocus: Inpaint, Describe, Enhance и Metadata
В предыдущей статье мы подробно рассмотрели, как использовать функцию Image Prompts в Fooocus для создания изображений на основе визуальных подсказок. Продолжая наше погружение в мир Fooocus, в этой статье мы сосредоточимся на других не менее важных, но часто менее освещенных функциях: Inpaint, Describe, Enhance и Metadata.
Эти инструменты значительно расширяют возможности Fooocus, позволяя не только генерировать изображения, но и точечно их редактировать, анализировать и сохранять информацию о генерации.
Функция Inpaint в Fooocus (впервые представленная в версии 2.1.822) предоставляет мощные возможности для точечного редактирования изображений, аналогичные функциям «Left/Right/Top/Bottom» в Midjourney.
Она позволяет изменять определенные части изображения, сохраняя при этом общую композицию и стиль. Это достигается за счет использования собственного алгоритма DPM++ и модели контроля Fooocus, что минимизирует влияние на стиль базовых моделей.
Как работает Inpaint?
Inpaint позволяет пользователю выделить область на изображении, которую необходимо изменить, и затем сгенерировать новую часть изображения на основе текстового запроса или без него или дорисовать, если говорить простым языком.
Это особенно полезно для:
•Исправления дефектов, например, некорректно сгенерированных лиц, рук или глаз.
•Добавления или удаления объектов, то есть можно легко добавить новый элемент в сцену или убрать ненужный.
•Изменения деталей, а если точнее, то изменить цвет одежды, прическу персонажа или фон.
Fooocus Inpaint также поддерживает функцию «Outpaint», которая позволяет расширять изображение за его первоначальные границы, создавая новые детали вокруг существующей композиции.
Пример использования Inpaint для исправления деталей
Представьте, что вы сгенерировали изображение, которое идеально во всем, кроме одной детали — например, у персонажа деформированы руки. С помощью Inpaint вы можете выделить эту область и, при необходимости, добавить уточняющий промпт, например, «realistic hands», чтобы Fooocus сгенерировал корректные руки, не затрагивая остальную часть изображения.
Или другой пример, вам нужно дорисовать вашу картирку.
Однако, давайте более детально рассмотрим расширенные настройки этой функции.
Enable Advanced Masking Features
По умолчанию Fooocus стремится автоматизировать процесс, но для продвинутых пользователей, желающих получить больший контроль есть возможность активировать расширенный контроль и использованию более сложных и точных методов определения и манипулирования областями изображения, которые будут подвергаться изменениям.
Активация расширенных функций маскирования позволяет:
1. Inpain or Outpaint
Этот метод используется для расширения изображения за его первоначальные границы или для внесения общих корректировок на текущем изображение.
2. Inpaint (Improve Detail)
Этот метод фокусируется на улучшении деталей внутри маскированной области, не изменяя ее кардинально. Он часто используется для повышения качества лиц, рук, глаз или других мелких элементов, которые могли быть сгенерированы с низким качеством. Fooocus будет использовать загруженную маску, чтобы сосредоточить свои усилия на улучшении указанных пикселей.
3. Inpaint (Modify Content)
Этот метод используется для изменения содержимого внутри маскированной области. Fooocus будет генерировать новое содержимое, стараясь органично вписать его в окружающий контекст. Это основной метод для задач, таких как удаление объектов, замена элементов или исправление дефектов.
В зависимости от того, какие корректировки в изображение нужно внести, выбирайте соответствующий метод.
Что такое Mask Upload и как применять?
Она позволяет пользователям предоставлять собственные маски, указывая Fooocus, какие именно области изображения должны быть изменены или улучшены. Это дает значительно больший контроль по сравнению с автоматическим маскированием, которое Fooocus выполняет по умолчанию.
Маска представляет собой черно-белое изображение, где белые пиксели указывают на области, которые будут изменены, а черные — на области, которые останутся нетронутыми. Это позволяет пользователю вручную или с помощью других инструментов создать точную маску для конкретной задачи.
Представьте, что вы сгенерировали изображение, на котором есть человек, но его глаза выглядят неестественно.
Что делаем в этом случае?
1. Создать маску
В графическом редакторе создайте черно-белую маску, где белым цветом будут выделены только глаза.
Можно так же загрузить эту маску в Fooocus через Input Image → Inpaint or Outpaint → EnEnable Advanced Masking Features → Mask Upload
2. Выбрать метод
Выберите Method → Improve Detail
3. Сгенерировать
Запустите генерацию. Fooocus сосредоточится на улучшении глаз, используя маску как точное указание.
Аналогично, если вы хотите удалить объект с изображения, вы можете создать маску вокруг этого объекта, выбрать Method: Modify Content и запустить генерацию без дополнительного промпта или с промптом, описывающим фон, который должен заполнить место удаленного объекта.
Fooocus Describe - превращаем изображения в промпты
Функция Describe (введена в версии 2.1.831) — это аналог команды /describe в Midjourney. Она позволяет загрузить изображение и получить четыре возможных текстовых промпта, описывающих это изображение. Это невероятно полезный инструмент для исследования новой лексики и эстетических направлений, а также для понимания, как ИИ «видит» и интерпретирует визуальную информацию.
Зачем нужен Describe?
•Обратный инжиниринг промптов
Если у вас есть изображение, но вы не знаете, как сформулировать промпт для его генерации, Describe предложит варианты.
•Изучение стилей
Помогает понять, какие слова и фразы соответствуют определенным визуальным стилям.
•Вдохновение
Может дать новые идеи для промптов, которые вы, возможно, не рассматривали.
Функция Describe работает как для фотографий, так и для изображений в стиле арт/аниме, предлагая соответствующие описания.
Fooocus Enhance - улучшение и детализация изображений
Функция Enhance (появилась в версии 2.5.0) позволяет автоматически улучшать и/или детализировать части изображения на основе промпта или входного изображения. Она сравнима с ADetailer, но предлагает более гибкое обнаружение объектов и замену с помощью промптов обнаружения и замены вместо статических моделей обнаружения.
Принцип работы Enhance
Enhance работает путем определения областей на изображении (например, лица, руки, глаза) и их последующего улучшения или замены. Это может быть использовано как при генерации нового изображения, так и для улучшения уже существующего.
•При генерации
Вы генерируете изображение, а затем, если результат вас устраивает, включаете вкладку Enhance, указываете промпт обнаружения (что вы хотите улучшить) и, при необходимости, позитивный/негативный промпт для замены.
•Для существующего изображения
Просто загрузите изображение во вкладку Enhance, и Fooocus пропустит процесс обработки промпта, сосредоточившись только на шагах улучшения.
Enhance использует модели сегментации, такие как SAM (Segment Anything Model) в сочетании с GroundingDINO, для точного определения объектов на изображении. Это позволяет достичь высокого качества улучшения и детализации.
Fooocus Metadata - сохранение и извлечение информации о генерации
Функция Metadata в Fooocus позволяет сохранять и извлекать информацию о параметрах, использованных для генерации изображения. Это крайне важная функция для воспроизводимости результатов и обмена опытом в сообществе.
Что такое Metadata?
Metadata — это данные о данных. В контексте генерации изображений ИИ, метаданные включают в себя промпты (позитивные и негативные), использованные модели, стили, параметры генерации (разрешение, количество шагов, сид и т.д.).
Ранее Fooocus не встраивал метаданные в выходные изображения, что было неудобно для пользователей, привыкших к таким функциям в A1111 или ComfyUI. Однако, с версии 2.1.854, Fooocus добавил возможность копирования и вставки параметров, что служит аналогом метаданных.
Важность Metadata
•Воспроизводимость
Позволяет точно воспроизвести ранее сгенерированное изображение, используя те же параметры.
•Обучение и эксперименты
Помогает анализировать, какие параметры приводят к желаемым результатам, и экспериментировать с их изменением.
•Совместная работа
Упрощает обмен промптами и настройками с другими пользователями.
Заключение
Функции Inpaint, Describe, Enhance и Metadata значительно расширяют функциональность Fooocus, делая его еще более мощным и удобным инструментом для работы с изображениями, сгенерированными ИИ. Они позволяют не только создавать уникальные визуальные образы, но и тонко настраивать их, анализировать и делиться опытом.
В следующей статье мы детально разберем расширенные настройки Fooocus, которые позволят вам еще глубже контролировать процесс генерации и добиваться потрясающих результатов.
Напоминаем, что если у вас возникли маркетинговые проблемы, мешающие вашему бизнесу развиваться, то команда Рокет Пони всегда к вашим услугам. Вы можете связаться с нами любым удобным способом: