Статья #8: Расширенные настройки Fooocus: Advanced → Developer Debug Mode
В рамках прошлой статьи Заглянем под капот Fooocus (часть 1) мы познакомились с базовыми настройками вкладки Advanced, так что теперь давайте еще глубже погрузимся во все скрытые настройки Fooocus.
Developer Debug Mode
Developer Debug Mode предоставляет ряд опций для отладки и более глубокого понимания процесса генерации. Эти настройки предназначены для продвинутых пользователей и разработчиков.
Вкладка Bebug Tools
1. Positive ADM Guidance Scaler
•Исходное значение: 1,5
•Описание: множитель, применяемый к позитивному ADM-направлению. Установка значения 1,0 отключает его.
•На что влияет: этот параметр усиливает или ослабляет влияние позитивного промпта на процесс генерации. Более высокие значения заставляют модель сильнее придерживаться позитивных указаний, что может привести к более выраженным чертам, описанным в промпте.
Однако слишком высокие значения могут вызвать артефакты или «перегенерацию» (over-prompting), когда изображение становится слишком агрессивным или искаженным в попытке соответствовать промпту.
Низкие значения (ближе к 1,0) дают модели больше свободы, что может привести к более разнообразным, но менее точным результатам.
2. Negative ADM Guidance Scaler
•Исходное значение: 0,8
•Описание: множитель, применяемый к негативному ADM-направлению. Установка значения 1.0 отключает его.
•На что влияет: аналогично позитивному масштабированию, этот параметр контролирует влияние негативного промпта. Более высокие значения усиливают эффект негативного промпта, заставляя модель активнее избегать элементов, указанных в нем. Это полезно для удаления нежелательных артефактов, стилей или объектов.
Слишком низкие значения могут ослабить эффект негативного промпта, что приведет к появлению нежелательных элементов.
3. ADM Guidance End At Step
•Исходное значение: 0,3
•Описание: определяет, на каком этапе (в процентах от общего количества шагов сэмплирования) должно завершиться применение ADM-направления.
•На что влияет: этот параметр контролирует динамику применения ADM-направления в процессе генерации.
Раннее завершение (например, 0,1-0,2) означает, что модель будет сильно направляться промптами только на начальных этапах, а затем получит больше свободы для детализации.
Позднее завершение (например, 0,5-0,7) означает, что промпты будут влиять на модель дольше, что может быть полезно для сохранения общей композиции или стиля.
Эксперименты с этим параметром могут помочь найти баланс между точностью следования промпту и креативной свободой модели.
4. Refiner Swap Method
•Описание: выбор метода, используемого для переключения между базовой моделью и моделью-рефайнером (улучшителем) в процессе генерации.
Рефайнер используется для добавления мелких деталей и улучшения качества изображения на последних этапах.
•Варианты:
✔ joint (совместный)
Рефайнер работает совместно с базовой моделью, интегрируя свои улучшения на протяжении всего процесса или на определенном этапе. Это стандартный и наиболее сбалансированный подход, обеспечивающий плавный переход и гармоничное улучшение.
✔ separate (отдельный)
Рефайнер применяется как отдельный, последующий этап после завершения работы базовой модели. Это может быть полезно для более агрессивного улучшения деталей, но иногда может привести к небольшим изменениям в общей композиции, если рефайнер слишком сильно изменяет изображение.
✔ vae
Использует VAE (Variational Autoencoder) для обработки изображения на этапе рефайнера. VAE отвечает за кодирование и декодирование изображений в латентное пространство и обратно, влияя на цветопередачу, контраст и общую четкость.
Выбор этого метода может повлиять на финальную эстетику изображения, делая его более или менее насыщенным, или изменяя его тональность.
•На что влияет: выбор метода влияет на то, как и когда рефайнер будет вносить свои коррективы, что сказывается на детализации, четкости и общей согласованности финального изображения.
5. CFG Mimicking from TSNR
•Исходное значение: 7
•Описание: включает реализацию Fooocus для имитации CFG (Classifier-Free Guidance) из TSNR (Time-Step Noise Reduction). Эффективно, когда реальное значение CFG больше имитируемого CFG.
•На что влияет: этот параметр позволяет Fooocus более эффективно управлять влиянием CFG Scale, особенно при высоких значениях.
TSNR — это техника, которая помогает уменьшить шум на ранних этапах генерации, что способствует более стабильным и качественным результатам.
Имитация CFG из TSNR позволяет модели сохранять стабильность и избегать «выгорания» изображения даже при агрессивных настройках CFG Scale, обеспечивая при этом сильное следование промпту.
6. CLIP Skip
•Исходное значение: 2
•Описание: позволяет пропускать определенное количество последних слоев CLIP-модели, чтобы избежать переобучения. Значение 1 означает, что слои не пропускаются, 2 — рекомендуемое значение.
•На что влияет: CLIP (Contrastive Language–Image Pre-training) — это модель, которая помогает понять связь между текстом и изображением. Пропуск последних слоев CLIP может помочь избежать переобучения модели на специфических деталях обучающего набора данных, что может привести к более обобщенным и креативным результатам.
Это может сделать изображения менее «фотографичными» и более «художественными» или «стилизованными». Эксперименты с этим параметром могут изменить стиль и детализацию сгенерированных изображений.
7. Sampler
•Описание: выбор алгоритма сэмплирования, который определяет, как модель будет преобразовывать шум в изображение на каждом шаге генерации. Различные сэмплеры имеют свои особенности и могут давать разные результаты по скорости и качеству.
•Варианты: Fooocus предлагает несколько сэмплеров, таких как DPM++ 2M Karras, DPM++ SDE Karras, Euler, Euler A, Heun, LMS, DPM2, DPM2 a, DPM++ 2S a Karras, DPM++ 2M SDE Heun, DPM++ 2M SDE Heun Karras, DPM++ 3M SDE, DPM++ 3M SDE Karras и другие.
Каждый из них имеет свои преимущества и недостатки.
•На что влияет: выбор сэмплера существенно влияет на скорость генерации, качество деталей, общую эстетику изображения и даже на то, как модель интерпретирует промпт. Некоторые сэмплеры лучше подходят для фотореализма, другие — для стилизованных изображений.
8. Scheduler
•Описание: Выбор планировщика, который определяет, как шум будет добавляться и удаляться на каждом шаге сэмплирования. Планировщик работает в связке с сэмплером.
•Варианты: Fooocus предлагает различные планировщики, такие как Karras, Exponential, S_DPM_2, S_DPM_2_Karras, S_DPM_2_SDE, S_DPM_2_SDE_Karras, S_DPM_2_SDE_Heun, S_DPM_2_SDE_Heun_Karras, S_DPM_2_SDE_3M, S_DPM_2_SDE_3M_Karras и другие.
•На что влияет: планировщик влияет на стабильность процесса генерации, скорость сходимости и качество финального изображения. Правильный выбор планировщика в сочетании с сэмплером может значительно улучшить результаты.
9. VAE (Variational Autoencoder)
•Описание: выбор модели VAE, которая отвечает за кодирование и декодирование изображений в латентное пространство и обратно. VAE влияет на цветопередачу, контраст и общую четкость изображения.
•Варианты: Fooocus может предлагать различные VAE, включая стандартные и экспериментальные.
•На что влияет: VAE играет критическую роль в финальном качестве изображения. Неправильный VAE может привести к тусклым цветам, артефактам или потере деталей. Экспериментальные VAE могут предложить улучшенную цветопередачу или более высокую четкость, но могут быть нестабильными или требовать больше ресурсов.
10. Forced Overwrite of Sampling Step
•Исходное значение: -1
•Описание: принудительно устанавливает количество шагов сэмплирования. Значение -1 отключает эту функцию.
•На что влияет: количество шагов сэмплирования определяет, сколько итераций модель выполнит для преобразования шума в изображение.
Большее количество шагов обычно приводит к более детализированным и качественным изображениям, но увеличивает время генерации.
Меньшее количество шагов ускоряет процесс, но может снизить качество. Этот параметр позволяет точно контролировать этот аспект, что полезно для отладки или сравнения результатов.
11. Forced Overwrite of Refiner Switch Step
•Исходное значение: -1
•Описание: устанавливает шаг, на котором происходит переключение на модель-рефайнер. Значение -1 отключает эту функцию. Предназначено для отладки разработчиками.
•На что влияет: Этот параметр позволяет точно контролировать, когда рефайнер начинает свою работу. Раннее переключение может привести к более сильному влиянию рефайнера на общую композицию, а позднее — к более тонким улучшениям деталей.
Это полезно для экспериментов с влиянием рефайнера на разных этапах генерации.
12. Forced Overwrite of Generating Width
•Исходное значение: -1
•Описание: принудительно устанавливает ширину генерируемого изображения. Значение -1 отключает эту функцию. Результаты будут хуже для нестандартных размеров, на которых SDXL не обучался.
•На что влияет: позволяет генерировать изображения с нестандартной шириной. Однако, поскольку SDXL обучался на определенных разрешениях, использование произвольных значений может привести к ухудшению качества, появлению артефактов или искажений.
Этот параметр в основном используется для отладки или специфических экспериментов.
13. Forced Overwrite of Generating Height
•Исходное значение: -1
•Описание: принудительно устанавливает высоту генерируемого изображения. Значение -1 отключает эту функцию. Результаты будут хуже для нестандартных размеров, на которых SDXL не обучался.
•На что влияет: аналогично ширине, позволяет генерировать изображения с нестандартной высотой. Использование произвольных значений может негативно сказаться на качестве из-за особенностей обучения SDXL. Также используется для отладки и экспериментов.
14. Forced Overwrite of Denoising Strength of "Vary"
•Исходное значение: -1
•Описание: принудительно устанавливает силу шумоподавления для функции "Vary" (вариации).
•На что влияет: сила шумоподавления определяет, насколько сильно модель будет изменять исходное изображение при создании вариаций.
Более высокие значения приводят к более значительным изменениям и новым интерпретациям, тогда как низкие значения сохраняют больше сходства с оригиналом. Этот параметр позволяет точно контролировать степень вариативности.
15. Forced Overwrite of Denoising Strength of "Upscale"
•Исходное значение: -1
•Описание: принудительно устанавливает силу шумоподавления для функции "Upscale" (увеличение разрешения). Установка отрицательного числа отключает эту функцию. Предназначено для отладки разработчиками.
•На что влияет: сила шумоподавления при апскейле влияет на то, насколько сильно модель будет добавлять новые детали и изменять изображение в процессе увеличения разрешения.
Высокие значения могут привести к более агрессивному добавлению деталей, что иногда может выглядеть неестественно, тогда как низкие значения сохраняют больше оригинальных черт, но могут быть менее детализированными.
Этот параметр позволяет тонко настраивать баланс между сохранением оригинала и добавлением новых деталей при апскейле.
16. Disable preview during generation
•Описание: отключает отображение промежуточного предпросмотра изображения в процессе генерации.
•На что влияет: включение этой опции может немного ускорить процесс генерации, так как системе не нужно тратить ресурсы на постоянное обновление предпросмотра.
Полезно для пакетной генерации или на системах с ограниченными ресурсами.
17. Disable intermediate results during generation, only show final gallery
•Описание: отключает отображение всех промежуточных изображений, показывая только финальные результаты в галерее.
•На что влияет: ускоряет процесс генерации и уменьшает нагрузку на интерфейс, так как не требуется постоянное обновление галереи промежуточными изображениями. Полезно для тех, кто не хочет отвлекаться на процесс и предпочитает видеть только конечный результат.
18. Disable automatic seed increment when image number is > 1
•Описание: отключает автоматическое увеличение значения сида (seed) при генерации нескольких изображений в одной партии. По умолчанию, если генерируется несколько изображений, сид автоматически увеличивается для каждого последующего изображения, чтобы обеспечить разнообразие.
•На что влияет: если эта опция включена, все изображения в партии будут генерироваться с одним и тем же сидом (если он не указан вручную), что приведет к очень похожим или идентичным результатам (если другие параметры не меняются).
Это полезно для тестирования влияния других параметров, когда сид должен оставаться постоянным, или для получения нескольких почти одинаковых изображений.
19. Use black image if NSFW is detected
•Описание: если система обнаруживает контент, классифицированный как NSFW (Not Safe For Work), вместо его отображения будет сгенерировано черное изображение.
•На что влияет: обеспечивает безопасность и соответствие контента, предотвращая генерацию и отображение нежелательных изображений. Полезно для публичных демонстраций или при работе в условиях, где требуется строгий контроль над контентом.
•Save only final enhanced image (дополнительная опция): сохраняет только финальное улучшенное изображение, пропуская сохранение промежуточных версий.
20. Adds parameters to generated images allowing manual regeneration
•Описание: встраивает метаданные о параметрах генерации непосредственно в сгенерированные изображения. Это позволяет легко воспроизвести изображение, загрузив его обратно в Fooocus или другое совместимое ПО.
•Воспроизводимость: ключевая функция для точного воспроизведения ранее сгенерированных изображений с теми же настройками.
•Обмен опытом: упрощает обмен промптами и настройками с другими пользователями, так как вся необходимая информация содержится в самом файле изображения.
Вкладка Control
1. Debug Preprocessors
•Описание: позволяет просматривать результаты работы препроцессоров.
•На что влияет: когда вы используете Image Prompt (например, для ControlNet), Fooocus сначала обрабатывает входное изображение с помощью препроцессоров (например, Canny, Depth, OpenPose и т.д.), чтобы извлечь из него структурную информацию (контуры, глубину, позы и т.д.).
Активация этой опции позволяет увидеть, как именно препроцессор преобразовал ваше изображение, что крайне полезно для отладки и понимания того, почему генерация может выглядеть не так, как ожидалось. Например, если вы используете Canny, вы увидите черно-белое изображение с выделенными контурами.
2. Skip Preprocessors
•Описание: отключает предварительную обработку изображений. (Входные данные уже являются Canny/Depth/Cropped-face/и т.д.)
•На что влияет: эта опция полезна, если вы уже самостоятельно подготовили карты (например, Canny-карты, карты глубины, обрезанные лица и т.д.) и хотите, чтобы Fooocus использовал их напрямую, без дополнительной обработки.
Это может сэкономить время и ресурсы, а также дать вам полный контроль над тем, как структурная информация извлекается из изображений. Если вы загружаете обычное изображение, но включаете эту опцию, результаты могут быть непредсказуемыми, так как модель не получит необходимую структурную информацию.
3. Mixing Image Prompt and Vary/Upscale
•Описание: управляет тем, как Image Prompt взаимодействует с функциями Vary (создание вариаций) и Upscale (увеличение разрешения).
•На что влияет: когда вы используете Image Prompt (например, для сохранения стиля или композиции исходного изображения) и одновременно применяете Vary или Upscale, этот параметр определяет, насколько сильно Image Prompt будет влиять на процесс.
✔Если опция активна, Fooocus будет стараться сохранить элементы из Image Prompt даже при создании вариаций или увеличении разрешения, что может помочь поддерживать консистентность.
❌Если опция отключена, Vary/Upscale могут сильнее отклоняться от исходного Image Prompt.
4. Mixing Image Prompt and Inpaint
•Описание: управляет тем, как Image Prompt взаимодействует с функцией Inpaint (точечное редактирование).
•На что влияет: при использовании Inpaint для изменения определенной части изображения, этот параметр определяет, насколько сильно Image Prompt будет влиять на генерацию внутри маскированной области.
✔Если опция активна, Fooocus будет стараться сохранить стиль или элементы из Image Prompt при заполнении маскированной области, что полезно для поддержания общей гармонии изображения.
❌ Если опция отключена, Inpaint может игнорировать Image Prompt и генерировать контент, который не соответствует стилю исходного изображения.
5. Softness of ControlNet
•Исходное значение: 0.25
•Описание: аналогично режиму Control Mode в Automatic1111. Определяет, насколько сильно ControlNet будет влиять на процесс генерации. Значение 0.0 отключает его.
•На что влияет: ControlNet позволяет управлять генерацией изображения на основе входных изображений (например, позы, контуры, глубина). Параметр Softness определяет степень влияния ControlNet на конечный результат.
•Высокие значения (ближе к 1.0): ControlNet оказывает сильное влияние, и сгенерированное изображение будет очень точно следовать входной карте (например, контурам или позе). Это полезно для точного воспроизведения структуры.
•Низкие значения (ближе к 0.0): влияние ControlNet ослабевает, давая модели больше свободы для креативности и отклонения от входной карты. Это может привести к более разнообразным результатам, но с меньшей точностью соответствия входным данным. Значение 0.0 полностью отключает влияние ControlNet.
Canny — это алгоритм обнаружения краев, который используется для извлечения контуров из входного изображения для ControlNet. Эти параметры позволяют тонко настраивать чувствительность алгоритма.
6. Canny Low Threshold
•Исходное значение: 64
•Описание: нижний порог для алгоритма Canny. Пиксели с градиентом ниже этого порога будут отброшены.
•На что влияет: определяет минимальную интенсивность градиента, которая будет рассматриваться как край. Более низкие значения порога приведут к обнаружению большего количества слабых краев, что может сделать контурную карту более детализированной, но также и более «шумной».
Более высокие значения отфильтруют слабые края, оставив только самые сильные и очевидные контуры.
7. Canny High Threshold
•Исходное значение: 128
•Описание: верхний порог для алгоритма Canny. Пиксели с градиентом выше этого порога будут рассматриваться как сильные края.
•На что влияет: определяет максимальную интенсивность градиента, которая будет рассматриваться как край. Пиксели с градиентом между низким и высоким порогами будут включены в контурную карту только в том случае, если они соединены с сильными краями.
Более высокие значения порога могут привести к более полным и связным контурам, но также могут захватывать больше нежелательных деталей. Более низкие значения сделают контуры более разреженными.
Взаимосвязь Canny Low и High Threshold
Эти два порога работают вместе. Сначала алгоритм Canny находит все потенциальные края. Затем он отфильтровывает те, что ниже низкого порога. Те, что выше высокого порога, считаются сильными краями. Те, что между порогами, включаются, только если они соединены с сильными краями.
Правильная настройка этих порогов критически важна для получения чистой и полезной контурной карты для ControlNet.
Вкладка Inpaint
1. Debug Inpaint Preprocessing
•Описание: позволяет просматривать результаты предварительной обработки изображений для функции Inpaint.
•На что влияет: когда вы используете Inpaint, Fooocus может выполнять внутреннюю предварительную обработку маски или изображения, чтобы оптимизировать процесс редактирования. Активация этой опции позволяет увидеть промежуточные шаги этой обработки.
Это полезно для отладки, если результаты Inpaint не соответствуют ожиданиям, помогая понять, как маска или изображение были интерпретированы моделью перед началом генерации.
2. Debug Enhance Masks (Отладка масок улучшения)
•Описание: показывает маски, используемые функцией Enhance, как в предпросмотре, так и в финальных результатах.
•На что влияет: функция Enhance в Fooocus автоматически определяет области изображения, которые нуждаются в улучшении (например, лица, руки). Эта опция позволяет визуализировать эти автоматически сгенерированные маски. Это помогает понять, какие части изображения Fooocus считает нужным улучшить, и почему.
Если Enhance работает не так, как ожидается, просмотр этих масок может дать ключ к пониманию проблемы.
3. Debug GroundingDINO (Отладка GroundingDINO)
•Описание: использует ограничивающие рамки GroundingDINO вместо более детализированных масок SAM.
•На что влияет: GroundingDINO — это модель, которая обнаруживает объекты на изображении на основе текстового запроса, создавая ограничивающие рамки. SAM (Segment Anything Model) затем может уточнить эти рамки до точных масок сегментации. Включение этой опции отключает использование SAM и показывает только исходные, менее точные рамки GroundingDINO.
Это полезно для отладки, чтобы понять, насколько хорошо GroundingDINO изначально идентифицирует объекты, прежде чем SAM их уточняет. В некоторых редких случаях, когда SAM работает некорректно, использование только рамок GroundingDINO может дать более предсказуемый результат.
4. Disable initial latent in inpaint (Отключить начальный латент в Inpaint)
•Описание: отключает использование начального латентного представления изображения в процессе Inpaint.
•На что влияет: обычно, при Inpaint, модель использует латентное представление исходного изображения (или его части) в качестве отправной точки для генерации внутри маскированной области.
Отключение этой опции означает, что модель будет начинать генерацию с чистого шума внутри маски, игнорируя исходные пиксели. Это может привести к более радикальным изменениям и меньшей привязке к оригинальному содержимому, что полезно, если вы хотите полностью переделать маскированную область, не опираясь на ее исходное состояние.
Однако это также может сделать результат менее согласованным с остальной частью изображения.
5. Inpaint Engine (Движок Inpaint)
•Описание: версия модели Inpaint, используемая Fooocus. Если установлено, рекомендуется использовать режимы качества (Quality) или скорости (Speed) без LoRA для достижения наилучших результатов.
•Варианты: v2.6 (или другие версии, если они доступны).
•На что влияет: выбор версии движка Inpaint влияет на качество и характер изменений, вносимых в изображение. Разные версии могут иметь свои особенности в плане детализации, согласованности с окружающим контекстом и способности обрабатывать сложные маски.
Рекомендация использовать режимы Quality или Speed без LoRA указывает на то, что эти режимы оптимизированы для работы с выбранным движком Inpaint и могут давать наилучшие результаты.
•Описание: аналогично силе шумоподавления в Inpaint в Automatic1111. Используется только для Inpaint, не для Outpaint (Outpaint всегда использует 1.0).
•На что влияет: этот параметр определяет, насколько сильно модель будет изменять маскированную область.
•Значение 1.0 (или близкое к нему): модель будет полностью перерисовывать маскированную область, игнорируя исходные пиксели. Это полезно для удаления объектов или радикальных изменений.
•Значения ниже 1.0 (например, 0.5): модель будет вносить изменения, но сохранять часть исходной информации, что может быть полезно для небольших корректировок или восстановления деталей. Чем ниже значение, тем больше сходства с оригиналом сохраняется.
Для Outpaint (расширения изображения за пределы исходных границ) этот параметр всегда равен 1.0, так как модель всегда генерирует новый контент.
7. Inpaint Respective Field
•Исходное значение: 0.618
•Описание: определяет область, в которой будет происходить Inpaint. Значение 0 соответствует режиму "Only Masked" (Только маскированная область) в Automatic1111. Значение 1 соответствует режиму "Whole Image" (Все изображение) в Automatic1111. Используется только для Inpaint, не для Outpaint (Outpaint всегда использует 1.0).
•На что влияет: этот параметр контролирует, насколько сильно область вокруг маски будет влиять на генерацию внутри маски.
•Значение 0 (Only Masked): изменения будут строго ограничены маскированной областью, и модель будет меньше учитывать окружающий контекст. Это может привести к более резким переходам, но дает полный контроль над маскированной зоной.
•Значение 1 (Whole Image): модель будет учитывать все изображение при генерации внутри маски, что может привести к более плавным и гармоничным изменениям, но с меньшей точностью к маске.
•Промежуточные значения (например, 0.618): обеспечивают баланс между сохранением контекста и точностью маскирования. Значение 0.618 (золотое сечение) часто используется для достижения естественных результатов.
8. Mask Erode or Dilate
•Исходное значение: 0
•Описание: положительное значение увеличит белую область в маске, отрицательное значение уменьшит белую область. (По умолчанию 0, всегда обрабатывается до любого инвертирования маски).
•На что влияет: этот параметр позволяет корректировать размер маски, которую вы загрузили или нарисовали.
•Положительные значения (Dilate): расширяют белую область маски, включая больше пикселей вокруг исходной маски. Это полезно, если вы хотите, чтобы изменения затронули немного большую область, чем исходная маска.
•Отрицательные значения (Erode): сужают белую область маски, исключая пиксели по краям. Это полезно, если вы хотите, чтобы изменения были более точными и не выходили за пределы строго определенной области.
Этот параметр применяется до инвертирования маски, если вы используете эту функцию.
9. GroundingDINO Box Erode or Dilate
•Исходное значение: 0
•Описание: положительное значение увеличит белую область в маске, отрицательное значение уменьшит белую область. (По умолчанию 0, обрабатывается до SAM).
•На что влияет: этот параметр аналогичен предыдущему, но применяется конкретно к ограничивающим рамкам, обнаруженным моделью GroundingDINO, до того, как SAM (Segment Anything Model) уточнит их до точных масок.
•Положительные значения: расширяют рамки GroundingDINO, что может быть полезно, если GroundingDINO изначально обнаружил объект слишком узко.
•Отрицательные значения: сужают рамки GroundingDINO, что может помочь, если GroundingDINO обнаружил слишком большую область.
Корректировка этих рамок может повлиять на то, как SAM будет сегментировать объект, что в конечном итоге повлияет на точность маски Inpaint.
10. Inpaint brush color (Цвет кисти Inpaint)
•Описание: определяет цвет кисти, используемой для рисования масок Inpaint.
•На что влияет: это чисто визуальный параметр, который не влияет на процесс генерации. Он просто изменяет цвет, которым вы рисуете маску в интерфейсе Fooocus, для удобства пользователя.
Вкладка FreeU
Вкладка FreeU в Fooocus предоставляет доступ к экспериментальной, но очень мощной технике, которая позволяет значительно улучшить качество и детализацию сгенерированных изображений, особенно при использовании моделей диффузии.
FreeU (Free Lunch for Diffusion U-Net) — это метод, который оптимизирует архитектуру U-Net (основной компонент диффузионных моделей) без необходимости дополнительного обучения или тонкой настройки модели.
Он работает путем масштабирования определенных слоев в U-Net, что помогает усилить важные функции и подавить шум, приводя к более четким, детализированным и визуально привлекательным результатам.
Ниже представлен подробный разбор каждого из этих параметров и их влияния на генерацию.
Enabled (Включено)
•Описание: переключатель, который активирует или деактивирует применение FreeU к процессу генерации.
•На что влияет: Если эта опция отключена, параметры FreeU не будут применяться, и генерация будет происходить по стандартному алгоритму U-Net. Включение этой опции активирует FreeU, позволяя использовать его для улучшения качества изображения.
Рекомендуется держать эту опцию включенной для большинства сценариев, так как FreeU обычно дает заметное улучшение.
1. B1 (исходное значение 1,01)
•Описание: параметр масштабирования для первого блока (Block 1) в архитектуре U-Net.
•На что влияет: B1 влияет на то, как сильно будут усилены низкочастотные компоненты изображения на ранних этапах генерации. Низкочастотные компоненты отвечают за общую структуру, форму и крупные детали изображения.
Увеличение B1 (выше 1,0) может сделать изображение более структурным и четким, но слишком высокие значения могут привести к артефактам или излишней резкости.
Значение по умолчанию (1.01) является хорошей отправной точкой для большинства изображений.
3. B2 (исходное значение 1,02)
•Описание: параметр масштабирования для второго блока (Block 2) в архитектуре U-Net.
•На что влияет: B2 также влияет на низкочастотные компоненты, но на более поздних этапах, чем B1. Он помогает усилить общую композицию и крупные детали, делая их более выраженными.
Увеличение B2 может улучшить общую согласованность и читаемость изображения. Как и в случае с B1, слишком высокие значения могут вызвать нежелательные эффекты. Значение по умолчанию (1.02) хорошо сбалансировано для большинства сценариев.
4. S1 (исходное значение 0,99)
•Описание: параметр масштабирования для первого слоя (Skip 1) в архитектуре U-Net.
•На что влияет: S1 влияет на высокочастотные компоненты изображения, которые отвечают за мелкие детали, текстуры и шум.
Значения S1 меньше 1.0 (как по умолчанию 0,99) подавляют шум и нежелательные артефакты, делая изображение более чистым и гладким. Уменьшение S1 может привести к более мягким и менее детализированным результатам, в то время как увеличение S1 (ближе к 1.0 или выше) может усилить мелкие детали, но также и шум.
5. S2 (исходное значение 0,95)
•Описание: параметр масштабирования для второго слоя (Skip 2) в архитектуре U-Net.
•На что влияет: S2 также влияет на высокочастотные компоненты, но на более поздних этапах, чем S1. Он помогает подавить шум и улучшить детализацию на более тонком уровне.
Уменьшение S2 (как по умолчанию 0.95) способствует более эффективному шумоподавлению и сглаживанию, что приводит к более чистому изображению.
Эксперименты с S2 могут помочь найти оптимальный баланс между детализацией и чистотой изображения.
Заключение
Настройки вкладки Advanced и Developer Debug Mode в Fooocus предоставляют мощные инструменты для тех, кто хочет выйти за рамки базовой генерации изображений.
От тонкой настройки резкости и влияния промпта до интеллектуального расширения стилей и инструментов отладки — эти функции позволяют добиться беспрецедентного контроля над творческим процессом.
Освоив их, вы сможете создавать еще более уникальные и высококачественные изображения, полностью раскрывая потенциал Fooocus.
Ну а мы напоминаем, что если у вас возникли маркетинговые проблемы, мешающие вашему бизнесу развиваться, то команда Рокет Пони всегда к вашим услугам. Вы можете связаться с нами любым удобным способом: