whargarbl
Data loading in progress...
Find out who reads your channel
This graph will show you who besides your subscribers reads your channel and learn about other sources of traffic.Posts | Views | Shares | Views dynamics |
01 И еще один большой файнтюн на финальных степах, на этот раз нормальный, но к сожалению аниме и для стейбл каскады, от https://disty.xyz/
Я про него писал - чувак обучает на нескольких лямах картинок на куске картофеля (16Гб)
Базовый трейн прокрутил на 1e-5, что на мой взгляд тоже дофига - на как я понял теперь он планирует гонять с меньшим lr
Промежуточные CP выкладывает тут https://huggingface.co/Disty0
Подход очень импонирует - выдрочил датасет в отличие от предыдущего оратора кот с удивлением обнаружил что если накачать рандомного порно там могут быть скриншоты с видео
Обратите внимание какие ровные струны на гитаре | 44 | 1 | Loading... |
02 Уии, котик вогнал 20 эпох фулл файнтюна на 1.5 млн датасет. Редко рассказывают о таком опыте.
На реддит подробно описал гиперпараметры и процесс
https://www.reddit.com/r/StableDiffusion/comments/1dbasvx/the_gory_details_of_finetuning_sdxl_for_30m/
Он пытался сделать nsfw модель по типу пони но с уклоном в фотореализм
Результат
https://civitai.com/models/502468/bigasp-v1
Потратил 3.5к долларов, файнтюнил на 8 H100(всё нормально - деньги есть). Заняло 5 дней
Преподносит как историю успеха
В глаза бросается конский LR ( 1e-4 - это же не Лора! Господи… откуда вас берут таких) и небольшое количество эпох (20, Карл - но он почему то думает что большое)
Я конечно же не буду писать что у него получилось мутное недотренированное говно, так как благодарен за то что человек написал подробно как он обосрался (хотя он так и не думает) | 62 | 3 | Loading... |
03 Qwen 2 вышел
В отличие от лам не енглишь фёст, мультиязычные
Я щупал предыдущие и они были неплохие, просто не такие распиаренные как лама мистраль фи
По бенчам в районе ламы 3 или даже выше
https://t.me/gonzo_ML/2736 | 92 | 2 | Loading... |
04 спокойной ночи! | 103 | 1 | Loading... |
05 "Comfy Dreams" by @Jas | 113 | 0 | Loading... |
06 Nomic релизнул мультимодальные эмбединги для текста/картинок
https://blog.nomic.ai/posts/nomic-embed-vision
Крошечная моделька по тестам аутперфомит CLIP, который ViT B/16
Лицензия так себе - со временем обещают апаче, вобщем небольшая моделька кот можно заюзать для например «найти всех милых животных в датасете». Было бы вдвойне интересней если б онс клипом совместима была на уровне ембедингов - но тут уж врятли.
Вобщем хз , не знаю зачем я написал про них. Вдруг пригодится, наверное | 118 | 3 | Loading... |
07 Запустили тест инференса Colorful здесь
https://discord.gg/HpeGYm9Xae
Сейчас там бот молотит промпты чуть позже можно будет задать ему свой промпт пощупать
Также там есть лама3 бот и всякие другие передовые штуки кот мы в этом дискорде обкатываем
Вобщем не стесняйтесь, заходите если что | 113 | 1 | Loading... |
08 Toxic Russian propaganda
https://www.reddit.com/r/StableDiffusion/comments/1d8mcma/i_love_sdxl_toxic_russian_propaganda/
пойду реддитовских затролю | 115 | 2 | Loading... |
09 Утром завершился трейн ColorfulXL и это полный пиздец. Простите, SOTA
Такого уровня детализации/текстур/аестетик я не вижу «даже» в грядущем SD3. С рендерингом текстов, правда, провал
Если лайт версия оказалась лучшей то эта я даже не знаю.. Пиздочевскей?
Пока не публикую, мб в этот раз удастся распорядиться с умом. Не переживайте, даже если она не будет публичной я что то придумаю «для своих»
Самое смешное что в моем инновационном подходе к фулл файнтюну - ноль инноваций.
«Нормально делай - нормально будет» | 120 | 4 | Loading... |
10 Зохвачено! | 121 | 1 | Loading... |
11 Серебро!
https://huggingface.co/spaces/fal-ai/imgsys | 132 | 0 | Loading... |
12 Сиранная магия!
Про Omost обязательно напишу когда освободится GPU никогда и появится время никогда пощупать
https://github.com/lllyasviel/Omost
Возможно уболтаю одного француза поднять ботом в дискорд
Пока можно страдать тут https://huggingface.co/spaces/lllyasviel/Omost | 128 | 2 | Loading... |
13 SD3 (2B) обещают через 10 дней, судя по струнам/рукам - недофайнтюнена. Результат всё равно офигенный уже сейчас. Интересно какая будет лицензия | 122 | 0 | Loading... |
14 Вывел на арену ( https://huggingface.co/spaces/fal-ai/imgsys ) свою младшую Lightning модельку
Image Arena работает по тому же принципу что и чатбот арена. Люди выбирают вслепую из 2 генераций лучшую
Надеюсь на топ-3, кек (модель не отображается в рейтинге пока не наберет стат значимое колво показов)
Текущему лидеру - RealVisXL V4.0 -вроде не уступает
Трейн - который катался все выходные - я отменил. Модель стала слишком реалистичной - а в США сейчас выборы (лол, я прост хочу сохранить аестетик, есть идея как сделать трей менее «переобучаемым» - хочу попробовать) | 120 | 0 | Loading... |
15 Учим стейбл диффужен писать фразу «Everybody needs a heero». Эпоха 1,2,3,4 соотвественно | 185 | 2 | Loading... |
16 я к вам опять с плохими новостями
Оказывается емад еще месяц назад писал что лицензия на sd3 будет такая же как на SC
https://www.reddit.com/r/StableDiffusion/comments/1c6awnl/comment/l00la38/
Те - для некоммерческого использования.
Картинку тут спер
https://www.reddit.com/r/StableDiffusion/comments/1d37bvd/the_sd_community_awaits_weights/
Меж тем для SDXL пошли как грибы после дождя хорошие модели
Dream Diffusion - отличный промпт фоллоу - абилки генерить текст https://civitai.com/models/452950/dream-diffusion-sd3-likeness-by-dice
Boltning - неплохой контраст, цвета, довольно четкая https://civitai.com/models/413466/boltning-realistic-lightning-hyper
Авторы протеус обещают выложить свой трейн на 10млн
Автор пони устал ждать - запускает на скольких то десятках лямов тоже, мб в этот раз разметит нормально
Другими словами нет никаких архитектурных ограничений получить sd3 на sdxl | 160 | 4 | Loading... |
17 с текстом повеселей стала модель | 148 | 1 | Loading... |
18 Очередной Трейн Пост
colorfulxl v 42 (юбилей)
добавил всего сотню постеров и сотню кадров из фильмов
Приятно улучшился стиль и немного лучше стал текст.
Пистолетики/сабельки/эпичненькость
Текстенкодер также подрюнькал немношк
civit
https://civitai.com/models/185258/colorfulxl
reddit
https://www.reddit.com/r/StableDiffusion/comments/1d38q2v/colorfulxl_v42/
(трейн запускал ночью пьянный вхлам, и ничего!) | 160 | 0 | Loading... |
Ну и давненько про новые LLM не писали, а сегодня как раз вышла Qwen2 от Alibaba Cloud
https://qwenlm.github.io/blog/qwen2/5 моделей: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, Qwen2-72B, обычные и instruction-tuned. Контекст до 128k. На бенчмарках выглядит красиво и бьёт Llama 3. В дополнение к английскому и китайскому поддерживает ещё 27 языков. Лицензия Apache 2.0 для всех кроме самой большой, у той прежняя Qianwen License. В будущем обещают мультимодальность с видео и аудио.
Nomic expands the capabilities of Nomic Embed to include vision.
Check out the UltimateDiffusionXL community on Discord - hang out with 96 other members and enjoy free voice and text chat.
Explore this post and more from the StableDiffusion community