fa
Feedback
Tensor Banana

Tensor Banana

رفتن به کانال در Telegram

Нейросети и всё такое. https://youtube.com/@tensorbanana Чат по нейронкам: https://t.me/+zFDiHuL1iVA1YWMy Чат с ботами: https://t.me/+m2TQ5VJLhIRiY2U6 Написать админу и донаты: @talkllamabot

نمایش بیشتر
2 949
مشترکین
اطلاعاتی وجود ندارد24 ساعت
+67 روز
+530 روز

در حال بارگیری داده...

جذب مشترکین
ژوئن '26
ژوئن '26
+32
در 1 کانال‌ها
مه '26
+29
در 0 کانال‌ها
Get PRO
آوریل '26
+30
در 1 کانال‌ها
Get PRO
مارس '26
+35
در 0 کانال‌ها
Get PRO
فوریه '26
+55
در 0 کانال‌ها
Get PRO
ژانویه '26
+80
در 4 کانال‌ها
Get PRO
دسامبر '25
+71
در 0 کانال‌ها
Get PRO
نوامبر '25
+84
در 3 کانال‌ها
Get PRO
اکتبر '25
+68
در 1 کانال‌ها
Get PRO
سپتامبر '25
+90
در 3 کانال‌ها
Get PRO
اوت '25
+78
در 5 کانال‌ها
Get PRO
ژوئیه '25
+112
در 3 کانال‌ها
Get PRO
ژوئن '25
+114
در 3 کانال‌ها
Get PRO
مه '25
+112
در 2 کانال‌ها
Get PRO
آوریل '25
+105
در 3 کانال‌ها
Get PRO
مارس '25
+97
در 4 کانال‌ها
Get PRO
فوریه '25
+120
در 3 کانال‌ها
Get PRO
ژانویه '25
+280
در 8 کانال‌ها
Get PRO
دسامبر '24
+75
در 3 کانال‌ها
Get PRO
نوامبر '24
+87
در 3 کانال‌ها
Get PRO
اکتبر '24
+79
در 4 کانال‌ها
Get PRO
سپتامبر '24
+77
در 0 کانال‌ها
Get PRO
اوت '24
+99
در 3 کانال‌ها
Get PRO
ژوئیه '24
+74
در 2 کانال‌ها
Get PRO
ژوئن '24
+1 504
در 4 کانال‌ها
Get PRO
مه '240
در 4 کانال‌ها
Get PRO
آوریل '240
در 3 کانال‌ها
Get PRO
مارس '24
+27
در 0 کانال‌ها
Get PRO
فوریه '240
در 0 کانال‌ها
Get PRO
ژانویه '24
+35
در 0 کانال‌ها
تاریخ
رشد مشترکین
اشارات
کانال‌ها
28 ژوئن+1
27 ژوئن0
26 ژوئن0
25 ژوئن+1
24 ژوئن+1
23 ژوئن+1
22 ژوئن+3
21 ژوئن+4
20 ژوئن+3
19 ژوئن+1
18 ژوئن+2
17 ژوئن0
16 ژوئن+3
15 ژوئن+2
14 ژوئن0
13 ژوئن+1
12 ژوئن0
11 ژوئن0
10 ژوئن+2
09 ژوئن+4
08 ژوئن+1
07 ژوئن0
06 ژوئن0
05 ژوئن0
04 ژوئن0
03 ژوئن+1
02 ژوئن0
01 ژوئن+1
پست‌های کانال
Ideogram 4 img2img редактирование через inpaint по SAM2 маске и частичным denoise - можно точно сохранить лицо при редактиров
+5
Ideogram 4 img2img редактирование через inpaint по SAM2 маске и частичным denoise - можно точно сохранить лицо при редактировании - изменить только указанный объект, например лицо, фон или текст на бумажке благодаря маскам - не надо самому выделять маски, маска задается через простой промпт типа "face,hair" или "background" - запрос на описание картинки и составление json промпта уходит через любой API, например llama.cpp server или openai\mistral\openrouter - я для составления json промпта юзаю gemma4-31 которая висит на второй видюхе (2080ti-22GB), можно также юзать qwen. - clip у меня висит на третьей видюхе (3060), для скорости, но это не обязательно - скорость выполнения запроса вместе с составлением json промпта - 2 минуты на стэке из трех карт (3090+2080ti+3060). Можно все организовать на одой карте, но тогда промпт будет писать какая-то онлайн LLM по апи. Юзеры писали, что в теории, одной 3060 должно хватить - без частичного denoise (0.90) результаты были хуже, с ним модель знает в каком месте находится тело персонажа. - img2img работает с помощью описания исходной картинки в json. Описание делается с помощью моей ноды OpenAI.CaptionImage. На момент написания я не видел похожих нод с поддержкой llama.cpp server, поэтому написал свою. - не все генерации выходят идеальными, надо точно подбирать нужный denoise. чтобы и исходная картинка не слишком сильно вылазила. - сильно менять позу персонажа не получится, но легкие движения рук - ног возможны. Изменение стиля всей картинки не получится, маска не даст изменить некоторые области. но можно совсем убрать маску и работать только с img2img (без sam2 и без inpaint), воркфлоу тут же. мой воркфлоу img2img inpaint+sam2+denoise: https://github.com/Mozer/comfy_stuff/blob/main/workflows/ideogram4_img2img_sam_with_denoise.json мой воркфлоу img2img+denoise (без масок sam2): https://github.com/Mozer/comfy_stuff/blob/main/workflows/ideogram4_img2img_without_sam2.json int8 nodes https://github.com/BobJohnson24/ComfyUI-INT8-Fast int8 models https://huggingface.co/bertbobson/Ideogram-4-INT8-ConvRot/tree/main kj prompt builder https://github.com/kijai/ComfyUI-KJNodes sam2 https://github.com/neverbiasu/ComfyUI-SAM2 clip to another cuda https://gist.github.com/city96/30743dfdfe129b331b5676a79c3a8a39 моя нода OpenAI.CaptionImage для llama.cpp server https://github.com/Mozer/ComfyUI-OpenAI

2
ComfyUI-PixelDriftFix Написал комфи ноду для устранения pixel drift (смещения и небольшого кропа отредактированной после img2
ComfyUI-PixelDriftFix Написал комфи ноду для устранения pixel drift (смещения и небольшого кропа отредактированной после img2img картинки) Работает для любых AI моделей редактирования (klein, qwen-edit, flux2-dev, ...) Решает проблему сдвига, растягивания и обрезки пикселей после редактирования относительно оригинальной картинки. Нода автоматически выравнивает финальное изображение по исходнику, возвращая ему идеальную геометрию. Есть 2 режима, основной flat_4_points и экспериментальный mesh, но он еще не доведен до ума. * Режим flat_4_points: базовый, быстрый, работает по 4-м точкам (всего ~4 секунды на обработку). * Режим mesh: экспериментальный, на основе сотек и тысяч точек. (работает медленно и пока что неточно, не рекомендую). * Реставрация: отлично подходит для восстановления старых фотографий с последующим блендом с оригиналом Нюансы: * Выходной размер картинки автоматически подгоняется под оригинал. * Исходное и измененное изображения должны быть похожи (минимум 10 общих точек). * По краям кадра может появляться небольшая полоса дублированных пикселей, которых просто не было в отредактированной картинке из-за кропа. Как установить: ComfyUI Manager - install via git url. Воркфлоу в папке workflows + там уже лежит связка klein-9b + pixel_drift_fix + blend_with_original для реставрации старых\смазанных\шакальных фото https://github.com/Mozer/ComfyUI-PixelDriftFix
1 807
3
Talk-llama-fast 2 - перезапуск на питоне Я начал переносить свой проект говорящего аватара с C++ на питон. Сборка на видео: -
Talk-llama-fast 2 - перезапуск на питоне Я начал переносить свой проект говорящего аватара с C++ на питон. Сборка на видео: - Whisper.cpp streaming, large-q4 - llama.cpp server - gemma4-31b-q4 - omnivoice TTS + omnivoice-server - основное приложение на питоне. - wav2lip липсинк (пока нету). - Всё это влазит на одну 3090. - Текущая задержка от голоса до голоса - 4 секунды, возможно, удастся сократить до 3-х. На 5000 серии будет быстрее. - ГУЙ пока не планируется, ставка на голосовое общение, но ввод с клавиатуры тоже есть. - Можно поставить любую ЛЛМ, хоть локальную, хоть Claude Opus. Всё будет в опенсорсе, как и раньше. Выкладывать буду модулями. Сегодня выкладываю модуль whisper.cpp-streaming. До этого я быстро пробежался по конкурентам типа whisperX, faster whisper и t-one ASR. У всех есть свои плюсы, но я решил пока остаться на проверенном ранее решении. Меня оно устраивает по скорости и жрёт менее 1 гига VRAM. Чистая задержка без VAD - 300мс, вместе с vad - 700мс на коротких фразах. Код и exe для whisper-streaming CUDA. Для других платформ - сами скомпилируете. https://github.com/Mozer/whisper.cpp-streaming/releases/tag/0.0.1 Уже пару недель играюсь с голосовым ассистентом на gemma4-31b-q5, у нее очень классный русский язык, знает современный сленг. Цепляю беспроводные наушники, хожу по квартире, занимаюсь своими делами и болтаю о чем угодно. Качество распознавания меня устраивает. Следующим модулем выложу свою чуть модифицированную версию omnivoice. У меня на 3090 задержка - 1с. Юзеры в чате с 5000 серией говорят, что у них задержка до 0.5с
1 883