Tensor Banana
رفتن به کانال در Telegram
Нейросети и всё такое. https://youtube.com/@tensorbanana Чат по нейронкам: https://t.me/+zFDiHuL1iVA1YWMy Чат с ботами: https://t.me/+m2TQ5VJLhIRiY2U6 Написать админу и донаты: @talkllamabot
نمایش بیشتر2 949
مشترکین
اطلاعاتی وجود ندارد24 ساعت
+67 روز
+530 روز
در حال بارگیری داده...
کانالهای مشابه
ابر برچسبها
اشارات ورودی و خروجی
---
---
---
---
---
---
جذب مشترکین
ژوئن '26
ژوئن '26
+32
در 1 کانالها
مه '26
+29
در 0 کانالها
Get PRO
آوریل '26
+30
در 1 کانالها
Get PRO
مارس '26
+35
در 0 کانالها
Get PRO
فوریه '26
+55
در 0 کانالها
Get PRO
ژانویه '26
+80
در 4 کانالها
Get PRO
دسامبر '25
+71
در 0 کانالها
Get PRO
نوامبر '25
+84
در 3 کانالها
Get PRO
اکتبر '25
+68
در 1 کانالها
Get PRO
سپتامبر '25
+90
در 3 کانالها
Get PRO
اوت '25
+78
در 5 کانالها
Get PRO
ژوئیه '25
+112
در 3 کانالها
Get PRO
ژوئن '25
+114
در 3 کانالها
Get PRO
مه '25
+112
در 2 کانالها
Get PRO
آوریل '25
+105
در 3 کانالها
Get PRO
مارس '25
+97
در 4 کانالها
Get PRO
فوریه '25
+120
در 3 کانالها
Get PRO
ژانویه '25
+280
در 8 کانالها
Get PRO
دسامبر '24
+75
در 3 کانالها
Get PRO
نوامبر '24
+87
در 3 کانالها
Get PRO
اکتبر '24
+79
در 4 کانالها
Get PRO
سپتامبر '24
+77
در 0 کانالها
Get PRO
اوت '24
+99
در 3 کانالها
Get PRO
ژوئیه '24
+74
در 2 کانالها
Get PRO
ژوئن '24
+1 504
در 4 کانالها
Get PRO
مه '240
در 4 کانالها
Get PRO
آوریل '240
در 3 کانالها
Get PRO
مارس '24
+27
در 0 کانالها
Get PRO
فوریه '240
در 0 کانالها
Get PRO
ژانویه '24
+35
در 0 کانالها
| تاریخ | رشد مشترکین | اشارات | کانالها | |
| 28 ژوئن | +1 | |||
| 27 ژوئن | 0 | |||
| 26 ژوئن | 0 | |||
| 25 ژوئن | +1 | |||
| 24 ژوئن | +1 | |||
| 23 ژوئن | +1 | |||
| 22 ژوئن | +3 | |||
| 21 ژوئن | +4 | |||
| 20 ژوئن | +3 | |||
| 19 ژوئن | +1 | |||
| 18 ژوئن | +2 | |||
| 17 ژوئن | 0 | |||
| 16 ژوئن | +3 | |||
| 15 ژوئن | +2 | |||
| 14 ژوئن | 0 | |||
| 13 ژوئن | +1 | |||
| 12 ژوئن | 0 | |||
| 11 ژوئن | 0 | |||
| 10 ژوئن | +2 | |||
| 09 ژوئن | +4 | |||
| 08 ژوئن | +1 | |||
| 07 ژوئن | 0 | |||
| 06 ژوئن | 0 | |||
| 05 ژوئن | 0 | |||
| 04 ژوئن | 0 | |||
| 03 ژوئن | +1 | |||
| 02 ژوئن | 0 | |||
| 01 ژوئن | +1 |
پستهای کانال
+5
Ideogram 4 img2img редактирование через inpaint по SAM2 маске и частичным denoise
- можно точно сохранить лицо при редактировании
- изменить только указанный объект, например лицо, фон или текст на бумажке благодаря маскам
- не надо самому выделять маски, маска задается через простой промпт типа "face,hair" или "background"
- запрос на описание картинки и составление json промпта уходит через любой API, например llama.cpp server или openai\mistral\openrouter
- я для составления json промпта юзаю gemma4-31 которая висит на второй видюхе (2080ti-22GB), можно также юзать qwen.
- clip у меня висит на третьей видюхе (3060), для скорости, но это не обязательно
- скорость выполнения запроса вместе с составлением json промпта - 2 минуты на стэке из трех карт (3090+2080ti+3060). Можно все организовать на одой карте, но тогда промпт будет писать какая-то онлайн LLM по апи. Юзеры писали, что в теории, одной 3060 должно хватить
- без частичного denoise (0.90) результаты были хуже, с ним модель знает в каком месте находится тело персонажа.
- img2img работает с помощью описания исходной картинки в json. Описание делается с помощью моей ноды OpenAI.CaptionImage. На момент написания я не видел похожих нод с поддержкой llama.cpp server, поэтому написал свою.
- не все генерации выходят идеальными, надо точно подбирать нужный denoise. чтобы и исходная картинка не слишком сильно вылазила.
- сильно менять позу персонажа не получится, но легкие движения рук - ног возможны. Изменение стиля всей картинки не получится, маска не даст изменить некоторые области. но можно совсем убрать маску и работать только с img2img (без sam2 и без inpaint), воркфлоу тут же.
мой воркфлоу img2img inpaint+sam2+denoise:
https://github.com/Mozer/comfy_stuff/blob/main/workflows/ideogram4_img2img_sam_with_denoise.json
мой воркфлоу img2img+denoise (без масок sam2):
https://github.com/Mozer/comfy_stuff/blob/main/workflows/ideogram4_img2img_without_sam2.json
int8 nodes
https://github.com/BobJohnson24/ComfyUI-INT8-Fast
int8 models
https://huggingface.co/bertbobson/Ideogram-4-INT8-ConvRot/tree/main
kj prompt builder
https://github.com/kijai/ComfyUI-KJNodes
sam2
https://github.com/neverbiasu/ComfyUI-SAM2
clip to another cuda
https://gist.github.com/city96/30743dfdfe129b331b5676a79c3a8a39
моя нода OpenAI.CaptionImage для llama.cpp server
https://github.com/Mozer/ComfyUI-OpenAI
| 2 | ComfyUI-PixelDriftFix
Написал комфи ноду для устранения pixel drift (смещения и небольшого кропа отредактированной после img2img картинки)
Работает для любых AI моделей редактирования (klein, qwen-edit, flux2-dev, ...)
Решает проблему сдвига, растягивания и обрезки пикселей после редактирования относительно оригинальной картинки. Нода автоматически выравнивает финальное изображение по исходнику, возвращая ему идеальную геометрию.
Есть 2 режима, основной flat_4_points и экспериментальный mesh, но он еще не доведен до ума.
* Режим flat_4_points: базовый, быстрый, работает по 4-м точкам (всего ~4 секунды на обработку).
* Режим mesh: экспериментальный, на основе сотек и тысяч точек. (работает медленно и пока что неточно, не рекомендую).
* Реставрация: отлично подходит для восстановления старых фотографий с последующим блендом с оригиналом
Нюансы:
* Выходной размер картинки автоматически подгоняется под оригинал.
* Исходное и измененное изображения должны быть похожи (минимум 10 общих точек).
* По краям кадра может появляться небольшая полоса дублированных пикселей, которых просто не было в отредактированной картинке из-за кропа.
Как установить:
ComfyUI Manager - install via git url.
Воркфлоу в папке workflows
+ там уже лежит связка klein-9b + pixel_drift_fix + blend_with_original для реставрации старых\смазанных\шакальных фото
https://github.com/Mozer/ComfyUI-PixelDriftFix | 1 807 |
| 3 | Talk-llama-fast 2 - перезапуск на питоне
Я начал переносить свой проект говорящего аватара с C++ на питон.
Сборка на видео:
- Whisper.cpp streaming, large-q4
- llama.cpp server
- gemma4-31b-q4
- omnivoice TTS + omnivoice-server
- основное приложение на питоне.
- wav2lip липсинк (пока нету).
- Всё это влазит на одну 3090.
- Текущая задержка от голоса до голоса - 4 секунды, возможно, удастся сократить до 3-х. На 5000 серии будет быстрее.
- ГУЙ пока не планируется, ставка на голосовое общение, но ввод с клавиатуры тоже есть.
- Можно поставить любую ЛЛМ, хоть локальную, хоть Claude Opus.
Всё будет в опенсорсе, как и раньше. Выкладывать буду модулями.
Сегодня выкладываю модуль whisper.cpp-streaming. До этого я быстро пробежался по конкурентам типа whisperX, faster whisper и t-one ASR. У всех есть свои плюсы, но я решил пока остаться на проверенном ранее решении. Меня оно устраивает по скорости и жрёт менее 1 гига VRAM. Чистая задержка без VAD - 300мс, вместе с vad - 700мс на коротких фразах.
Код и exe для whisper-streaming CUDA. Для других платформ - сами скомпилируете.
https://github.com/Mozer/whisper.cpp-streaming/releases/tag/0.0.1
Уже пару недель играюсь с голосовым ассистентом на gemma4-31b-q5, у нее очень классный русский язык, знает современный сленг. Цепляю беспроводные наушники, хожу по квартире, занимаюсь своими делами и болтаю о чем угодно. Качество распознавания меня устраивает.
Следующим модулем выложу свою чуть модифицированную версию omnivoice. У меня на 3090 задержка - 1с. Юзеры в чате с 5000 серией говорят, что у них задержка до 0.5с | 1 883 |
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
