Tensor Banana

رفتن به کانال در Telegram

Нейросети и всё такое. https://youtube.com/@tensorbanana Чат по нейронкам: https://t.me/+zFDiHuL1iVA1YWMy Чат с ботами: https://t.me/+m2TQ5VJLhIRiY2U6 Написать админу и донаты: @talkllamabot

نمایش بیشتر

روسيا166 374 فناوری و برنامه‌ها25 547

2 949

مشترکین

اطلاعاتی وجود ندارد24 ساعت

+67 روز

+530 روز

1 842

نمایش های پست

~ 85524 ساعت

~ 1 12948 ساعت

62.46%

نرخ مشارکت

اطلاعاتی وجود ندارد

پست های در روز

Ads index

beta

در حال بارگیری داده...

کانال‌های مشابه

کانال‌های بیشتر

اشارات ورودی و خروجی

---

جذب مشترکین

ژوئن '26

+32

در 1 کانال‌ها

مه '26

+29

در 0 کانال‌ها

Get PRO

آوریل '26

+30

در 1 کانال‌ها

Get PRO

مارس '26

+35

در 0 کانال‌ها

Get PRO

فوریه '26

+55

در 0 کانال‌ها

Get PRO

ژانویه '26

+80

در 4 کانال‌ها

Get PRO

دسامبر '25

+71

در 0 کانال‌ها

Get PRO

نوامبر '25

+84

در 3 کانال‌ها

Get PRO

اکتبر '25

+68

در 1 کانال‌ها

Get PRO

سپتامبر '25

+90

در 3 کانال‌ها

Get PRO

اوت '25

+78

در 5 کانال‌ها

Get PRO

ژوئیه '25

+112

در 3 کانال‌ها

Get PRO

ژوئن '25

+114

در 3 کانال‌ها

Get PRO

مه '25

+112

در 2 کانال‌ها

Get PRO

آوریل '25

+105

در 3 کانال‌ها

Get PRO

مارس '25

+97

در 4 کانال‌ها

Get PRO

فوریه '25

+120

در 3 کانال‌ها

Get PRO

ژانویه '25

+280

در 8 کانال‌ها

Get PRO

دسامبر '24

+75

در 3 کانال‌ها

Get PRO

نوامبر '24

+87

در 3 کانال‌ها

Get PRO

اکتبر '24

+79

در 4 کانال‌ها

Get PRO

سپتامبر '24

+77

در 0 کانال‌ها

Get PRO

اوت '24

+99

در 3 کانال‌ها

Get PRO

ژوئیه '24

+74

در 2 کانال‌ها

Get PRO

ژوئن '24

+1 504

در 4 کانال‌ها

Get PRO

مه '240

در 4 کانال‌ها

Get PRO

آوریل '240

در 3 کانال‌ها

Get PRO

مارس '24

+27

در 0 کانال‌ها

Get PRO

فوریه '240

در 0 کانال‌ها

Get PRO

ژانویه '24

+35

در 0 کانال‌ها

تاریخ	رشد مشترکین	اشارات	کانال‌ها
28 ژوئن	+1
27 ژوئن	0
26 ژوئن	0
25 ژوئن	+1
24 ژوئن	+1
23 ژوئن	+1
22 ژوئن	+3
21 ژوئن	+4
20 ژوئن	+3
19 ژوئن	+1
18 ژوئن	+2
17 ژوئن	0
16 ژوئن	+3
15 ژوئن	+2
14 ژوئن	0
13 ژوئن	+1
12 ژوئن	0
11 ژوئن	0
10 ژوئن	+2
09 ژوئن	+4
08 ژوئن	+1
07 ژوئن	0
06 ژوئن	0
05 ژوئن	0
04 ژوئن	0
03 ژوئن	+1
02 ژوئن	0
01 ژوئن	+1

پست‌های کانال

Ideogram 4 img2img редактирование через inpaint по SAM2 маске и частичным denoise - можно точно сохранить лицо при редактировании - изменить только указанный объект, например лицо, фон или текст на бумажке благодаря маскам - не надо самому выделять маски, маска задается через простой промпт типа "face,hair" или "background" - запрос на описание картинки и составление json промпта уходит через любой API, например llama.cpp server или openai\mistral\openrouter - я для составления json промпта юзаю gemma4-31 которая висит на второй видюхе (2080ti-22GB), можно также юзать qwen. - clip у меня висит на третьей видюхе (3060), для скорости, но это не обязательно - скорость выполнения запроса вместе с составлением json промпта - 2 минуты на стэке из трех карт (3090+2080ti+3060). Можно все организовать на одой карте, но тогда промпт будет писать какая-то онлайн LLM по апи. Юзеры писали, что в теории, одной 3060 должно хватить - без частичного denoise (0.90) результаты были хуже, с ним модель знает в каком месте находится тело персонажа. - img2img работает с помощью описания исходной картинки в json. Описание делается с помощью моей ноды OpenAI.CaptionImage. На момент написания я не видел похожих нод с поддержкой llama.cpp server, поэтому написал свою. - не все генерации выходят идеальными, надо точно подбирать нужный denoise. чтобы и исходная картинка не слишком сильно вылазила. - сильно менять позу персонажа не получится, но легкие движения рук - ног возможны. Изменение стиля всей картинки не получится, маска не даст изменить некоторые области. но можно совсем убрать маску и работать только с img2img (без sam2 и без inpaint), воркфлоу тут же. мой воркфлоу img2img inpaint+sam2+denoise: https://github.com/Mozer/comfy_stuff/blob/main/workflows/ideogram4_img2img_sam_with_denoise.json мой воркфлоу img2img+denoise (без масок sam2): https://github.com/Mozer/comfy_stuff/blob/main/workflows/ideogram4_img2img_without_sam2.json int8 nodes https://github.com/BobJohnson24/ComfyUI-INT8-Fast int8 models https://huggingface.co/bertbobson/Ideogram-4-INT8-ConvRot/tree/main kj prompt builder https://github.com/kijai/ComfyUI-KJNodes sam2 https://github.com/neverbiasu/ComfyUI-SAM2 clip to another cuda https://gist.github.com/city96/30743dfdfe129b331b5676a79c3a8a39 моя нода OpenAI.CaptionImage для llama.cpp server https://github.com/Mozer/ComfyUI-OpenAI

2	ComfyUI-PixelDriftFix Написал комфи ноду для устранения pixel drift (смещения и небольшого кропа отредактированной после img2img картинки) Работает для любых AI моделей редактирования (klein, qwen-edit, flux2-dev, ...) Решает проблему сдвига, растягивания и обрезки пикселей после редактирования относительно оригинальной картинки. Нода автоматически выравнивает финальное изображение по исходнику, возвращая ему идеальную геометрию. Есть 2 режима, основной flat_4_points и экспериментальный mesh, но он еще не доведен до ума. * Режим flat_4_points: базовый, быстрый, работает по 4-м точкам (всего ~4 секунды на обработку). * Режим mesh: экспериментальный, на основе сотек и тысяч точек. (работает медленно и пока что неточно, не рекомендую). * Реставрация: отлично подходит для восстановления старых фотографий с последующим блендом с оригиналом Нюансы: * Выходной размер картинки автоматически подгоняется под оригинал. * Исходное и измененное изображения должны быть похожи (минимум 10 общих точек). * По краям кадра может появляться небольшая полоса дублированных пикселей, которых просто не было в отредактированной картинке из-за кропа. Как установить: ComfyUI Manager - install via git url. Воркфлоу в папке workflows + там уже лежит связка klein-9b + pixel_drift_fix + blend_with_original для реставрации старых\смазанных\шакальных фото https://github.com/Mozer/ComfyUI-PixelDriftFix	1 807
3	Talk-llama-fast 2 - перезапуск на питоне Я начал переносить свой проект говорящего аватара с C++ на питон. Сборка на видео: - Whisper.cpp streaming, large-q4 - llama.cpp server - gemma4-31b-q4 - omnivoice TTS + omnivoice-server - основное приложение на питоне. - wav2lip липсинк (пока нету). - Всё это влазит на одну 3090. - Текущая задержка от голоса до голоса - 4 секунды, возможно, удастся сократить до 3-х. На 5000 серии будет быстрее. - ГУЙ пока не планируется, ставка на голосовое общение, но ввод с клавиатуры тоже есть. - Можно поставить любую ЛЛМ, хоть локальную, хоть Claude Opus. Всё будет в опенсорсе, как и раньше. Выкладывать буду модулями. Сегодня выкладываю модуль whisper.cpp-streaming. До этого я быстро пробежался по конкурентам типа whisperX, faster whisper и t-one ASR. У всех есть свои плюсы, но я решил пока остаться на проверенном ранее решении. Меня оно устраивает по скорости и жрёт менее 1 гига VRAM. Чистая задержка без VAD - 300мс, вместе с vad - 700мс на коротких фразах. Код и exe для whisper-streaming CUDA. Для других платформ - сами скомпилируете. https://github.com/Mozer/whisper.cpp-streaming/releases/tag/0.0.1 Уже пару недель играюсь с голосовым ассистентом на gemma4-31b-q5, у нее очень классный русский язык, знает современный сленг. Цепляю беспроводные наушники, хожу по квартире, занимаюсь своими делами и болтаю о чем угодно. Качество распознавания меня устраивает. Следующим модулем выложу свою чуть модифицированную версию omnivoice. У меня на 3090 задержка - 1с. Юзеры в чате с 5000 серией говорят, что у них задержка до 0.5с	1 883

مشاهده همه پست‌ها