Love. Death. Transformers.
❤️☠️🤗 Указанные действия не являются ресерчем, поскольку: а) Мы не ученые; б) Оно работает. @transformerslovedeatch по всем вопросам Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.
Ko'proq ko'rsatish📈 Telegram kanali Love. Death. Transformers. analitikasi
Love. Death. Transformers. (@lovedeathtransformers) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 24 461 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 5 470-o'rinni va Rossiya mintaqasida 27 215-o'rinni egallagan.
📊 Auditoriya ko‘rsatkichlari va dinamika
невідомо sanasidan buyon loyiha tez o‘sib, 24 461 obunachiga ega bo‘ldi.
03 Iyul, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 68 ga, so‘nggi 24 soatda esa 1 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.
- Tasdiqlash holati: Tasdiqlanmagan
- Jalb etish (ER): Auditoriya o‘rtacha 40.65% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 21.26% ini tashkil etuvchi reaksiyalarni to‘playdi.
- Post qamrovi: Har bir post o‘rtacha 9 944 marta ko‘riladi; birinchi sutkada odatda 5 200 ta ko‘rish yig‘iladi.
- Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 119 ta reaksiya keladi.
- Tematik yo‘nalishlar: Kontent сиська, llm, параметр, округление, fp32 kabi asosiy mavzularga jamlangan.
📝 Tavsif va kontent siyosati
Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“❤️☠️🤗
Указанные действия не являются ресерчем, поскольку:
а) Мы не ученые;
б) Оно работает.
@transformerslovedeatch по всем вопросам
Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.”
Yuqori yangilanish chastotasi (oxirgi ma’lumot 04 Iyul, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.
Ma'lumot yuklanmoqda...
| Sana | Obunachilarni jalb qilish | Esdaliklar | Kanallar | |
| 04 Iyul | +6 | |||
| 03 Iyul | +6 | |||
| 02 Iyul | +5 | |||
| 01 Iyul | +13 |
| 2 | Мир сошел с ума | 5 494 |
| 3 | день репостов нишевых каналов | 6 344 |
| 4 | StiTching
Мне сегодня нужно было сшить кожу на пальце, и в процессе этого перформанса я вспомнила про model stitching. Чтобы скрасить время — врачебное и моё — начала рассказывать зачем это надо. Без понятия, зашло ли хирургу и медсестре, но зато я обнаружила для себя интересный тейк на поделиться с вами = )
Что:
Model stitching как идея появился в 2015 году. Его выдвинули как метод изучения эквивалентности двух сетей, но математическая эквивалентность здесь мимо не проходила — она, более того, не верна — авторы назвали два представления эквивалентными, если существует преобразование между ними, в математике мы требуем аксиом).
Тогда это осталось нишевым инструментом для картинок — юзали AlexNet-ы.
Потом в 2021 NeurIPS идею дооформили, вышли две работы: Similarity and Matching of Neural Network Representations и Revisiting Model Stitching to Compare Neural Representations. Кстати, в первой работе шутили про Франкенштейна (или нет).
Как это стало устроено:
Смотрим на две обученные и замороженные сети A и B. «Сшитая» модель строится так:
• берём нижние слои сети B (front model, представление r = B≤ℓ)
• между ними ставим тонкий обучаемый stitching layer — единственный, кто обучается
• подключаем к верхним слоям сети A (top model, A>ℓ)
То есть делаем бутерброд из белого и темного хлеба, если хотите. А формально ищется простейший слой, задачей вида: L_ℓ(r; A) = inf_{s∈S} L(A>ℓ ∘ s ∘ r)
Где s — stitching layer, A>ℓ — верхние слои A, r — представление из B. s∈S — тут специально, мы ищем слой из класса простых слоев, а инфимум (inf), как математический знак, говорит нам, что stitching layer обязан быть минимальным: для свёрточных сетей — 1×1 conv с BatchNorm, для трансформеров — token-wise linear.
Как именно обучают stitching layer:
— HLM (hard label matching) — минимизируем ошибку на настоящих метках задачи.
— SLM (soft label matching) — минимизируем расстояние до предсказаний end-модели, а не до ground truth.
— DM (direct matching) — напрямую минимизируем расстояние между активациями на уровне stitching.
— FuLA (functional latent alignment, Athanasiadis et al., 2026) — stitching layer обучается имитировать не только выход end-модели, но и её внутренние процессы послойно (на пальцах плохо — надо читать).
Метрика успеха — stitching penalty = разница между ошибкой сшитой модели и ошибкой базовой A. Penalty ≈ 0 означает совместимость. Penalty < 0 — сшитая модель стала лучше базовой, то есть мы буквально подсадили ей более сильные нижние слои.
Зачем это нужно:
Смотрим на фиолетовую/рыжую цитату — изначально — метрика сходства. Но потом пошло интереснее. Например, Stitchable Neural Networks (CVPR 2023) можно семейство предобученных моделей разного размера (например, Swin-Ti/S/B), сшить и получить модель, которая во время инференса может динамически переключаться между режимами accuracy/efficiency или T-Stitch: ускорение диффузионных моделей через замену первых шагов денойзинга на более лёгкую сеть и возврат к тяжёлой для финального качества.
Это что, пахнет LoRA?
Эту мысль я обдумывала при знакомстве со stitching. Вдруг она не возникла у вас — я опеределиа.
Да: оба метода замораживают предобученные веса и вставляют тонкий линейный слой.
Но нет: LoRA адаптирует одну модель к новой задаче, stitching измеряет совместимость двух уже обученных сетей на старой задаче.
Финал не придумала, но stiting — одна из штук, висящих у меня на "идеи для рисерча". А ещё — просто вдумайтесь! Этот AI-мир можно сшить!
Хирург, кстати, ничего не спросил, но швы наложил нормально.
Аккуратнее будьте, друзья, и будьте здоровы! 😌 | 5 885 |
| 5 | Объявляется неделя прикольных ссылок
Мои коллеги из команды претрейнов сделали дискретную диффузию на основе гигачата — причём основным исполнителем был стажёр. Веса в опенсорсе, поддержка в SGLang в PR, метрики лишь немного ниже обычного гигачата, а скорость генерации выше аж на 72%.
Если вы умный, активный и хотите делать прикольные штуки на большом компьюте, приходите к нам)
Репорт:
https://habr.com/ru/companies/sberbank/articles/1054690/
Веса:
https://huggingface.co/ai-sage/GFusion-10B-A1.8B | 5 797 |
| 6 | Matn yo'q... | 6 144 |
| 7 | WQ0NPNQ2tuGSkduv.mp4 | 1 |
| 8 | репостегов бы
https://x.com/justALEXWORTEGA/status/2072647053864276308?s=20 | 6 109 |
| 9 | Sonnet-5
По метрикам классный. По цене на 30% дешевле sonnet-4.6 (временно). Хоуп уже тестит в чате.
Блог, техрепорт | 6 325 |
| 10 | Рассказал:
• как и где я использую Hermes Agent
• как засетапить себе бота как @fiztehbot
• нюансы, безопасность, контекст
Моя январская статья стала самой популярной на хабре про СС (192k просмотров), хотя ее жестко заминусовали лол
Оставьте коммент под статьей - посмотрим, что на это скажут ИИ хейтеры
🔗 habr.com/ru/articles/1053846
🔗 habr.com/ru/articles/1053846
🔗 habr.com/ru/articles/1053846 | 7 355 |
| 11 | Matn yo'q... | 7 314 |
| 12 | Matn yo'q... | 7 886 |
| 13 | Меня всегда удивляет, что можно найти на просторах интернета, например, математические доказательства ранее нерешенных проблем
Аниме "Меланхолия Харухи Судзумии" в первом сезоне состоит из 14 серий, которые задумывались так, чтобы их можно было смотреть в любом порядке
в 2011 на фочане кто-то задался вопросом: "какое минимальное количество серий нужно посмотреть, чтобы увидеть весь сезон во всех возможных порядках?"
Оказалось, что это классическая задача комбинаторики про суперперестановки https://en.wikipedia.org/wiki/Superpermutation
И какой-то анонимный юзер доказал, что нижняя граница равна n! + (n−1)! + (n−2)! + n − 3, при n >= 2
Это пылилось на просторах интернета, пока в 2013 году про тред не написал Натаниэль Джонстон у себя в блоге, но это доказательство осталось без внимания, пока в 2018 Робин Хьюстон не наткнулся на пост в блоге, и вместе с коллегами опубликовал статью с дополненным доказательством, где первым автором указал анонима с фочана
Оригинальная статья, где первый автор это аноним с фочана https://oeis.org/A180632/a180632.pdf
Ну и сама задача о кратчайшей суперперестановке называется проблемой Харухи: https://mathsci.fandom.com/wiki/The_Haruhi_Problem | 8 261 |
| 14 | Забавный в своей бесполезности тул - мониторинг взлома реварда, проверяет есть ли коллапс награды в одно значени
https://github.com/AvAdiii/rewardspy | 7 946 |
| 15 | Matn yo'q... | 9 389 |
| 16 | все что вы хотели видеть мои дорогие любители дистилить фронтир | 7 711 |
| 17 | Tldr: дистилл чтобы улучшать капибилити работает только на фулл ризонинге, на суммаризованном не работает.
https://arxiv.org/abs/2606.05988v1 | 8 228 |
| 18 | Matn yo'q... | 11 522 |
| 19 | Челы мем запостили | 7 890 |
| 20 | https://openai.com/index/previewing-gpt-5-6-sol | 8 512 |
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
