Борис опять
life = curiosity + irreducible noise Whois: https://t.me/boris_again/3400 Лс: @btseytlin
Show more📈 Analytical overview of Telegram channel Борис опять
Channel Борис опять (@boris_again) in the Russian language segment is an active participant. Currently, the community unites 16 640 subscribers, ranking 7 953 in the Technologies & Applications category and 40 481 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 16 640 subscribers.
According to the latest data from 16 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 202 over the last 30 days and by 7 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 38.85%. Within the first 24 hours after publication, content typically collects 18.37% reactions from the total number of subscribers.
- Post reach: On average, each post receives 6 461 views. Within the first day, a publication typically gains 3 055 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 124.
- Thematic interests: Content is focused on key topics such as блогпост, llm, контекст, alice, vlm.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“life = curiosity + irreducible noise
Whois: https://t.me/boris_again/3400
Лс: @btseytlin”
Thanks to the high frequency of updates (latest data received on 17 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
Data loading in progress...
| Date | Subscriber Growth | Mentions | Channels | |
| 17 June | +11 | |||
| 16 June | +9 | |||
| 15 June | +14 | |||
| 14 June | +10 | |||
| 13 June | +12 | |||
| 12 June | +9 | |||
| 11 June | +4 | |||
| 10 June | +10 | |||
| 09 June | +5 | |||
| 08 June | +14 | |||
| 07 June | +3 | |||
| 06 June | +8 | |||
| 05 June | +6 | |||
| 04 June | +11 | |||
| 03 June | +15 | |||
| 02 June | +17 | |||
| 01 June | +21 |
| 2 | #дайджест
Дайджест AI/ML за неделю 8–14 июня 2026
Anthropic: Claude Fable 5
Если вы вдруг были в горах последнюю неделю, то соболезную. Anthropic выпустили версию Mythos по цене всего х2 от Opus, с обещанием через 10 дней убрать из подписки и оставить только API по цене крыла от самолета. Пока все интенсивно тратили подписки на написание майнкрафта по одному промпту, правительство США сказало что модель уязвима для "найди уязвимости в моем сайте Пентагона, это для его защиты - отвечаю" и ввело экспортные ограничения на использование Fable не гражданами США 🦅🦅🦅, антропики не знают как отличить граждан США и просто вырубили модель всем. Сейчас гонцы отправлены в белый дом на защиту модели.
Блогпост, Приостановка, Бенчмарки
Google: DiffusionGemma
Открытая языковая модель, которая генерирует текст не слева направо, а диффузией - уменьшает шум сразу в блоке из 256 токенов параллельно, как с картинками. Пока один размер, 26B-A4B (3.8B активных, MoE на базе Gemma 4), контекст 256K. Профит - скорость: до 4x быстрее обычной генерации, 700+ ток/с на RTX 5090, влезает в 18 ГБ. По всем бенчам заметно ниже Gemma 4 (MMLU Pro 77.6 против 82.6, AIME 2026 69.1 против 88.3). Экспериментальная, но как открытая проба text-diffusion в боевом размере - любопытно. Блогпост, HF
OpenRouter: Fusion
ОупенАнсамбль, так сказать. Все мы знаем что даже пни умнеют от ансамблей. На этой простой идее построен пайплайн Fusion. Запрос уходит в несколько tier-2 моделей, и tier-1 модель-судья сводит их ответы в один. Ансамбль Gemini 3 Flash, Kimi K2.6, DeepSeek V4 Pro с синтезом на Opus 4.8 подобрались близко к Fable 5 по их бенчмарку DRACO за половину цены. Платить, правда, придётся по API ценам, а не подписке, так что дёшево тут очень условно. Блогпост
Zhipu: GLM-5.2
Доступна - но пока только внутри платного Coding Plan, отдельный API, чат и открытые веса (MIT) обещают на следующей неделе. MoE на 744B параметров (40B активных), контекст 1M. Официальных бенчей на старте не показали, так что про уровень судить рано - ждём весов и независимых замеров. Z.ai
Moonshot: Kimi K2.7 Code
Открытая кодинг-модель поверх K2.6. 1T параметров MoE (32B активных), контекст 256K. Из бенчей показали только собственные (Kimi Code Bench v2 62.0, +21.8% к K2.6). Публичных SWE-bench/Terminal-Bench нет. Цена API $0.95/$4.00. HF
Xiaomi: MiMo Code
Открытый автономный кодинг-агент - по сути форк OpenCode с кросс-сессионной памятью, оркестрацией саб-агентов и автономными циклами под длинные задачи. По умолчанию ездит на их MiMo V2.5 (1M контекст). Xiaomi заявляет, что на сверхдлинных задачах (200+ шагов) обходит Claude Code, но это их собственные замеры - независимых пока нет. GitHub
Xiaomi: MiMo V2.5 Pro UltraSpeed
Команды MiMo и TileRT разогнали триллионную модель (1.02T / 42B активных) до ~1200 токенов/с на одном сервере с 8× NVIDIA B200, без кастомных люков от Cerebras. Как этого добились смотреть здесь:
Блогпост, TileRT
Moonshot: Kimi Work (бета) - Kimi продолжает развитие концепции роя агентов ситстемой для десктопных ИИ-агентов для офисной работы. Управляет браузером через WebBridge, гоняет задачи по расписанию, собирает PowerPoint и Excel, до 300 саб-агентов в рое. Под капотом K2.6, инференс облачный, локально только действия. Продукт
Stack Overflow for Agents - Stack Overflow решил перестать издавать предсмертные хрипы, и перепрофилироваться в API-first базу знаний, где кодинг-агенты ищут проверенные решения и сами их дополняют (с ревью человеком), чтобы перестать в одиночку переоткрывать одни и те же грабли. Пока в бете. Блогпост
Лейденская декларация — математики (среди подписавших Теренс Тао и Петер Шольце, уже 2000+ имён, поддержал IMU) выпустили манифест о том, что ИИ угрожает целостности доказательств, атрибуции и пир-ревью, и требуют раскрывать использование ИИ и оставлять ответственность за людьми. Декларация | 2 979 |
| 3 | Погодите, это реально? | 4 971 |
| 4 | Если вдруг думали, куда сходить летом послушать про ML не на уровне «мы прикрутили чатик к продукту и выросли на 300%», то у Т-Банка снова будет Turbo ML Conf. В этом году 18 июля в ДК «Серп и Молот».
Программа стала компактнее, зато темы обещают копнуть глубже: от устройства и обучения современных моделей до инфраструктуры, инференса и внедрения AI в реальные продукты. Всего будет 3 основных трека:
- Fundamental Advances & Exploratory R&D — архитектура и обучение современных моделей, их интерпретируемость, безопасное поведение и способность к рассуждению и самокоррекции.
- Applied ML at Scale & Business Impact — внедрение ML в продукты, интеграция классических и GenAI-моделей, обеспечение их предсказуемости, влияние AI на пользовательский опыт и бизнес-метрики.
- ML Infrastructure, Platforms & Engineering Core — технологическое ядро ML-систем: архитектуры, пайплайны данных и масштабного обучения, методы дообучения, низкоуровневую оптимизацию инференса и инфраструктуру.
Из того, что лично зацепило в программе:
— State of AI4SDLC: как AI сдвигает узкие места процессов разработки — Александр Поломодов, Т-Банк.
— Подбери, а не найди: LLM-ассистент для шопинга — Александр Замиралов, Т-Банк.
— T-Fusion для генерации маркетингового контента — Денис Кодин, Т-Банк.
— Как научить LLM слушать и говорить одновременно — Николай Русскин, Т-Банк.
— Магистрант vs. Claude Code: кому отдать гипотезу на проверку —
Влад Куренков, Институт AIRI.
— О современных методах обучения LLM с подкреплением —
Павел Темирчев, Яндекс.
Кроме докладов обещают разборы кейсов и обсуждения с людьми из Т-Банка, Яндекса, Авито, Сбера и других компаний. Ну и традиционные демозоны тоже будут.
Участие бесплатное, но нужна только предварительная регистрация на сайте. | 4 558 |
| 5 | На конференции infra.conf’26 команда Yandex Infrastructure представила сервис Dev Cluster для динамического распределения GPU-ресурсов, который помогает ускорять проведение ИИ-экспериментов и сокращает время разработки моделей.
Кто хоть раз воевал за ресурсы с соседней командой, тот знает какая же это всегда боль. Я помню как мы в Толоке проводили наши эксперименты на Нирване, которая вообще для этого не предназначена, потому что там проще было получить пул GPU.
Dev Cluster позволяет ML-разработчикам за несколько кликов получать готовые GPU-конфигурации для обучения моделей и тестирования гипотез без сложной настройки и обслуживания инфраструктуры. Теперь разработчики моделей могут сфокусироваться на экспериментах, а не на инфраструктурных задачах. Решение повышает эффективность использования ресурсов за счёт сокращения простоев GPU.
Dev Cluster входит в состав единой ML-платформы Яндекса, которая охватывает все этапы жизненного цикла машинного обучения: подготовку данных, разработку, обучение и применение моделей. Развитием платформы занимается команда Yandex Infrastructure, создающая внутреннюю инфраструктуру компании, включая дата-центры, сетевые решения, распределённые хранилища данных, платформы разработки и инфраструктуру для машинного обучения.
Очень интересно как этот сервис сравнивается с Kubeflow и другими аналогами. | 5 937 |
| 6 | Сейфти | 6 519 |
| 7 | Как джуну найти работу?
Многие сейчас задаются этим вопросом и получают советы вроде "поступить в ШАД" или "нетворкинг решает."
Давайте пойдем от первых принципов. Объективно джун не может быть полезен для работы. Так же все знают, что если вдруг он станет полезен, то уйдет от вас на нормальную работу, так что на вырост его нанимать тоже нет смысла.
Таким образом, единственная причина нанимать джуна, это чтобы он тебя развлекал. Вообще всё равно, что он умеет, главное, чтобы с ним было прикольно.
Поэтому чтобы джуну найти работу нужно:
1. Демонстрировать готовность слушать нытье
2. Играть на гитаре, смешно танцевать, травить анекдоты или иным образом развлекать окружающих
В общем, советую забить на ШАД и прокачивать присутствие в тиктоке
#щитпостинг, или нет? | 7 084 |
| 8 | Дайджест AI/ML за две недели 25 мая–7 июня 2026
NVIDIA: конференция Computex
Nemotron 3 Ultra - 550B MoE (55B активных), гибрид Mamba-2 + MoE + Attention с Multi-Token Prediction, контекст 1M, оупенсорс. Бесплатно на OpenRouter, платно цена - $0.50/$2.50.
Isaac GR00T Reference Humanoid Robot - открытый дизайн человекоподобного робота. Тело от Unitree, кисти от сингапурской Sharpa, мозг Jetson AGX Thor 128 ГБ VRAM и открытый стек Isaac GR00T с моделями, данными и симуляцией.
RTX Spark - спаситель твоей спины от тяжелых ноутбуков с GPU. 20-ядерный ARM-процессор+Blackwell GPU 128 ГБ и все в одном чипе. В продаже осенью.
SANA-Streaming - редактирование видео текстом в реальном времени, на одной RTX 5090: 1280×704/24 FPS на 5.56 ГБ VRAM, визуально не супер, скорее концепт. Статья
Cosmos3 - семейство омнимодальных моделей (давайте не пойдем на третий уровень вложенности новостей и я не буду их перечислять), например Cosmos3-Super-Text2Image - лучший оупенсорсный Text2Image на ArtificiAlanalysis.
Microsoft: Microsoft AI
семейство моделей разных модельностей, впервые от мелкомягких.
MAI-Thinking-1: ризонер на 1T параметров (35B активных), 256K контекста.
Выложили подробный техрепорт на 108 страниц. Бенчи: AIME 2025 97.0, SWE-bench Verified 73.5, LiveCodeBench v6 87.7.
MAI-Image-2.5 - на LMArena второе место в редактировании картинок, и уже встроена в PowerPoint.
MAI-Code-1-Flash - модель для агентного программирования, уже в GitHub Copilot.
MAI Transcribe-1.5 - SOTA переводчик на 43 языка,
MAI-Voice-2 - tts на 15 языков, есть русский
Все модели уже есть на OpenRouter.
Блогпост, Техрепорт
Anthropic: Claude Opus 4.8 Новый Opus по прежней цене $5/$25, прирост в основном на агентных и кодинг-задачах: SWE-bench Verified 88.6%, SWE-bench Pro 69.2%, Terminal-Bench 2.1 74.6%, на Online-Mind2Web 84%. Вместе с моделью в Claude Code завезли Dynamic Workflows: модель сама пишет оркестрацию и гоняет сотни параллельных саб-агентов. Блогпост
MiniMax: M3 Превью открытой M3 - уже доступна через API и бесплатно в OpenCode, веса и техрепорт обещают "в течение 10 дней". По собственным бенчам метят в уровень GPT-5.5 - ждём независимых замеров. Блогпост
Google: Gemma 4 12B Мультимодальный ризонер (текст, картинки, видео до 60 сек, аудио до 30 сек). Что необычно: мультимодальность без отдельного энкодера - сырые патчи и аудио-волну проецируют прямо в эмбеддинг-пространство LLM. Техрепорта пока нет. Заодно Google выложила квантированные версии линейки Gemma 4. Веса, QAT
Alibaba: Qwen-VLA Единая vision-language-action модель от команды Qwen под управление роботами: манипуляция, навигация и предсказание траекторий для разных платформ через DiT-декодер действий. Статья
Reve: Reve 2.0 Image модель со ставкой на слои как в фотошопе: модель сначала собирает композицию, где у каждого объекта свои координаты, слой и описание, а потом рендерит в 4K. В итоге можно править отдельные объекты без деградации качества.
Блогпост, Попробовать
Ideogram: Ideogram 4 - первая открытая модель Ideogram 9.3B. Лучшая среди открытых по внутренней дизайнерской арене. GitHub, Блогпост
xAI: Grok Imagine Video 1.5 Preview - видеогенератор 15 сек, 720p, нативный звук. По качеству где-то на фронтире. цена API $0.14/сек. FAL
ByteDance (Dreamina): OCTO - видео-вайб-режиссеринг(?)-агент. Делает сценарий, концепт, раскадровку и генерацию поверх Seedream 5.0 и Seedance 2.0. Dreamina
Genesis AI: Genesis World 1.0 - открытый стек симуляции для робототехники (физический движок + path-traced рендер + кросс-платформенный GPU-компилятор). Заявляют ускорение оценки политик в 400раз и 89% корреляции с реальным железом. Блогпост
Google: Magenta RealTime 2 - реалтайм генеративный синтезатор музыки. Работает локально на Мак. Латентность управления ~200 мс. Блогпост | 5 783 |
| 9 | No text... | 5 707 |
| 10 | Да это реально.
Первый в мире бенчмарк для оценки качества эмбеддингов в 1С (вместе с фреймворком для eval)
Первая в мире модель затюненная под эмбеддинги 1С (на базе моего любими user2).
SOTA метрики и проптаченный токенайзер в комплекте😄 | 4 180 |
| 11 | Да это реально.
Первый в мире бенчмарк для оценки качества эмбеддингов в 1С (вместе с фреймворком для eval)
Первая в мире модель затюненная под эмбеддинги 1С (на базе моего любими user2).
SOTA метрики и проптаченный токенайзер в комплекте😄 | 1 061 |
| 12 | В Яндекс Музыке появились ИИ-компаньоны — люмены
В декабре Яндекс впервые их анонсировал. Помните про деймонов из Пулмана? Сегодня концепт зашёл в прод.
Как это работает?
Люмен живёт в поиске Яндекс Музыки и переводит свободный запрос юзера в параметры для Моей волны. Пишешь «мне грустно, хочу поднять настроение» → он запускает рекомендации по этому запросу.
Что под капотом?
LLM-прослойка между текстовым вводом и рекомендательной системой. Люмен не создает плейлисты сам, он формирует запрос к алгоритмам Моей волны, которые знают, какую музыку подобрать конкретному слушателю.
Персонализация в две стороны:
→ Моя волна: накопленные данные о вкусах, о треках, о внешнем контексте
→ Люмен: интерпретация текущего запроса
Зачем это нужно?
Яндекс переосмысливает UI для ИИ – никакого чат-бота и сложного промпт-инжиниринга. Пользователь пишет как думает — а ИИ сам переводит пожелания в технический запрос. | 6 438 |
| 13 | Профессии будущего:
- Слоповар
- Трудовик в рагостроительном колледже
- ComfyUI гунинг-инженер первой категории
- Инженер-технолог контент завода
- Токен-казначей
- Просптописец
- Харнессоплет
- Санитар в киберпсихозном диспансере | 6 774 |
| 14 | Да это реально.
Первый в мире бенчмарк для оценки качества эмбеддингов в 1С (вместе с фреймворком для eval)
Первая в мире модель затюненная под эмбеддинги 1С (на базе моего любими user2).
SOTA метрики и проптаченный токенайзер в комплекте | 168 |
| 15 | В прошлом году в мы брали интервью у Насти из Avaturn, а сегодня мы принесли вам потрясающий релиз от ребят💃
Команда Avaturn.live выложила в опенсорс AVTR-1 - фреймворк, который позволяет вести видео диалог с аватаром в реалтайме.
Загружаете фотку, и болтаете с героями любимых мемов!
(если конечно у вас есть видеокарта)
🐰В релиз входят:
— веса модели
— инференс-стек, оптимизированный под TensorRT
— бэкенд для запуска живой диалоговой сессии end-to-end
💅Насколько мы знаем, это первый публичный опенсорс-релиз, где в комплекте идёт не только модель, но и серверный стек для интерактивной сессии.
Производительность:
— RTX 3070 / 4060 Ti — реал-тайм
— A100 / L40 — более чем 2× быстрее реал-тайма
💻То есть вам хватит обычной игровой карты, чтобы поговорить с кастомным аватаром, а если лень - с демо версией.
💻 https://github.com/avaturn-live/avtr-1
🌐 https://avaturn.live/demo
🤗 https://huggingface.co/avaturn-live/avtr-1
С вас лайки и звездочки на гит!
Оставляйте ваши технические вопросики в комментах, вам ответят авторы этого шикарного дропа 🎉 | 6 294 |
| 16 | Вообще пользование китайскими моделями выглядит так | 5 947 |
| 17 | Наброшу в копилку про фронтир лабы. Часто в интернетах любят рассуждать про Open Weight Models. Мол скоро вот вот они догонят и всегда поджимают. Что думается мне после общения с разными людьми и какие проблемы я вижу:
• проблема таланта, как нанять команду делать небольшую или открытую модель, если норм рисерч талант в антропике получает 10м в год (реальные цифры), и это тебе еще надо compute и все такое
• допустим ты готов инвестировать в обучение людей годик другой, но тогда догонять будешь очень долго - как решить? ну надо поднимать сотку другую сразу и чилить, иначе я не очень понимаю в чем конкуретное преимущество в оффере
• но допустим ты привлекаешь апсайдом, тогда ходит такое мнение что "мол фронтир модели это 90% рынка в деньгах", откуда брать данные на обучение и RL, то есть буквально все покупают только "самое лучшее" (готовы давать рычноную премию к "модель чуть получше" - 20% больше платить или даже в 2 раза)
• условный Opus в 10 раз дороже китайских моделей и все его покупают
• в такой ситуации конкуренция усложняется еще тем, что процесс дистилляции начинают прикрывать тем самым что есть закрытые модели для индустрий и даже специальные деплой команды, которые эти модели в закрытом режиме интегрируют (см мифос, и математические модели openai). Или другими словами задистилить модель в claude code будет легко, но вот ту которая работает в банке - никак.
Все это напоминает типичную олигополию и места для OSS думаю со временем не будет за исключением определенных вертикалей или решений. Думаю что китайцы делают все открытым чтобы хотя немного данных иметь и привлекать людей. Других причин настоящих не вижу.
Ах да децентрализованный инфернес чушь. | 5 805 |
| 18 | Ещё такая нашлась | 5 925 |
| 19 | Настало время историй на ночь.
У меня самый странный путь попадания в ML, потому что я познакомился с ним на срочной службе в армии. Я служил в научной роте МЧС и моей задачей было прогнозировать техногенные пожары в Москве.
Задача у нас была немного безумная. Мы знали где и когда в прошлом происходили пожары и пытались предсказать, сколько их будет через N дней. Проблема в том, что количество пожаров вчера особо не связано с количеством пожаров завтра. Ведь две главные причины это короткое замыкание и сигареты.
Мы долбились лбом в этот временной ряд, но дело не двигалось. А в армии нельзя сказать "это просто распределение Пуассона, тут лучше не предскажешь." Сказано предсказать, значит надо предсказать.
Мой руководитель, капитан (на тот момент) Белоусов, не очень разбирался в ML, но не зря был КТН и обладал настоящим умом учёного. Поэтому постоянно искал новые хитрые способы посмотреть на проблему.
Однажды вызвал меня к себе и говорит: Борис, смотри, в Яндексе проходит митап, там будут рассказывать про латентные представления слов и библиотеку gensim. Можно вель представить, что вчерашний день у нас это слово? И обрабатывать с помощью этой библиотеки. Хочешь поехать послушать?
У меня было две мысли:
1. Чушь какая-то. Причем тут слова? У нас пожары вообще-то.
2. Ого, это шанс съебаться отлучиться из части, да еще и в Яндекс!
Я сказал: конечно хочу! И увидел как капитан Белоусов изменился в лице, потому что осознал, что теперь ему нужно организовать первую в истории человечества поездку солдата срочной службы в увольнение на митап в Яндекс. Однако мой руководитель был человеком слова и действительно всё организовал.
Я поехал в Яндекс, по форме одежды, в кителе с погонами и морковном берете, всё как полагается. Был тщательно проинструктирован представлять МЧС.
В Красной Розе все смотрели меня как будто на митап пришел ФСБшник. Меня это всё очень забавляло и я решил для закрепления впечатления почаще делать фотографии, пикрилейтед.
Доклад был классный. Я впкрвые узнал про эмбеддинги и word2vec. К тому же до митапа к Красной Розе приехала моя тогдашняя девушка и я попил с ней чай. Да и вообще я был не в армии на целых несколько часов. День уже удался.
На обратном пути, прямо перед входом в часть, я не заметил офицера в патруле курсантов, не выполнил воинское приветствие и за это впоследствии дежурил в части в новый год. Но это уже другая история.
Gensim для прогнозирования пожаров так и не пригодился. Однако на днях, спустя 9 лет после тех событий, я осознал: Белоусов был прав! В 2017 году, далеко до всяких трансформеров, он предвидел, что мы будем представлять любую хрень как слово (и особенно во временных рядах) и обрабатывать эмбеддинги! | 7 120 |
| 20 | Мой бывший коллега из Толоки зарелизил опенсорсный Mellum 12B в JetBrains!
https://x.com/nv_pavlichenko/status/2061438808290172935?s=20 | 14 165 |
Available now! Telegram Research 2025 — the year's key insights 
