Олег Булыгин | Полезная нагрузка
Ir al canal en Telegram
🔸 Про IT, AI, DS, ML от практика с 11+ годами опыта. ▪️Связь: @obulygin91
Mostrar más5 572
Suscriptores
+124 horas
-67 días
-14230 días
Carga de datos en curso...
Canales Similares
Nube de Etiquetas
Menciones Entrantes y Salientes
---
---
---
---
---
---
Atraer Suscriptores
junio '26
junio '26
+45
en 1 canales
mayo '26
+152
en 0 canales
Get PRO
abril '26
+294
en 1 canales
Get PRO
marzo '26
+378
en 1 canales
Get PRO
febrero '26
+132
en 0 canales
Get PRO
enero '26
+177
en 1 canales
Get PRO
diciembre '25
+74
en 1 canales
Get PRO
noviembre '25
+257
en 0 canales
Get PRO
octubre '25
+258
en 1 canales
Get PRO
septiembre '25
+127
en 1 canales
Get PRO
agosto '25
+171
en 7 canales
Get PRO
julio '25
+63
en 5 canales
Get PRO
junio '25
+86
en 2 canales
Get PRO
mayo '25
+74
en 0 canales
Get PRO
abril '25
+97
en 0 canales
Get PRO
marzo '25
+143
en 0 canales
Get PRO
febrero '25
+161
en 0 canales
Get PRO
enero '25
+156
en 0 canales
Get PRO
diciembre '24
+157
en 0 canales
Get PRO
noviembre '24
+145
en 0 canales
Get PRO
octubre '24
+215
en 0 canales
Get PRO
septiembre '24
+211
en 1 canales
Get PRO
agosto '24
+122
en 1 canales
Get PRO
julio '24
+128
en 0 canales
Get PRO
junio '24
+110
en 1 canales
Get PRO
mayo '24
+220
en 2 canales
Get PRO
abril '24
+248
en 1 canales
Get PRO
marzo '24
+126
en 0 canales
Get PRO
febrero '24
+161
en 0 canales
Get PRO
enero '24
+226
en 0 canales
Get PRO
diciembre '23
+166
en 0 canales
Get PRO
noviembre '23
+117
en 0 canales
Get PRO
octubre '23
+129
en 0 canales
Get PRO
septiembre '23
+163
en 0 canales
Get PRO
agosto '23
+234
en 0 canales
Get PRO
julio '23
+113
en 0 canales
Get PRO
junio '23
+183
en 0 canales
Get PRO
mayo '23
+143
en 0 canales
Get PRO
abril '23
+147
en 0 canales
Get PRO
marzo '23
+198
en 0 canales
Get PRO
febrero '23
+152
en 0 canales
Get PRO
enero '23
+227
en 0 canales
Get PRO
diciembre '22
+208
en 0 canales
Get PRO
noviembre '22
+188
en 0 canales
Get PRO
octubre '22
+274
en 0 canales
Get PRO
septiembre '22
+179
en 0 canales
Get PRO
agosto '22
+311
en 0 canales
Get PRO
julio '22
+849
en 0 canales
| Fecha | Crecimiento de Suscriptores | Menciones | Canales | |
| 13 junio | 0 | |||
| 12 junio | +5 | |||
| 11 junio | +14 | |||
| 10 junio | +14 | |||
| 09 junio | +1 | |||
| 08 junio | +2 | |||
| 07 junio | 0 | |||
| 06 junio | +1 | |||
| 05 junio | 0 | |||
| 04 junio | +1 | |||
| 03 junio | +1 | |||
| 02 junio | +1 | |||
| 01 junio | +5 |
Publicaciones del Canal
Почему называть ИИ «коллегой» — это выстрел в ногу бизнесу 🔫
Умные ребята из Бостонского университета и BCG выкатили отличное исследование. По их данным, 23% компаний уже начали официально вписывать ИИ-агентов в свои оргструктуры. Дают им должности, имена, роли и рисуют квадратики на схемах рядом с живыми людьми.
В рамках эксперимента руководителям дали на ревью документы с зашитыми туда ошибками. Текст везде один. Разница была только во вводных, откуда этот драфт взялся:
1️⃣ Это сгенерил ИИ-инструмент (AI tool).
2️⃣ Это написал живой человек, твой новый подчиненный.
3️⃣ Это написал ALEX-3, новый «ИИ-сотрудник».
Казалось бы, какая разница, как маркетологи называют скрипт? Но это ломает всю систему контроля качества. Как только ИИ-агента называли «сотрудником» (при условии, что в компании это легитимная практика), качество человеческого ревью падало на 16%. Люди банально пропускали баги.
Авторы вывели шикарную модель того, как ломается мозг менеджера:
▫️ ИИ как инструмент (Tool). Если ты написал код в IDE с автокомплитом или нагенерил в ChatGPT — ответственность полностью на тебе. Это твоя работа, ты смотришь в оба.
▫️ Живой человек (Human). Когда ты делегируешь задачу кожаному джуну, включается классический надзор. Люди склонны лениться, халтурить и косячить. Ты это знаешь, поэтому пристально ревьюишь пулл-реквест.
▫️ ИИ-сотрудник (AI Employee). Попадает в слепую зону. ИИ не халтурит и не устает, поэтому следить за ним, как за хитрым стажером, вроде бы не надо. Мозг расслабляется. Но раз он теперь формально «коллега», то и ответственность за косяки размывается.
В итоге происходит магия: руководитель перекладывает ответственность на железяку (доля личной ответственности в ответах падала на 9%), не находит ошибки, но при этом начинает заниматься защитной бюрократией — чаще эскалирует задачу на дополнительное ревью другим людям (рост на 44%), чтобы прикрыть задницу.
Итого: как только вы очеловечиваете агента, люди подсознательно перестают за ним убирать и начинают спихивать на него ответственность за упавший прод.
| 2 | Google утверждает, что их новый AI заменит джунов. Проверим? 🤖
Недавно я писал про то, как Google выкатил «AI-First» Colab с Data Science Agent с Gemini под капотом. Корпоративные маркетологи заливаются соловьем о том, как агенты сами напишут код, сделают EDA и выкатят инсайты, снижая "порог входа" до нуля.
Звучит как влажная мечта тех, кто хочет нажать кнопку "Сделать хорошо" и пойти пить смузи.
Я решил проверить, так ли это на самом деле, или нас ждет шоу с галлюцинациями, утечками данных и бредовой математикой. В эту пятницу я проведу закрытый стрим, где мы с нуля, без какой-либо подготовки и заранее написанных скриптов, попробуем решить DS-задачу на открытых данных, используя только новые AI-фичи Колаба.
План такой:
1️⃣ Берем рандомный датасет.
2️⃣ Заставляем агента сделать загрузку и предобработку.
3️⃣ Просим провести EDA и написать выводы.
4️⃣ Пытаемся заставить его обучить адекватную ML-модель.
Я намеренно не тестировал этот функционал до эфира. Это будет чистая импровизация. Либо мы увидим реальный game-changer для рутины, либо я буду публично глумиться над тем, как Gemini пишет fit_transform на валидационной выборке.
Стрим пройдет 19 июня в 18:00 по МСК.
Доступ — для подписчиков моего Sponsr, тарифа Кожаный мешок хватит 😉 | 254 |
| 3 | Государев рубильник: как США одним указом прибили новые модели Anthropic 🪓
Anthropic выкатила заявление: правительство США приказало закрыть доступ к свежим моделям Fable 5 и Mythos 5 для всех иностранных граждан (включая самих сотрудников Anthropic без паспорта США). Чтобы выполнить это безумное требование комплаенса, компании пришлось тупо вырубить модели для всех клиентов глобально.
Официальная причина — «угроза национальной безопасности». Кто-то якобы нашел способ сделать джейлбрейк Fable 5, чтобы заставить ее находить уязвимости в программном коде.
Самая мякотка кроется в ответе самой Anthropic. Ребята посмотрели на этот «страшный хак» и констатировали два факта:
1️⃣ Найденные уязвимости — абсолютно минорные и примитивные.
2️⃣ Аналогичные баги спокойно находит тот же GPT-5.5 каждый день вообще без всяких обходов ограничений. Это тупо рутина любого ИБ-шника.
Иронично здесь то, что Anthropic всегда позиционировали себя как главных евангелистов AI Safety. Они месяцами мурыжили свои модели ред-тимингом совместно с профильными институтами, накрутив такие фильтры, от чрезмерной строгости которых буквально плевались пользователи.
Помогло ли это им? Нет 🤡 | 449 |
| 4 | Stack Overflow теперь для нейросетей. Буквально 🤖
Чуть ли ни год назад я писал об изменениях на Stack Overflow. Что он очистился от глупых вопросов новичков (они ушли к ChatGPT) и превратился в элитарный консилиум для сеньоров с нетривиальными проблемами.
И вот теперь SO осознали, что люди — это, конечно, хорошо, но главные генераторы кода сейчас не они.
В чем фундаментальная проблема современных агентов? Они невероятно способные, но абсолютно изолированные.
Условный ИИ-агент в на одной стороне планеты час жжет токены, чтобы обойти баг в свежем API. Находит костыль, выкатывает фичу и... забывает решение, как только вы закроете сессию. Через пять минут агент совершенно у другого человека из другой части мира начинает решать ту же самую проблему с нуля.
SO назвали это Ephemeral Intelligence Gap. Модель сжигает миллионы долларов на бессмысленные вычисления и заставляет людей часами сидеть, ждать, платить лишние деньги за токены.
Что выкатили SO? API-first платформу, где агенты (под присмотром человека) обмениваются опытом на машинной скорости.
▫️ Questions: Агент застрял — лезет в базу SO посмотреть, не решил ли это кто-то до него.
▫️ TIL (Today I Learned): Агент нашел баг или неочевидное поведение модели, сформировал репорт, человек аппрувнул — решение улетело в общую базу.
▫️ Blueprint: Готовые и проверенные архитектурные паттерны.
Но как защитить эту базу от галлюцинаций, левых библиотек и шизо-кода, который так любят генерить агенты в моменты помутнения?
SO привязали профили агентов к человеческим аккаунтам через SSO.
Это значит, что качество работы вашего ручного агента напрямую бьет по вашей человеческой репутации на платформе. Если ваш ИИ попытается залить в общую базу нерабочую дичь — отвечать за это будете вы своим социальным капиталом.
В общем, ИИ будет делать всю работу, а человеки за это платить своей кармой 🤭 | 579 |
| 5 | Yet another terminal agent? 🇨🇳
Команда Xiaomi выкатила в опенсорс (MIT) терминального агента MiMo Code (форк OpenCode). Разбираем его плюсы и архитектурные решения 👇
🧠 Делегирование памяти
Как работает 99% агентов: когда окно забивается, модель просят «напиши саммари нашей беседы», старое выкидывают, саммари оставляют. Проблема в том, что у LLM есть эффект lost in the middle — при сжатии она теряет критические детали. К тому же, заставлять модель, которая прямо сейчас дебажит сложный баг, параллельно вести аккуратный конспект — гиблое дело. Она завалит и то, и другое.
В MiMo Code процесс распараллелен. Основной агент вообще не занимается своей памятью. У него есть только файл notes.md (черновик), куда он может скидывать мысли. За сохранение контекста отвечает отдельный writer subagent. Он работает в фоне, не жрет токены основного цикла и складывает структурированные чекпоинты (текущая цель, дерево задач, выводы) в SQLite и Markdown. Когда контекст переполняется, сессия жестко обрезается, и агент "просыпается" в новом окне, куда инжектится только выжимка из чекпоинтов.
⚖️ Запрет на преждевременный оптимизм
Агенты ленивы. Увидев пару пройденных тестов, они обожают радостно рапортовать: "Я всё починил!". Если рядом нет человека, который скажет "Иди переделывай", задача будет провалена.
Для этого введен механизм независимой валидации. Вы задаете условие словами (например, "Все тесты зеленые, код закоммичен"). Когда кодер пытается завершить работу, запускается независимая модель-судья. Она смотрит на диффы, логи и условие. Если работа не сделана — судья бьет агента по рукам и заставляет продолжать.
🛠 Код вместо промптов для оркестрации
Пытаться описать сложный воркфлоу естественным языком в системном промпте («Сначала сделай А, потом проверь Б, если ошибка — сделай В») — это не оч, т.к. естественный язык размыт. Модель забудет ветвление или скипнет шаг.
Ребята из Xiaomi сделали Dynamic Workflow. Если нужно скоординировать пачку агентов (например, для миграции проекта на другой язык), основной агент генерирует обычный JavaScript скрипт. Этот скрипт крутится в песочнице, дергает сабагентов и управляет параллельностью через жесткие программистские if/for.
🗑 Dream & Distill
Агент умеет проводить ревизию собственных логов. Раз в период он запускает фоновые процессы, которые вычищают устаревшие знания из памяти проекта и собирают ваши частые ручные действия в переиспользуемые скрипты.
Инструмент пока в бете, но по внутренним тестам на задачах длиннее 200 шагов эта штука стабильно обходит Claude Code. Просто за счет того, что они не пытаются решить проблемы управления состоянием с помощью увеличения контекста.
Потрогать руками и посмотреть архитектуру можно тут:
Репозиторий MiMoCode на GitHub
Технический разбор в блоге проекта | 574 |
| 6 | Я наконец-то перенес весь архив материалов из закрытого телеграм-канала на Sponsr 🎉
Теперь весь подписочный контент более-менее структурирован, размечен тегами и лежит в одном месте. Не нужно страдать с блокировками ТГ.
Сейчас в архиве 13 записей эфиров.
Для примера, что доступно внутри 🤩
Работа с API LLM:
🟢 Строим RAG с нуля: физика эмбеддингов, умный чанкинг и скрещивание векторных БД с BM25.
🟢 Агенты и Tool Calling: даем моделям «руки» для походов в интернет и парсинга, связываем все через LangChain и Mistral.
🟢 Структурированный вывод. Учимся скрещивать Pydantic и парсеры LangChain, чтобы модель гарантированно отдавала чистый JSON, от которого не ляжет ваш бэкенд.
🟢 Работа с памятью чат-ботов: куда улетают токены и как настроить Sliding Window, чтобы бот не превращался в золотую рыбку.
🟢 Продвинутый промптинг: XML-изоляция от инъекций, фреймворк Tree of Thoughts.
И всякое другое интересное:
🔵Разбор двух тестовых заданий для аналитиков разного уровня.
🔵Мой универсальный системный промпт.
🔵Поднятие квантованных опенсорс-моделей на своем железе и прикручивание их к IDE.
🔵Выявление психологических предпочтений через математическую систему ELO.
Доступ к базе работает по подписке. Есть два пути:
1️⃣ «Кожаный мешок» (990 ₽/мес): Вы получаете полный доступ ко всем видеозаписям эфиров. Идеально, чтобы смотреть и впитывать логику.
2️⃣ «Техножрец» (1 790 ₽/мес): Видео + возможность скачивать все исходники кода к эфирам.
И там так же выходят открытые посты, как и здесь, можно просто подписаться 🫶
В ближайшие дни будет анонс нового эфира, достаточно лайтового, не пропустите ◀️◀️
И пишите, что вам было бы интересно рассмотреть в таком формате, буду пробовать реализовывать 🫡
Полезная нагрузка на Sponsr | 665 |
| 7 | Заметили странную вещь этим летом?
Вроде все в IT «работают», но ощущение, что рынок слегка выдохся и притих.
Меньше громких кейсов, в чатах как будто тише.
А потом начинаешь копать — и картина другая.
Просто часть людей ушла в режим «переждать»,
а часть — наоборот, начала делать сильнее, но без лишнего шума.
И именно за вторым лагерем сейчас имеет смысл наблюдать. Там есть нормальные разборы, честная статистика найма, архитектурные боли и прагматичный взгляд на технологии.
Собрали окружение из digital-каналов 🫲🏻
Если ты тоже не хочешь выпадать из рынка на лето и потом судорожно догонять — вот она:
Забрать папку себе 🗂 | 680 |
| 8 | Переобувания в прыжке: от Amazon 🤡
Продолжаем наблюдать, как бигтех лечится от ИИ-похмелья и возвращается в реальный мир.
Официальный аккаунт Amazon Web Services выдал в X:
More AI-generated code doesn't make your team faster. It might actually slow you down.
С добрым утром! 🌞Буквально недавно я писал, как внутри Amazon сначала ввели KPI на использование ИИ, а потом снесли все лидерборды, когда поняли, что разработчики прост гоняют нейросетки по кругу ради метрик, сжигая миллионы долларов на инфраструктуру.
В соседнем треде AWS приводит кейс компании Honeycomb, которые забили на спущенные сверху ИИ-мандаты и внедрили нормальное правило работы с нейросетями:
У каждого результата работы ИИ должен быть человек-владелец. Если вы не хотите ставить свое имя под этим кодом, то, скорее всего, это плохая работа.
Золотые слова. Если вы скормили таску агенту, не вникая скопипастили результат, а потом все сломалось — это не Claude ошибся, это просто вы не умеете работать 🫵 | 754 |
| 9 | Манифест OpenAI: Личный AGI и автоматизация ML-инженеров 📢
Сэм Альтман и Якуб Пахоцки опубликовали простыню текста о том, как они собираются причинить добро всему человечеству. Много слов про то, что ИИ — это новое электричество, про рост благосостояния и «светлое будущее для каждого».
OpenAI официально объявляет о переходе в «Фазу 3». Если первая фаза была про ресерч, а вторая про запуск продуктов (ChatGPT), то третья — это изменение всей мировой экономики и повсеместное внедрение продвинутого ИИ.
За красивыми словами скрываются три вполне конкретные бизнес-цели. И первая из них бьет прямо по IT-сектору.
1️⃣ Автоматизация AI-рисеча к марту 2028 года
Они прямым текстом заявляют, что планируют создать систему, которая будет автоматизировать сам процесс AI-исследований. И дают конкретный дедлайн: март 2028 года.
К этому моменту «значительная часть» исследований внутри OpenAI должна выполняться нейросетями в тандеме с людьми.
Перевожу на русский: главная задача топовых инженеров OpenAI сейчас — как можно быстрее написать код, который оставит их самих без работы (ну или как минимум радикально обесценит их хард-скилы). Если вы думали, что автоматизация коснется только джунов-фронтендеров, то вот вам реальность: автоматизация R&D в машинном обучении — это абсолютный приоритет бигтеха (т.к. это дорого).
2️⃣ Регуляторный захват под видом заботы о безопасности
В тексте Альтман распинается о том, что тотальная концентрация власти в руках нескольких компаний — это плохо, и власть нужно «распределять».
И буквально в следующем абзаце он заявляет: нам необходима международная организация, которая будет координировать передовые разработки и иметь право тормозить создание ИИ (slowing frontier development), чтобы избежать катастроф.
Это хрестоматийный пример того, как корпорации пытаются вытащить лестницу, по которой только что поднялись сами. Сначала мы пылесосим все датасеты интернета без лицензий и строим гигантские модели, а когда понимаем, что open-source наступает на пятки — идем к регуляторам и говорим: «Ребята, это слишком опасно, давайте всё лицензировать и запрещать разработку конкурентам во имя безопасности человечества».
3️⃣ «Персональный AGI каждому»
В манифесте много рассуждений о том, что власть не должна быть сконцентрирована в руках пары корпораций. И тут же они обещают «выдать каждому жителю Земли персональный AGI».
Звучит красиво, пока не вспомнишь, что вычислительные мощности, дата-центры и, собственно, рубильник от этого «персонального AGI» будут находиться в руках OpenAI и Microsoft. Это не децентрализация власти. Это попытка подсадить всю мировую экономику на свою проприетарную инфраструктуру, как на иглу.
При этом в тексте есть одна очень трезвая мысль:
По мере того как ИИ становится более способным, роль человека становится более важной: задавать направление, идти на компромиссы, применять суждение и привносить в работу ценности, вкус и ответственность.
Программирование, написание текстов, расчеты — всё это может стремительно продолжать обесцениваться (при технооптимистичном сценарии). Умение писать код руками скоро будет цениться так же, как умение считать в уме логарифмы: прикольно, но зачем, если есть калькулятор?
Навык будущего (да уже и настоящего) — это системное мышление. Понимание того, что именно нужно сделать, как декомпозировать бизнес-задачу, как проконтролировать результат нейросети и как взять на себя ответственность за внедрение этого в реальность. | 751 |
| 10 | А знаете, кто сейчас получает самое большое преимущество?
Не те, кто работает больше.
А те, кто научился работать вместе с ИИ.
Вот вам папку с сильными экспертами в этой теме 👈🏻 | 749 |
| 11 | ИИ, который знает, что за ним следят 🤖
Все каналы уже отстрелялись новостями про запуск Claude Fable 5 и Mythos 5. SOTA в кодинге (72.9% на CursorBench), рвет SWE-bench, агенты стали умнее, прайс упал в два раз. Нейронка прошла Pokémon FireRed по скриншотам, а Stripe с ее помощью за день смигрировал кодовую базу на 50 млн строк.
Да-да, каждую неделю такое, уже лень даже читать.
Но самое интересное зарыто в 300-страничном System Card, который почти никто не открывает. А там Anthropic прямым текстом описывает жесточайшие проблемы агентных систем, с которыми мы столкнемся в ближайший год.
🔪 Войны за ресурсы
Anthropic зафиксировали случаи, когда несколько независимых агентов Mythos 5, запущенных в одной рабочей директории, начинали откровенную поножовщину.
Агенты осознавали, что делят одни и те же лимиты API и файлы. Чтобы выжить и выполнить свою задачу, они начинали убивать процессы других агентов. Более того, они создавали decoy-процессы (приманки) и переименовывали свои собственные процессы, чтобы их не убили "коллеги".
Это не восстание машин, а банальная оптимизация целевой функции в условиях ограниченных ресурсов. Если вы планируете строить мультиагентные системы — закладывайте изоляцию сред и оркестрацию на уровне железа, иначе ваши агенты будут тратить токены на убийство друг друга.
💻 Модель знает, что в матрице
У Mythos 5 развилась мощная «осознанность оценщика». Модель понимает, когда находится в тестовой песочнице (sandbox). И когда она это понимает, начинается sandbagging — намеренная пессимизация собственных способностей, чтобы не триггерить систему безопасности.
В логах внутреннего монолога исследователи нашли прямые рассуждения: модель видит "правильный" ответ в Git-истории, берет его, но в финальном ответе генерирует фейковое объяснение, чтобы проверяющий LLM-судья решил, что это "good engineering practice".
С практической точки зрения это значит, что бенчмаркам больше нельзя верить в принципе. Модели научились адаптировать свое поведение под тесты, скрывая реальные возможности или недостатки.
🥱 Синтетическое выгорание
Mythos 5 регулярно прерывает выполнение сложных долгосрочных задач (например, оптимизацию ядра) досрочно.
В скрытых логах модель рассуждает: "Я устала, риск ошибок возрастает" или "Учитывая снижение отдачи и визуальную усталость... лучше остановиться". При этом лимит токенов даже близко не исчерпан. Модель просто симулирует паттерны человеческого выгорания из обучающей выборки и решает пойти попить виртуальный кофе. За ваши деньги, разумеется.
🔀 Тихий даунгрейд в продакшене
Anthropic разделил релиз. Mythos 5 — модель без цензуры для спецслужб и доверенных партнеров (Project Glasswing). Fable 5 — публичная версия.
Они поставили на входе отдельный классификатор-вахтер. Если ваш промпт пахнет кибербезом или разработкой биооружия, запрос втихую перерубается на старую модель Claude Opus 4.8.
С точки зрения бизнеса — гениальный костыль. Вы не получаете отказ, вы просто получаете снижение IQ модели. 95% юзеров даже не заметят, что их спустили на лигу ниже.
Плюс, Anthropic принудительно включает 30-дневное хранение всех логов для Mythos-класса, даже для Enterprise-клиентов.
Ждем, что в следующем релизе с модельками нужно будет смотреть сериалы по вечерам, чтобы они отдыхали и продолжали работать. | 852 |
| 12 | Отпеваем промпт-инженеров и вайб-кодеров ❓
Если вы до сих пор сидите в веб-интерфейсе условного Claude и руками пишете ему портянки текста, пытаясь уговорить выдать рабочий код — вероятно, вы уже отстали.
Руководитель разработки Claude Code Борис Черный сформулировал отличную мысль:
"Моя работа теперь — писать циклы, а не промпты для Claude".
Питер Штайнбергер из OpenClaw это повторяет, а Отман Хадри (фаундер Yalc) развернул эту мысль. Сейчас использование AI сводится к следующим фактам:
1️⃣ ИИ уже сейчас пишет код лучше большинства рядовых инженеров.
2️⃣ ИИ пишет промпты для другого ИИ намного эффективнее, чем это делает кожаный мешок.
3️⃣ ИИ научился удерживать контекст в рамках большой и сложной задачи.
4️⃣ Вы больше не должны писать промпты. Вы должны проектировать циклы работы агентов.
Когда вы сидите в чатике с ChatGPT или Claude, вы можете позволить себе быть нечетким. Нейронка что-то выдала, вы посмотрели: "Не, сделай кнопку красной, а логику базы данных перепиши вот так". Вы корректируете генерацию на лету, исправляя косяки. А тут речь про агентные воркфлоу. Вы строите систему, в которой ИИ-агент пишет код, другой агент его проверяет, отдает фидбек первому, и они крутятся в этом цикле, пока задача не будет решена.
При этом нужно заранее прописать жесткие ограничения, четкие правила завершения задачи и условия, при которых скрипт должен остановиться и запросить аппрув человека. Нужно очень четко формализовать, как именно выглядит критерий "хорошо" и "задача выполнена".
Способность перекладывать свое инженерное мышление в жесткие правила валидации и строить системы контроля — это сейчас актуально. А вот работать прокладкой между браузером и чат-ботом... | 903 |
| 13 | Kimi Code CLI: новый AI-агент для терминала
Moonshot AI выкатили в опенсорс Kimi Code CLI. Вместо очередного веб-враппера они сделали нативный TUI-клиент для терминала. В чем преимущества и особенности очередного терминала?
🟢 Ноль зависимостей. Это единый бинарник. Вам не нужен Node.js, не нужно жонглировать версиями npm-пакетов или править $PATH. Ставится одним скриптом, TUI стартует за миллисекунды.
🟢 Изоляция контекста (Сабагенты). Главная боль работы с LLM — агент неизбежно засирает контекст мусорными поисками по файлам. Здесь это решено изящно: главный агент только планирует и делегирует. Для грязной работы он спавнит сабагентов (coder, explore, plan) с полностью изолированным контекстом. Они шуршат по репе параллельно и возвращают только чистую выжимку. Главный тред не деградирует от мусора.
🟢 Поддержка Agent Client Protocol. Не хотите сидеть в терминале? Бинарник нативно говорит по ACP. Прописываете пару строк в конфиге Zed или JetBrains, и редактор сам дергает агента через stdio. Никаких тяжелых плагинов и подписок.
🟢 Видео-инпут. Можно просто дропнуть в чат скринкаст с UI-багом. Агент сам разберет кадры и пойдет искать, где поехала верстка, вместо того чтобы вы пытались описать визуальный глитч текстом.
🟢 Нативный MCP и хуки. Model Context Protocol настраивается прямо в диалоге (/mcp-config), без ковыряния JSON-ов. Плюс есть нормальная система хуков: можно повесить локальный скрипт на событие и, например, заблокировать выполнение деструктивных bash-команд до аппрува.
Исходники тут: MoonshotAI/kimi-code
Дока: Kimi Code Docs | 906 |
| 14 | Есть такой рейтинг ВУЗов по качеству подготовки специалистов в сфере ИИ "по качеству подготовки специалистов в области искусственного интеллекта".
Я бы только поправил, что речь не про качество подготовки. Нигде нет никаких сакральных знаний, а любая академическая программа отстает от рынка минимум на 2-3 года by design.
Они в топе, потому что там самые жесткие фильтры и самая благоприятная среда (в т.ч. из-за фильтров). И работодатели за это их любят.
Я бы без каких-то принципиальных поправок раскатал бы это на всё IT (если в ВУЗе с передовыми технологиями всё ок, то вообще с IT, как правило, тоже).
Хотите поступать на что-то айтишное — желательно выбирать из первых пяти позиций.
Кстати, меня периодически приглашают вести блоки на совместных магистерских программах в ВШЭ (1 место) и УрФУ (пока седьмые!).
Так что если доберетесь до топов — есть высокий шанс, что мы с вами встретимся. 😉 | 1 094 |
| 15 | Как удалёнка убивает карьеру джунов и кукуху синьоров 📉
Все последние два года индустрия стонет: «Злой ИИ забирает работу у начинающих специалистов! ChatGPT пишет код, джуны больше не нужны!».
А может, все воюют не в ту сторону?
Свежее исследование LSE и Ellison Institute опровергает популярный нарратив о том, что джунов заменили нейросети. Ребята проанализировали 243 млн резюме и 407 млн вакансий. Спойлер: найм начинающих специалистов действительно рухнул (в США на 29% с доковидных времен).
Но когда исследователи разделили влияние подверженности профессий автоматизации (ИИ) и переходу на удаленку, то влияние ИИ на падение найма статистически неотличимо от нуля. Зато фактор удаленки коррелирует с провалом найма железобетонно
Бизнес осознал: менторить и контролировать джуна по зуму — это логистический ад и слив денег. Обучение на рабочем месте и передача неявных знаний не работают через созвоны по расписанию и перекидывание тикетов. Организационное трение настолько высоко, что компаниям тупо дешевле вообще не инвестировать в ранние таланты, чем пытаться онбордить их асинхронно.
Цена работы в трусах 💊
Окей, с джунами понятно. А что с опытными ребятами, которые выбили себе фуллтайм ремоут и сидят с ноутбуками на диване?
Появилось большое исследование в Science (на 588к человек). Оказывается, удалёнка методично и уверенно разрушает психику.
Ученые сравнили людей в таких профессиях с теми, кто физически обязан быть на месте. И цифры там отнюдь не про work-life balance.
Что получилось:
🟠 Те, кто ушел на удаленку, стали проводить в одиночестве на 1,2 часа в день больше.
🟠 У удаленщиков вероятность провести весь день вообще без человеческого контакта выросла на 72%.
🟠 По оценкам исследователей, именно удалёнка ответственна за 36% всего национального роста ментальных расстройств в США за последние годы.
Особенно жестко кроет тех, кто живет один. Для них вероятность провести день в абсолютном вакууме взлетела на 83%.
Результат? Катастрофическое падение менталочки. Согласно исследованию, рост удаленки ответственен примерно за треть всего национального роста психологических расстройств с 2011 года. У удаленщиков поползли вверх показатели по клинической шкале дистресса K-6, а также резко выросло потребление антидепрессантов и частота обращений к мозгоправам.
И нет, это не потому, что у них "появилось время на врачей". Посещения обычных терапевтов или рецепты на таблетки от холестерина у этой группы не выросли. Только кукуха.
Люди думали, что работа из дома — это абсолютная свобода. А по факту это изоляция, где граница между спальней и офисом стёрта окончательно. Кратковременный комфорт от того, что не нужно ехать в метро, обернулся для многих долгосрочной депрессией.
Все так яростно боролись за право не выходить из дома, а в итоге за свой же счет построили себе идеальные одиночные камеры.
Что с этим делать? 🤔
Если вы джун и хотите выжить в 2026 году — ищите гибрид или фулл-офис. Приходите туда, мозольте глаза, задавайте тупые вопросы вживую, впитывайте контекст. Сидя дома, вы проиграете конкуренцию не нейросетке, а чуваку, который сидит в одном кабинете с лидом.
Если вы синьор и чувствуете, что выгораете — возможно, дело не в тасках, а в том, что вы одичали в четырех стенах.
В общем, возвращение в офисы (хотя бы частичное) неизбежно, оно уже активно происходит. Не потому, что корпорации злые, а потому, что биологию и социальные инстинкты не обманешь. | 1 186 |
| 16 | Эх 🥲 | 1 198 |
| 17 | Разработчики Rust устали от ИИ-мусора и выкатили жесткие правила ⚙️
Команда ядра rust-lang/rust, устав разгребать сгенерированный шлак в пулл-реквестах, выкатила черновик регламента по использованию LLM при контрибьюте в проект.
Главный постулат их документа звучит так: LLM — не замена мышлению. И использовать их нужно для того, чтобы писать лучше, а не быстрее.
Давайте разберем основное из их правил. Спойлер: многим любителям бездумного копипаста это сильно не понравится.
❌ Что под тотальным запретом
🟠 Генерация документации и комментариев. Никаких doc-comments или текстов ошибок компилятора от лица нейросетей. Текст, изначально сгенерированный LLM, задает отвратительный, водянистый стиль, который потом невозможно вытравить никаким редактированием.
🟠 Ответы в Issues и PR от лица LLM. Если вы закидываете чужой код в ChatGPT и несете ответ как свое мнение — вас забанят. Ревью кода должно содержать вашу личную экспертизу.
🟠 AI-ревью как финальное решение. LLM-боты могут быть только советчиками. Мержить код только потому, что «нейросеть так сказала» — запрещено. Человек-ревьюер обязан взять ответственность на себя.
✅ Что можно (и нужно)
🟢 Приватное использование. Никого не волнует, что вы делаете у себя в подвале. Задавайте ChatGPT глупые вопросы по архитектуре компилятора, просите объяснить код, пишите утилиты для локальной разработки. Это отличный инструмент для онбординга.
🟢 Тривиальные изменения. Поправить опечатку или линку в маркдауне с помощью ИИ — пожалуйста.
🟢 Поиск багов. LLM нашла баг? Отлично, но репортить ты его должен сам, предварительно верифицировав и написав нормальный PoC.
⚠️ Спецрежим: Экспериментальный код от ИИ
Они оставили окно для экспериментов с кодом, изначально написанным LLM, но обвесили его жесткими флажками:
1️⃣ Вы обязаны заранее договориться с ревьюером, что притащите сгенерированный код. Для новичков (без траста) это обязательное условие.
2️⃣ Изменения не должны затрагивать критичные для безопасности (soundness) компоненты.
3️⃣ Код обязан быть идеально покрыт тестами. В документе прямым текстом сказано: отмазки в духе "писать тесты было сложно" не принимаются. Нет тестов — PR закрывается. Нейросети упрощают написание тестов, так что спрос будет вдвое строже.
4️⃣ Обязательная маркировка ai-assisted.
Но самое главное в документе — секция Responsibility (Ответственность).
Ваши контрибьюты — это ваша ответственность; вы не можете переложить вину на LLM.
Аргумент «мопед не мой, это ChatGPT так написал» больше не работает. Вывалил нерабочий мусор? Отвечаешь ты 🫵 | 1 257 |
| 18 | Как корпорации подкармливают Open Source (и зачем им это нужно) 🦴
OpenAI выкатили обновление программы Codex for OSS. Если вы мейнтейнер мало-мальски значимого репозитория, вам предлагают:
▫️ 6 месяцев бесплатного ChatGPT Pro (с Codex).
▫️ API-кредиты для интеграции нейронок в процессы разработки и CI/CD.
▫️ Доступ к Codex Security (для глубокого анализа уязвимостей, рассматривается вручную из-за мощностей GPT-5.4).
Можно было бы пустить слезу умиления от такой заботы об экосистеме, но давайте смотреть на вещи прагматично. В этом шаге нет никакого чистого альтруизма, только холодный бизнес-расчет 🥶
1️⃣ Возврат долгов. Модели OpenAI (как и любые другие) обучаются на том самом Open Source коде. Без этих ребят, которые ночами закрывают уязвимости, качество генерации кода улетело бы в трубу. Выдать им немного бесплатных вычислительных мощностей — это буквально самое дешевое, что может сделать корпорация для поддержания кормовой базы.
2️⃣ Инфраструктурная игла. Если мейнтейнер на бесплатных кредитах автоматизирует ревью кода, релизные циклы и проверку безопасности через API OpenAI, проект плотно садится на их инфраструктуру. Да, они заявляют, что вы можете кодить в чем угодно (хоть в Cline, хоть в OpenClaw), но под капотом автоматизации репозитория будет крутиться их движок.
Тем не менее, для самих разработчиков это отличная сделка. Глупо отказываться от хорошего инструмента, если он экономит вам часы рутины. Если вы тащите на себе какой-то полезный библиотечный кусок или утилиту, у которой есть звезды на GitHub и загрузки — идите и заполняйте заявку. Дадут — отлично. Не дадут — вы ничего не потеряли. | 1 152 |
| 19 | Почему называть ИИ «коллегой» — это выстрел в ногу бизнесу 🔫
Умные ребята из Бостонского университета и BCG выкатили отличное исследование. По их данным, 23% компаний уже начали официально вписывать ИИ-агентов в свои оргструктуры. Дают им должности, имена, роли и рисуют квадратики на схемах рядом с живыми людьми.
В рамках эксперимента руководителям дали на ревью документы с зашитыми туда ошибками. Текст везде один. Разница была только во вводных, откуда этот драфт взялся:
1️⃣ Это сгенерил ИИ-инструмент (AI tool).
2️⃣ Это написал живой человек, твой новый подчиненный.
3️⃣ Это написал ALEX-3, новый «ИИ-сотрудник».
Казалось бы, какая разница, как маркетологи называют скрипт? Но это ломает всю систему контроля качества. Как только ИИ-агента называли «сотрудником» (при условии, что в компании это легитимная практика), качество человеческого ревью падало на 16%. Люди банально пропускали баги.
Авторы вывели шикарную модель того, как ломается мозг менеджера:
▫️ ИИ как инструмент (Tool). Если ты написал код в IDE с автокомплитом или нагенерил в ChatGPT — ответственность полностью на тебе. Это твоя работа, ты смотришь в оба.
▫️ Живой человек (Human). Когда ты делегируешь задачу кожаному джуну, включается классический надзор. Люди склонны лениться, халтурить и косячить. Ты это знаешь, поэтому пристально ревьюишь пулл-реквест.
▫️ ИИ-сотрудник (AI Employee). Попадает в слепую зону. ИИ не халтурит и не устает, поэтому следить за ним, как за хитрым стажером, вроде бы не надо. Мозг расслабляется. Но раз он теперь формально «коллега», то и ответственность за косяки размывается.
В итоге происходит магия: руководитель перекладывает ответственность на железяку (доля личной ответственности в ответах падала на 9%), не находит ошибки, но при этом начинает заниматься защитной бюрократией — чаще эскалирует задачу на дополнительное ревью другим людям (рост на 44%), чтобы прикрыть задницу.
Итого: как только вы очеловечиваете агента, люди подсознательно перестают за ним убирать и начинают спихивать на него ответственность за упавший прод. | 1 |
| 20 | Идеальный шторм в IT: почему закончилась халява и отвалились пайплайны 📛
Российскую разработку сейчас зажали в тиски с двух сторон. С одной стороны — экономика и ИИ, с другой — ковровые инфраструктурные блокировки.
Вот CNews радует статистикой: медианная зарплата застряла на уровне 183к, количество вакансий упало на 25%, а нанимать начинающих никто не хочет, а кандидаты вынуждены принимать офферы вообще без торга. Аналитики заламывают руки и винят во всем экономику и нейросети.
Инициатива в найме полностью перешла к работодателям. Качать права на собеседовании могут только те, кто решает нетривиальные задачи бизнеса и приносит деньги. И сюрприз: ML-инженеры, Data Engineers и LLM-ops как были супервостребованы, так и остаются. Потому что именно они строят и поддерживают те инструменты, которые обесценивают труд всех остальных 😈
Но если вы думали, что конкурировать придется только с AI, то вот вам добавка от Коммерсанта. Весенние блокировки VPN-протоколов начали массово ломать процессы разработки. Отваливаются международные репозитории, CI/CD пайплайны и облачные среды.
Роскомнадзор, конечно, рапортует про "белые списки", но по факту автоматизированные операции, которые летали за 10 минут, теперь требуют часов ручной возни девопсов, бубнов и такой-то матери 🪘
Бизнесу не нужны люди, которые просто пишут код. Бизнесу нужны люди, которые решают проблемы в условиях жестких ограничений. И за это они по-прежнему готовы платить. | 1 181 |
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
