ar
Feedback
AI-Driven Development. Родион Мостовой

AI-Driven Development. Родион Мостовой

الذهاب إلى القناة على Telegram

Увлекательно рассказываю про AI в разработке, про построение продуктов с LLM под капотом и иногда про .NET. Связь: @rodion_m_tg Чат: @ai_driven_chat

إظهار المزيد
5 142
المشتركون
لا توجد بيانات24 ساعات
+427 أيام
+9830 أيام
أرشيف المشاركات
Начинает, друзья - https://www.youtube.com/watch?v=lbsBHC5BR8I

Сегодня в 14:00 МСК продолжаем разбираться в Full-Cycle Agentic Engineering вместе с Денисом @deksden_notes. Сегодня больше будем говорить про практическую часть: * Флоу артефактов: откуда что берется из документов и как собирается * CLI: особенности организации фронтенда для быстрого тестирования * Memory bank: как устроен и как с ним работать * Vertical slices: принципы архитектуры, удобной для агентов * Связка сценариев и UI QA: POM, data-test-id, автотесты * Кросс-эпик сценарии (что бы это ни значило) Стрим проведем в ютубе, ссылка будет ближе к встрече. Событие тут: https://luma.com/904bned9 Запись будет.

Repost from GDG Almaty
🌸 GDG Almaty Spring Meetup уже через 2 дня 11 марта 2026 года в 19:00 мы встречаемся в MOST IT Hub 📍 Алматы, ул. Ходжанова
🌸 GDG Almaty Spring Meetup уже через 2 дня 11 марта 2026 года в 19:00 мы встречаемся в MOST IT Hub 📍 Алматы, ул. Ходжанова 2/2, БЦ Fortis Это будет весенняя встреча сообщества GDG Almaty — для тех, кто делает технологии, продукты и стартапы. В программе — доклады про: • AI и облачную инфраструктуру • No-code / Low-code и будущее разработки • мобильную разработку и практический опыт инженеров из индустрии Будет много общения, идей и людей, которые строят технологические продукты в регионе. Если вы в Алматы — приходите. Регистрация: https://gdg.community.dev/events/details/google-gdg-almaty-presents-gdg-almaty-spring-meetup/ До встречи 11 марта 🚀 #GDG #Almaty #TechCommunity #Developers #AI #MobileDevelopment #NoCode

Мои друзья из GDG Алматы проводят эту среду проводят митап. Попросили репостнуть, что я с удовольствием делаю. Так что, приходите все желающие, и я тоже постараюсь заглянуть на огонек.

Продолжаем в YoutTube: https://www.youtube.com/watch?v=O3RKuenDtK4

Митап: Agentic Engineering полного цикла или как сгенерировать пару десятков тысяч prod-ready кода Друзья, вы тоже замечали, что использовать кодагентов в разработке можно очень по-разному? Кто-то на пару с AI агентом становится эффективнее на 10%, а кто-то на 1000%. Так вот, Денис, наш завтрашний эксперт, явно из второй категории. Уже в этот четверг Денис (автор канала @deksden_notes) покажет нам свой воркфлоу агентной разработки. Из известных мне вайб-кодеров экспертов по агентной разработке, Денис, пожалуй, абсолютный чемпион по расходу токенов - агенты, генерирующие тысячи строк кода в параллель для него совершенная обыденность. Но интереснее всего - это воркфлоу Дениса, а именно все то, что происходит до кодогенерации (спека, планирование) и после нее (верификация, тестирование). На встрече Денис расскажет про свой протокол агентной разработки поделиться наиболее ценными инсайтами из своего воркфлоу. Кстати, свой протокол разработки Денис подробно описал в своем канале (получилось аж 9 постов), поэтому могу смело рекомендовать сие чтиво: https://t.me/deksden_notes/197 Дата и время: 6 марта 16:00 МСК. Ссылка на регистрацию: https://luma.com/e7clxtiw @ai_drivenAI-Driven Development

Внимательно слежу за творчеством Андрея Бреслава и его нового продукта CodeSpeak и интересно, на сколько мы в одну сторону думаем - только на днях я написал о важности тест-системы (верификации изменений), а ребята так же на днях выпустили новую фичу для автоматизации покрытия Python-проекта тестами: https://codespeak.dev/blog/coverage-20260302 Интересно, будем пробовать. Ещё, CodeSpeak умеет генерировать код по спеке и наоборот спеку из кода - в принципе, сейчас и обычные агенты с таким неплохо справляются при должной сноровке, но поскольку Андрей супер-профессионал (создатель языка Kotlin на минуточку), есть высокие шансы, что CodeSpeak сможет выдавать сильно более качественный результат. Постараюсь вытащить Андрея на интервью к нам на канал. А на очереди у меня как раз пост про повышение верифицируемости кодовых баз на Python. Кто уже успел попробовать CodeSpeak - поделитесь фидбеком, очень интересно как это на практике работает, особенно на средних и больших проектах. @ai_driven

Промпт-инжиниринг умер... или нет? Действительно, нынешние модели (reasoning версии, прежде всего) теперь менее капризны и придирчивы к промптингу, но тем не менее все еще остается множество нюансов, которые следует учитывать при создании/отладке промпта. И часть из них совсем неочевидны. Мы в CodeAlive постоянно улучшаем наши промпты и какое-то время назад прямо через промпт сделали файлы, на основе которых генерируется ответ кликабельными (LLM просто оборачивает название файла в ссылку). Сделали, написали тест - все ок. Но через какое-то время мы заметили, что чатик периодически выплёвывает сырые XML-теги прямо в ответ. Пользователь спрашивает про код, а ему в ответе почти рандомно вылетает <repository_links>. Вроде мелочь, но выглядит как баг - надо фиксить. Короче, как вы уже поняли, проблема оказалась в промпте - мы активно используем технику с XML-тегами для структурирования инпута в LLM, и в некоторых местах, когда нужно сослаться на конкретную секцию писали что-то вроде "в секции <smthng> лежат ссылки на репозитории" - так вот, этот нюанс, что мы ссылались именно через тэг и создавал тот неприятный артефакт в ответе от LLM. В принципе, починилось это простым выпиливанием скобок (типа "см. секцию repository_links"). Ну, в общем, чтоб во всех этих техниках, ошибках и мис-юзах не утонуть, я, уже по традиции, соорудил скилл для вашего агента, который умеет как писать новые промпты, так и проводит аудит существующих - техник и ошибок там довольно много всяких с четким описанием юзкейсов, так что в должно быть полезно всем, кто хоть как-то соприкасается с промптингом. Скилл: https://github.com/CodeAlive-AI/prompt-engineering-skill Ставится одной командой: npx skills add CodeAlive-AI/prompt-engineering-skill — Кстати, про автоматизированную отладку и улучшение промптов (мета-промптинг) я уже рассказывал в своем посте - ведь как бы здорово вы не написали промпт, все равно нужно провести ряд экспериментов конкретно на вашей LLM, чтобы убедиться, что все работает корректно. Расскажите в комментариях о ваших факапах с промптингом и неочевидными техниками, которые пришлось применить, чтобы достичь желаемого результата. @ai_driven

Друзья, начинаем митап про AI кодинг в больших проектах через 5 минут. Приходите! "Во всех кионтеатрах всех стран", :)) выбирайте что душе угодно. Ссылка на Зум в Luma: https://luma.com/event/manage/evt-AuFhLXtqp1DlqGi/overview Трансляции: https://www.youtube.com/live/F2cpHNF0Jwg https://rutube.ru/video/private/93a8d325a1a8be7dccc785542fe9a1ae/?p=PEbI8DRIhdVL1CAamGDD6w Важно: Смотреть можно откуда угодно, но вопросы читаем только из Зума.

Тест-система как гарант качества AI-generated кода Я пишу большой гайд о том, как грамотно использовать и получать высококачественный результат от AI-агентов и многоуровневая надежная тест-система там является центральной фигурой, эдакой страховочой сеткой (safety net), гарантирующей корректность кода на выходе. И ключевая идея подхода, который я продвигаю в том, что следует стремиться к такой тест-системе, которая будет ловить 100% проблем и багов еще до того как они попали на прод - т. е., цель тест системы в том, чтобы баги не доходили до прода в принципе. И дальше самое важное - если вдруг какой-то баг дошел до прода - значит, это, прежде всего, баг тест-системы - значит, мы где-то облажались с дизайном тест-системы. И вот тут важно, прошу заметить, что в моей парадигме к "тестам" системы относятся не только классические юнит/интеграционные/e2e тесты, но и PRD assessment, review спеки, review кода и прогон статическим анализатором и визуальные тесты - это все очень важные части тест-системы. Более детально именно составляющие тест-системы я напишу в отдельном посте (хотя, фактически, там описание каждого этапа заслуживает отдельного поста :)) В качестве примера - упрощенный протокол по исправлению бага:
1. Разберись, что сломалось и придумай как это воспроизвести. Что-то непонятно - спроси, не гадай.
2. Воспроизведи баг через тест - если воспроизвести невозможно, явно скажи об этом с обоснованием.
3. Найди настоящую причину. Не симптом, а корень.
4. Придумай грамотный фикс, а не костыль. Если тянет на большой рефакторинг — остановись и спроси меня.
5. Почини с минимальными правками, чтобы не аффектить другие части системы.
6. Запусти тест. Тест зелёный? Соседние тесты не сломались? Идём дальше.
7. Оглянись: раз тест система не поймала эту проблему, значит пласт подобных проблем может быть где-то ещё в проекте - проведи глубокое ревью и найди подобные проблемы.
8. И теперь главное - почему наша тест-система упустила этот баг? Проведи аудит тест системы и найди способом улучшить тест-систему так, чтобы не допустить подобные проблемы в будущем.

Каждый баг-фикс — это два фикса: код и патчинг тест-системы, которая его проморгала.
Полностью протокол тут: https://github.com/CodeAlive-AI/ai-driven-development/blob/main/BUG-FIX-PROTOCOL.md P.S. Этот протокол предполагает, что принцип работы тест системы вашего проекта описан в папке docs/test-system. Ещё, из этого протокола легко генерится скилл. Поделитесь в комментариях какие интересные техники вы применяете для верификации изменений от AI и какие инсайты для себя открыли на этом пути? @ai_drivenAI-Driven Development

AI-Driven Development: Новый сезон Давненько ничего не писал сюда - уж очень был увлечен и стартапом и адаптацией кодбазы под агентов. Материалов и экспертов накопилось множество, поэтому я возобновляю и блог и YouTube канал. AI-Ready Codebase Открываем сезон с Максимом, автором канала Этихлид с разговором о том, что на практике нужно сделать в больших кодовых базах, чтобы получать от кодагентов желаемый результат. О чем будем говорить с Максимом — Почему большой проект нельзя просто «бросить в агента» и что делать вместо этого — Иерархия MD-файлов как навигационный слой поверх кода: архитектура, сущности, процессы — Минимальный набор документации для legacy-проекта: что писать и в каком объёме — Онтологии и графы зависимостей: зачем строить и как поддерживать — Агенты для исследования legacy: формат «поставил — подождал — получил отчёт» — Граундинг на существующий код при внедрении новых фич: как агент находит противоречия раньше людей — Проблема памяти агентов и почему MD-файлы пока лучшее, что у нас есть Встречи проходят Live, поэтому будет возможность задавать вопросы спикерам. Дата и время: вторник 3 марта 16:00 МСК. Длительность: 1.5 часа. Расписание новых встреч (под спойлером, чтобы с толку не сбивало :)) Четверг 5 марта 16:00 МСК встреча с Денисом DEKSDEN (автор канала @deksden_notes) про его флоу агентной разработки для генерации десяток тысяч строк prod-ready кода. Пятница 6 марта 13:00 МСК - встреча с Иваном Закутным (автор канала @neuralstack) про First Principle Framework в контексте агентной разработки и инструмент quint-code. Чуть позже будут еще анонсы, следите за каналом. А если вы знаете интересных гостей, которым есть что полезного рассказать - пишите свои предложения в личку или в комментарии к этому посту. @ai_driven

Психотерапевт для Claude Code или пусть он настроит себя сам А вы знали, что можно настраивать Claude Code, прямо через Claude Code? Для этого достаточно написать в чат, например: > Добавь хук, который блокирует глобальные rm -rf команды > Добавь хук, который спрашивает разрешение на команды с 'db reset' или так: > Установи Grafana MCP > Измени мой API-ключ CodeAlive в конфиге MCP Классно же? Так вот, я удивлюсь если вы знали о такой возможности, потому что в действительности в дефолтном Claude Code такая возможность отсутствует. Поэтому я сделал плагин, который позволяет вносить в настройки CC почти любые изменения, просто написав об этом текстом самому клоду, как в примерах выше - плагин так и называется Claude Code Reflection. Что еще входит в плагин: Управление скиллами Просмотр, настройка, удаление, перемещение user scope - project scope и даже ревью. Управление субагентами Создание, изменение и удаление субагентов с корректными разрешениями. Создание и публикация плагинов Сделали классный скилл или скиллы и хотите упаковать их в плагин и отдать в пользование этому миру? Не проблема, claude-plugins-manager скилл там как раз для этого. Напомню, что поскольку весь функционал плагина реализован в виде скиллов, они очень экономны к контексту (менее 500 токенов в сумме). Ну, и бонусом: Claude Best Practices Skill Скилл проверяет, на сколько хорошо ваш проект (кодовая база) и сам клод оптимизированы под эффективную работу Claude и фактически делает аудит контекста и кода, и дает рекомендации по оптимизации. Еще, это скилл можно в принципе поспрашивать про актуальные лучшие практики CC. --- Устанавливается двумя командами. Запускаем claude и:
# Сначала добавляем маркетплейс, чтобы плагин появился в поле зрения
/plugin marketplace add https://github.com/CodeAlive-AI/claude-code-reflection-skills.git
# Теперь ставим сам плагин
/plugin install claude-code-reflection-skills@claude-code-reflection-skills
Теперь перезапускам Claude Code и вуаля - теперь ваш клод как после сеанса к психотерапевту, прокаченный рефлексией. Код, конечно, открыт, а звезды приветствуются: https://github.com/CodeAlive-AI/claude-code-reflection-skills Кстати, пока я занимался этими мета-скиллами, осознал сколько же всевозможных сущностей с разными нюансами появилось в CC, отсюда возникла идея для нового стрима с разбором всего этого разнообразия и практическими кейсами под каждую сущность, интересно ли кому-то такое? @ai_driven

Через 5 минут начинаем митап про SWE-бенчмарки с Ибрагимом, автором SWE-rebench. Ссылка на встречу в комментарии к этому посту.

Разбор SOTA агента от Ильи Рис - победителя ERC3 Ну что, друзья как начался ваш год? Надеюсь, что хорошо и что вы отдыхаете! Пока все отдыхают, мы с Ильей собрались и записали бомбическое интервью об архитектуре его AI-агента, который недавно взял первое место в соревновании ERC-3 Рината Абдулина среди агентов на базе опенсорс моделей. В итоге получился великолепный материал по Context Engineering в мультиагентных системах. Поэтому хочется отдельно сказать спасибо Илье за такую открытость. Напомню, кстати, что статья Ильи про архитектуру его RAG системы, наверное, является наиболее залайканым материалом по RAG на Хабре за все время (+161!). Мне было особенно интересно разобрать именно решение Ильи, т. к. мне часто приходится общаться с энтерпрайзами и банками, а они очень уж любят открытые модели и почти не используют проприетарные. В общем, без лишних слов - тот редкий случай, когда множество инсайтов обеспечены даже матерым агентоводам. Запись интервью-разбора: https://youtu.be/3JYHMMw5WSU Таймкоды: 00:00:02 Вступление. Илья Rice и его победа в бенчмарке агентов ERC-3 00:06:03 Что из себя представляет соревнование ERC-3: симуляция энтерпрайз среды 00:13:39 Open Source решение и инструмент визуализации трейсов 00:18:07 Архитектура решения: определение пользователя (WhoAmI) и прав доступа 00:24:14 Динамический системный промпт: как не засорять контекст 00:38:06 Хак с пагинацией: Wrapper для API инструментов 00:41:14 Структура ответа агента: State, Plan, Action, Function 00:44:02 Почему отказались от нативного Tool Calling в пользу Structured Output 00:51:13 Стоит ли верить публичным бенчмаркам? 00:55:45 Разбор реального кейса: задача по смене статуса проекта 01:03:30 Почему не использовали классический RAG 01:05:58 Динамическая подгрузка инструкций для инструментов 01:11:14 Валидатор (The Validator): отдельная LLM для проверки действий агента 01:21:43 Работа с контекстом: работа с ошибками агента 01:33:20 Техника Sliding Window: обрезка истории для экономии внимания модели 01:36:05 Store Benchmark: Оркестратор и специализированные субагенты 01:44:26 Выбор моделей: почему Open Source 01:45:41 Заключение Исходный код агента Ильи: https://github.com/IlyaRice/Enterprise-RAG-Challenge-3-AI-Agents Трейсы агента: https://ilyarice.github.io/Enterprise-RAG-Challenge-3-AI-Agents/ Чат с исходным кодом агента в CodeAlive: https://app.codealive.ai/public/chat/3geNycM--lLbA3vxL272vA P. S. А уже в этот вторник 6-го января в 12:00 по Лондону, 13:00 по CET, 15:00 по МСК и 17:00 по Алматы состоится встреча с Ибрагимом - автором SWE-бенчмарка SWE-rebench и автором тг-канала @c0mmit. Добавляйте событие в календарь, чтобы не забыть.

Прожарка UX через 45 минут в прямом эфире Хороший продуманный UX всегда был редкостью - до сих пор остается огромное множество красивых, но совершенно непонятных и неудобных интерфейсов - причем, как в дорогих продуктах, так и в AI-generated интерфейсах. Если AI уже прекрасно генерирует интерфейсы почти любой сложности, то абсолютно не факт, что эти интерфейсы будут понятны вашим пользователям. Это как раз та проблема, с которой мы столкнулись в CodeAlive. К счастью, нам повезло посотрудничать с очень опытным UX-специалистом, он помог нам провести несколько сессий и выявить ключевые проблемы в наших флоу. Поскольку я повсеместно вижу неудобные приложения и периодически сам страдаю от этого - в целом, я вижу определенную миссию в распространении знаний о том, что такое хороший UX. Так вот, совместно с Алексеем Тушкановым мы запускаем новый эксперементальный формат прожарки UX ваших интерфейсов. Мы собрали несколько реальных приложений и их фаундеров и в прямом эфире проведем разбор их интерфейсов по фреймворку Алексея. А заодно проверим, на сколько современный AI может быть полезен в задачах на улучшение UX. В общем, формат должен быть особенно интересен тем, кто вайбкодит создает свои приложения. Встреча сегодня в 17:00 по Алматы, 15:00 МСК и 13:00 по CET: https://calendar.app.google/WQd2qCRkTV7tmvZn8

Начинаем митап по Zenflow Подключайтесь по ссылке: https://us06web.zoom.us/j/82921157920?pwd=3BgZuT7UbBOQvq7piTpcDOb6s0v1NV.1

2 часа до митапа по Zenflow и SDD PRD/спека to production-ready code за ваншот - это реальность? Если решать задачу в лоб, то
2 часа до митапа по Zenflow и SDD PRD/спека to production-ready code за ваншот - это реальность? Если решать задачу в лоб, то, конечно нет. Но если как сдедует отревьюить спеку, создать по ней проработанный план и запустить этот план на поэтапную реализацию через оркестратор код-агентов, то задача становится куда более реальной. И продуктов, которые бы позволили автоматизировать все эти шаги сейчас на рынке почти нет. Zenflow Но хорошая новость в том, что ребята из Zencoder постарались элегантно объединить все шаги выше и назвали этот новый тул Zenflow - фактически, это оркестратор разных AI-агентов (надо отдать должное команде, что на старте есть возможность работать со сторонними агентами - Claude и Codex). Признаюсь, я давно ждал такой оркестратор и уже около недели пользуюсь этим продуктом. И он мне нравится. У меня накопилось некоторое количество вопросов по этому инструменту, поэтому я позвал Николая Андрейчука из команды Zenflow провести митап специально для аудитории нашего канала. Встречаемся сегодня в 16:00 по Алматы, 14:00 МСК, 12:00 по CET - https://calendar.app.google/E7LDGqdKebgCFqLZ7 Встреча пройдет в Zoom, поэтому у тех, кто подключиться в прямой эфир будет возможность задать вопросы Николаю. PS. А уже в этот вторник встречаемся на UX прожарку с Алексеем Тушкановым в 17:00 по Алматы, 15:00 МСК и 13:00 по CET. @ai_driven

Запись моего доклада про Context Engineering на Kolesa Conf + Анонсы встреч Недавно я выступил с докладом на самой масштабной конференции в Казахстане Kolesa Conf - спасибо ребятам из Kolesa Group за максимально проработанную подготовку и отличную организацию! В докладе я рассказывал в основном про грамотную работу с контекстом, а также о том, как готовят контекст AI агенты и специализированные инструменты на примере CodeAlive. Ссылка на запись: https://youtu.be/LKxGwFiSQD0?si=fCiOBhjWiGjksene Анонсы В понедельник 29 декабря на этом канале в прямом эфире проведем интервью с одним из создателей Zenflow в 16:00 по Алматы, 14:00 МСК, 12:00 по CET. Также ближайшее время ожидайте: 1. Интервью с CTO об опыте успешного внедрения AI в разработку 2. Интервью с одним из создателей SWE Rebench (популярный AI кодинг бенчмарк) 3. Интервью с одним из победителей ERC чемпионата по созданию AI агентов для энтерпрайз задач. 4. Прожарка UX AI-generated интерфейсов профессиональным UX дизайнером (кстати, можете уже присылать мне в ЛС @rodion_m_tg интерфейсы своих парк, мы выберем 5 лучших). Так что следите за каналом - будет интересно. @ai_driven