AI4Dev — AI for Development
前往频道在 Telegram
Что надо знать, чтобы остаться востребованным ИТ специалистом в мире с LLM? • Обзоры продуктов, фреймворков и способы взаимодействия с LLM для разработки софта • Реальные кейсы, pet и бизнес проекты с LLM • Публичные лекции В будущее берут не всех!
显示更多5 244
订阅者
+124 小时
+177 天
+8130 天
帖子存档
Вспоминаем формат дайджеста за неделю:
В ноябре прошёл AI Engineer Code Summit - событие со звёздными докладчиками из OpenAI, Anthropic, Google, Meta, Cursor, Netflix и других лидеров индустрии. В открытом доступе - 8 часов докладов, ориентированных на практикующих инженеров, которые пишут код с ИИ и для ИИ: работа с агентами, оптимизация кодовой базы под агентов, вот это все.
Обнаружили опенсорсный проект Mimir - векторную и графовую базу знаний для AI-агентов разработки. Работает на базе Neo4j, автоматически строит связи между задачами и хранит и шерит весь контекст для всех агентов навсегда. Создатели утверждают, что это идеальный вариант для долгосрочных проектов с мультиагентной работой и оркестрацией сложных задач. Сейчас 125 звёзд на GitHub.
Antigravity IDE - нам, как и многим, почему-то никак не удавалось авторизоваться на прошлой неделе в новой AI-среде разработки на базе Gemini от Google. Впрочем с выходом Opus 4.5 стало уже и не так интересно.
Новость недели, которую все знают - вышел Claude Opus 4.5: победил всех на всех бенчмарках, включая Gemini 3. Цена - $25 за output MTok. Тестируем: пока всем нравится. Ждём прикладных инсайтов и прорывов.
🎙Говорим о вайб-кодинге 28 ноября в 12:00!
Что случилось с понятием "вайб-кодинг" за этот год и чего ждать в следующем, расскажет Константин Чуйков — автор канала "Вайб-кодинг по Чуйкову" и лидер сообщества Vibe Coding Community.
🎥 В эфире:
→ Как вайб-кодинг появился и какую вызвал реакцию
→ Как изменились подходы и инструментарий
→ Как мы перешли из промпт-инженерии в контекст-инженерию
→ Как мы пришли к пониманию рабочего воркфлоу и spec-first подходу
→ Как изменился рынок найма
→ Бум курсов по вайб-кодингу
Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Константину!
Говорят, что поиск работы — это ещё одна отдельная работа... Как подойти к трудоустройству в ИТ системно? Своим опытом поделится Дмитрий Савелко, Senior Data Scientist (Сбер, Газпром, Точка Банк) и автор телеграм-канала Ebout Data Science.
⚡️ В эфире:
→ Как собрать данные о потенциальном работодателе и адаптировать рассказ о себе, чтобы продать свое умение решать их конкретную проблему
→ Играть с позиции изобилия, а не нужды, чтобы создать у нанимателя ощущение срочности и дефицита
→ Манипулировать ценностями: для BigTech — преданность и корпоративная культура, для стартапов — самостоятельность и готовность "вжаривать" для решения хаоса
→ Самопрезентация: уверенный голос, паузы и диалог "на равных"
→ Поиск работы как ML-проект: учет всех коммуникаций и анализ ошибок. Отказ — это не провал, а просто новый data point.
⏰ Запускаем трансляцию 27 ноября в 12:00.
Смотрите на YouTube, в ВК или прямо в этом канале!
P. S. Конечно, немного оффтоп для нашего канала, но тема настолько полемичная, что мы не удержались ☺️
Рассуждающие модели развиваются быстрее, чем пользователь успевает понять, как же они работают... LRM генерируют ответ через множество шагов — промежуточных вопросов и утверждений — и благодаря этому справляются с очень сложными задачами.
Доктор технических наук Владимир Крылов рассказал о новейших исследованиях, которые объясняют, как формируется ответ такой модели на промпт и как влияют на этот процесс нейронные паттерны активаций и внедрённые концепты.
Также в лекции:
→ базовые идеи устройства и принципы работы LRM;
→ ключевые алгоритмы и техники результативного рассуждения;
→ примеры применения этих моделей на практике.
Запись лекции доступна здесь и на других площадках:
➡️ YouTube
➡️ ВКонтакте
➡️ ЯндексМузыка
В последнее время часто всплывает опенсорс-тул для создания приложений - Spec Kit. Его авторы утверждают, что инструмент «помогает сосредоточиться на сценариях использования и предсказуемых результатах, а не на вайб-кодинге с нуля».
50 тысяч звёзд на GitHub звучит убедительно. Мы решили разобраться, что это за зверь, и сравнить его с нашим подходом.
1. Первое впечатление
Пожалуй, самый интересный из менеджеров разработки, что нам попадались. Но, как всегда, нюансы решают всё.
2. Наш эксперимент
Один и тот же разработчик, один и тот же проект: MVP веб-приложения на 5 ролей, у каждой роли по 4-6 разделов. Около 26 тысяч строк кода с тестами (в «прошлой жизни» это примерно год работы).
• чистый Claude Code - 3 дня
• Spec Kit + Claude Code - 5 дней
Результат: ускорение отрицательное.
3. Как это устроено
По сути, Spec Kit - это набор промптов поверх вашего агента (Claude Code, Cursor, Copilot и т. д.).
Сначала формулируете продукт и бизнес-требования, затем на их основе генерируете документацию, потом - задачи, и уже по ним пишется код.
Метод классный, даже прорывной, если до этого вы работали стихийно. Но когда процесс уже выстроен, он может добавить больше трения, чем скорости.
4. Ограничения
В процессе планирования инструмент выдал фразу, что он «хорошо работает с проектами до 50 задач», а дальше контекст разваливается. Не знаем, можно ли этому доверять - в документации Spec Kit такого нет.
Наш эксперимент был на проекте примерно в 200 задач. Возможно, на меньших проектах эффективность выше.
5. Почему у нас не взлетело
Мы и так начинаем с бизнес-требований, затем делаем техзадание, потом задачи - и в таком режиме работаем с агентами.
Spec Kit не дал принципиального улучшения, зато как только начинаются правки (а они начинаются всегда), появляется двойная каша: классическая от модели и новая - от методологии Spec Kit.
Стоит добавить кастомные инструкции - и Spec Kit теряет фокус: забывает собственные требования и стили кодирования, отключает тесты и т. д.
6. Ещё один барьер
Чтобы получить внятный результат, нужно уметь послать запрос во Вселенную формулировать бизнес-требования. Это ровно то, чего Spec Kit не решает. Он неплохо превращает бизнес требования в техзадание и таски, но принцип garbage in - garbage out всё ещё актуален. Вам все еще надо уметь описывать чего вы хотите. У нас для этого есть собственный инструмент - Аналитик-Кентавр, который помогает быстро формировать Видение проекта и User Stories.
Вывод
Хороший инструмент, если вы только начинаете систематизировать процесс.
Но если у вас уже есть сильный аналитический контур - пользы немного, а трений добавится.
P.S.
Пока мы всё это тестировали, кто-то уже успел написать инструкцию по использованию на Хабре!
Как фоновые агенты решат проблемы неэффективности дата-центров? Расскажет Максим Шаланкин, Machine Learning Team Lead из MWS.
⚡️В лекции:
→ Простаивающие мощности: как фоновые агенты превращают простой GPU и CPU в источник ценности.
→ Технические особенности работы LLM: где именно в инференсе появляются окна для запуска фоновых задач.
→ Фоновые агенты как новый слой инфраструктуры: автономные рабочие, встроенные в дата-центры и корпоративные системы.
→ Класс задач для фоновых агентов: исследование данных, безопасность кода, документооборот и рыночная аналитика.
→ Как считать пользу фоновых агентов: от загрузки железа и эквивалента майнинга до бизнес-метрик и ROI.
→ Стратегия компании в эпоху фоновых агентов: почему раннее внедрение даёт устойчивое конкурентное преимущество.
⏰ Запускаем трансляцию завтра, 19 ноября, в 12:30.
Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Максиму!
Рассуждающие модели развиваются быстрее, чем пользователь успевает понять, как же они работают... LRM генерируют ответ через множество шагов — промежуточных вопросов и утверждений — и благодаря этому справляются с очень сложными задачами.
Доктор технических наук Владимир Крылов расскажет о новейших исследованиях, которые объясняют, как формируется ответ такой модели на промпт и как влияют на этот процесс нейронные паттерны активаций и внедрённые концепты.
Также в лекции:
→ базовые идеи устройства и принципы работы LRM;
→ ключевые алгоритмы и техники результативного рассуждения;
→ примеры применения этих моделей на практике.
⏰ Запускаем трансляцию 13 ноября в 12:00.
Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы лектору!
Обсудили с Игорем Асоновым, как выбраться из карьерного кризиса с помощью ИИ. Игорь работает в онлайн-кампусе ВШЭ, руководит его центром аналитики и прогнозирует востребованность различных направлений обучения.
Это видео — небольшой оффтоп для нашего канала. Но, кажется, если коллега ML'щик делится собственным выстраданным опытом, такое лучше не пропускать ☺️
Итак, в этом выпуске:
→ Личная история поиска своего профессионального трека
→ Преимущества и недостатки кремниевого коуча
→ Метод взаимодействия с ИИ, который развивает, а не отупляет
→ Как ИИ влияет на систему образования (тесты бесполезны, а дети учат ChatGPT кукарекать)
→ Почему LLM в роли напарника — must have для современного специалиста
Запись доступна здесь и на других площадках:
➡️ YouTube
➡️ ВКонтакте
➡️ ЯндексМузыка
Вайб-кодинг — это не просто новый тренд, это философия разработки, где интуиция важнее идеального плана, а ИИ становится твоим со-пилотом в потоке.
Вместе с Александром Агафонцевым, экспертом по автоматизации с ИИ и автором телеграм-канала "ИИзи Бизнес", разбираем:
🔵Что такое вайб-кодинг и почему это будущее разработки?
🟣Как ИИ меняет подход к написанию кода?
🔵Почему "идеальная архитектура" иногда убивает скорость?
🟣Как найти баланс между хаосом и структурой?
🔵Реальные кейсы: что можно автоматизировать уже сегодня?
🟣Почему молодое поколение разработчиков кодит по-другому?
Запись интервью доступна здесь и на других площадках:
➡️ YouTube
➡️ ВКонтакте
➡️ ЯндексМузыка
Заходят как-то директор по развитию бизнеса, проджект-менеджер и аналитик в бар. А бармен им и говорит:
— Зачем вам троим Vision & Scope?
💥 Это и обсудим сегодня в 14:00.
Разберём, зачем нужен этот документ, из чего он состоит и как теперь его создают вместе с ИИ.
Подключайтесь к обсуждению на YouTube или прямо в этом канале!
Говорим о применении LLM в найме с Николаем Шейко — экспертом по внедрению ИИ в неайтишный бизнес, который строил HR-продукты для американских технологических гигантов. Он расскажет, как искусственный интеллект меняет рекрутинг, собеседования и найм персонала.
🔥 Обсудим:
→ Как ИИ уже изменил собеседования в BigTech
→ Можно ли обмануть ИИ-рекрутера (и стоит ли)
→ Какие навыки станут бесполезны, а какие — критичны
→ Как готовиться к собеседованиям в эпоху ИИ
→ Инсайды из разработки HR-систем для крупнейших компаний
→ Внедрение ИИ в найм вне IT: кейсы и ошибки
⏰ Запускаем трансляцию завтра, 6 ноября, в 14:00!
Смотрите на YouTube, в ВК или прямо в этом канале!
🔝Говорим о безопасности LLM с Сергеем Зыбневым — тимлидом-пентестером (белым хакером) и создателем телеграм-канала "Похек".
Обсуждаем:
🔵тестирование безопасности LLM и обнаружение уязвимостей;
🔵использование ИИ для поиска багов и тестирования безопасности;
🔵практический опыт работы с безопасностью ChatGPT и других LLM;
🔵вайб-кодинг: как изменилась разработка с приходом LLM;
🔵реальные кейсы из практики пентестинга;
🔵будущее AI в кибербезопасности.
Запись интервью доступна здесь и на других площадках:
➡️ YouTube
➡️ ВКонтакте
➡️ ЯндексМузыка
История диалогов с LLM в Cursor и Claude Code устроена чудовищно: сотни и тысячи сообщений улетают в трубу при обновлениях или переносе папки проекта, найти что-то двухнедельной давности при плотной работе практически нереально. А ведь там (я точно помню!) были настоящие алмазы и в вопросах, и в ответах. Поэтому вдохновитель и гуру вайбкодинга в нашей команде, Николай Докутович, собрал мощный вьюер Cursor & Claude Code History Viewer (Enhanced) — десктопное приложение, которое:
• подтягивает историю сообщений из Cursor и Claude Code;
• даёт быстрый полнотекстовый поиск по всем сессиям;
• показывает таймлайн и фильтры (дата, проект, файл, роль);
• считает базовую статистику (кол-во сессий/сообщений, диапазоны дат);
• работает локально, ничего никуда не отправляет;
• Mac/Win/Linux.
В основе открытый проект, к которому Коля избирательно и аккуратно добавил лучшие фичи из нескольких форков, допилил работу с Cursor, настроил через GitHub Actions сборки под три ОС (macOS, Linux, Windows) и добавил английскую и русскую локали (где-то ещё может проскочить корейский — не обессудь, вайбкодер). Github: исходники тут, скачать тут. Инджой!
В Claude Code появился полноценный sandbox (filesystem + network isolation). Теперь Claude может свободно править код и гонять bash-команды без постоянных permission-запросов, но строго внутри изолированной среды. В Anthropic утверждают, что количество подтверждений сократилось на 84%, а prompt-inject более не страшны.
Что даёт:
- Не дотянется до системных файлов (читать/писать можно только в разрешённых директориях);
- Сетевая изоляция, ходить можно только туда, куда разрешено, а отправить ваши SSH ключи и паспортыне данные га shady-server.biz не получится.
Всё остальное выполняется без лишних диалогов и подтверждений, ведь даже если Claude сойдёт с ума, он остаётся «в мягкой комнате».
Также появился Claude Code в облаке, где git-ключи живут снаружи — пуши идут через безопасный прокси.
Песочница реализована с помощью bubblewrap (Linux) и Seatbelt (macOS) + прокси для сетевых ограничений. Windows - пока не заявляли. Это open source, можно встроить в своих агентов.
Упоминали вот тут инструменты управления контекстом от Anthropic, но не сказали о статье с теоретической частью - Effective context engineering for AI agents. Исправляемся. Если совсем коротко, то там о том, что промпт-инжиниринг - все, так уже не носят, теперь говорим контекст-инжиниринг.
Если чуть подробнее - в эпоху «prompt engineering» важно было правильно сформулировать запрос. Теперь на первый план выходит context engineering - умение управлять всем, что попадает в окно модели: инструкции, история, данные, инструменты. Контекст - ограниченный ресурс. Чем он больше, тем выше риск «шума» и потери фокуса.
Задача инженера оставить в нём только самое ценное: сжатые факты, нужные подсказки, минимальные, но точные примеры.
🔹 Контекст = рабочая память агента
🔹 Цель = максимум сигнала при минимуме токенов
🔹 Методы = краткость, субагенты, динамическое извлечение данных
В общем, база, особенно для строителей агентов.
Теория мертвого интернета — чистая конспирология или реальный прогноз? Рассказывает Владимир Крылов, доктор технических наук и научный консультант по применению ИИ в разработке ПО.
Посмотрим свежим взглядом на опубликованную в 2021 году теорию DIT — Dead Internet Theory. Многие назвали её конспирологической, с таким комментарием она присутствует в Википедии и сегодня. Но прошедшие годы ознаменовались событиями, которые скорее развеивают конспирологические основания, чем подтверждают их. Факты доказывают утверждения об отдалении "сети сетей" от первоначальных целей и "расчеловечивании" the Internet.
Запись лекции доступна здесь и на других площадках:
➡️ YouTube
➡️ ВКонтакте
➡️ ЯндексМузыка
Вайб-кодинг — это не просто новый тренд, это философия разработки, где интуиция важнее идеального плана, а ИИ становится твоим со-пилотом в потоке.
Вместе с Александром Агафонцевым, экспертом по автоматизации с ИИ и автором телеграм-канала "ИИзи Бизнес", разберем:
🔵Что такое вайб-кодинг и почему это будущее разработки?
🟣Как ИИ меняет подход к написанию кода?
🔵Почему "идеальная архитектура" иногда убивает скорость?
🟣Как найти баланс между хаосом и структурой?
🔵Реальные кейсы: что можно автоматизировать уже сегодня?
🟣Почему молодое поколение разработчиков кодит по-другому?
⏰ Запускаем трансляцию сегодня, 15 октября, в 18:00!
Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Александру!
Поспорим с классическими подходами в разработке ☺️
Еще одни создатели кодинг-агента Augment Code сравнили Sonnet 4.0 и 4.5 — и... 4.5 оказался быстрее и качественнее. Кто бы мог подумать. Их результаты такие:
Приложение с нуля:
- 4.5: 20 мин, работающие приложение.
- 4.0: 40+ мин, качество хуже.
Простое изменение кода:
- 4.5: 3 вызова, корректный апдейт.
- 4.0: более длинная цепочка, такой же результат.
Сложный рефакторинг:
- 4.5: быстрее + тесты пройдены.
- 4.0: медленнее + тесты завалены.
Пост в блоге кодинг агента Cline о том, что открытые модели стремительно догоняют закрытые в области агентов редактирования кода. Новая модель GLM-4.6 ( от Zhipu / Z.ai одной из китайских компаний-«ИИ-тигров»)
показала 94.9% успеха в тестах Cline против 96.2% у Claude 4.5, при этом стоит в 8 раз дешевле (или open source, если есть где развернуть).
PS: на картинке кажется перепутали Sonnet 4 и 4.5
Anthropic пару месяцев назад выпустили Claude Code Security Reviewer - бот-ревьюер, который ищет уязвимости в GitHub-репо и советует, что починить. Теперь Google DeepMind ответил своим CodeMender — агентом, который не советует, а сразу лезет чинить код сам: патчит, тестит, откатывает, и т.д. Пока что оба под присмотром людей. Гугл заявляет, что в процессе разработки за полгода CodeMender уже внёс 72 security-фикса в open source-проекты, включая те, где кода под 4,5 миллиона строк.
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
