uk
Feedback
AI4Dev — AI for Development

AI4Dev — AI for Development

Відкрити в Telegram

Что надо знать, чтобы остаться востребованным ИТ специалистом в мире с LLM? • Обзоры продуктов, фреймворков и способы взаимодействия с LLM для разработки софта • Реальные кейсы, pet и бизнес проекты с LLM • Публичные лекции В будущее берут не всех!

Показати більше
5 244
Підписники
+124 години
+177 днів
+8130 день
Архів дописів
SpecKit: описываем фичи вместо того, чтобы сразу писать код Лёша Берёзка, техлид iOS в Додо Пицце и автор канала о разработке
SpecKit: описываем фичи вместо того, чтобы сразу писать код Лёша Берёзка, техлид iOS в Додо Пицце и автор канала о разработке, покажет в онлайне, как упростить разработку с помощью инструмента SpecKit от GitHub. ➡️Разберём, как описывать то, что нам надо от продукта, с помощью SpecKit и что это даёт в перспективе. ➡️Реализуем одну фичу с нуля до рабочего состояния. Когда? Завтра, 13 мая, в 13:00. Смотрите на YouTube или прямо в этом канале — и задавайте вопросы Лёше!

Одна и та же модель ИИ может стоить в 30 раз дороже и работать в 7 раз медленнее. Все зависит от того, в какую агентную оболо
Одна и та же модель ИИ может стоить в 30 раз дороже и работать в 7 раз медленнее. Все зависит от того, в какую агентную оболочку ее обернули. Это главный итог нового Coding Agent Index от Artificial Analysis. Команда впервые системно замерила не сами LLM, а их связки с оболочками вроде Claude Code, Cursor CLI, Codex и Gemini CLI. Логика проста: при работе с ИИ-агентом разработчик фактически выбирает не модель, а пару. Индекс сводит три бенчмарка: SWE-Bench-Pro-Hard-AA от Scale AI (150 сложных задач разработки), Terminal-Bench v2 от Laude Institute (84 терминальные задачи) и SWE-Atlas-QnA (124 вопроса о поведении кода). По качеству впереди ожидаемая верхушка. Opus 4.7 в Cursor CLI набирает 61 балл, GPT-5.5 в Codex и Opus 4.7 в Claude Code идут вровень с 60, GPT-5.5 в Cursor CLI замыкает четверку с 58. Open weights подбираются, но пока не догнали: лучший результат у GLM-5.1 в Claude Code (53), за ним Kimi K2.6 и DeepSeek V4 Pro в той же оболочке по 50. Самое интересное начинается, когда к баллам приставляют экономику. Цена задачи разнится более чем тридцатикратно: GPT-5.5 в Codex обходится в $2.21, GLM-5.1 в Claude Code в $2.26 (у последней на цену работает срыв модели в циклы на отдельных задачах). На другом полюсе Composer 2 в Cursor CLI всего за $0.07. По времени картина похожая: Opus 4.7 в Claude Code справляется с задачей примерно за шесть минут, Kimi K2.6 в той же оболочке тратит около сорока. Заметнее всех тут отличилась Cursor. Их собственная Composer 2, по заявлению команды построенная на базе Kimi K2.5, набирает 48 баллов почти на уровне лучших open weights и остается самой дешевой связкой индекса. Редкая иллюстрация того, что прицельный пост-тренинг под конкретную оболочку дает измеримый выигрыш. Обратный случай у Google: Gemini 3.1 Pro в Gemini CLI получает лишь 43 балла, заметно ниже позиций самой модели в общем Intelligence Index. Узкое место не в модели, а именно в оболочке.

Грядет смена парадигмы в технологиях искусственного интеллекта. Чего же ждать? Владимир Крылов, доктор технических наук и нау
Грядет смена парадигмы в технологиях искусственного интеллекта. Чего же ждать? Владимир Крылов, доктор технических наук и научный консультант по применению ИИ в разработке ПО, даст свой прогноз. 1️⃣Рассмотрим тренды в технологическом аспекте ИИ и обнаруженные "бутылочные горлышки", препятствующие росту интеллекта у строящихся систем. 2️⃣Кроме очевидных проблем энергопотребления для масштабирования обучения и эксплуатации систем ИИ, поговорим о проблеме "стены памяти" (Memory Wall), приводящей к разработке нового аппаратного обеспечения и, как следствие, к новым парадигмам hardware. 3️⃣Познакомимся с новой парадигмой алгоритмического построения ИИ — рассуждениям в латентном пространстве с прогнозируемым тысячекратным увеличением энергоэффективности систем ИИ при росте производительности на 60%. Вы услышите авторскую интерпретацию вышедших за последние месяцы публикаций ведущих компаний и университетов. ⏩ Смотрите на YouTube или RuTube! И подписывайтесь на наши каналы, чтобы не пропустить следующие лекции ☺️

Агент, который просто выполняет промпт, — это уже немного legacy. Интереснее архитектура, где агент самосовершенствуется: после работы анализирует результат и переписывает собственные инструкции. После каждого запуска агент проводит анализ улучшений — почти как «собрание самокритики» в КНДР: модель делает попытку, разбирает ошибку и использует текстовый feedback как память. Практичная инженерная схема: run → trace → critique → prompt/context update → next run. Слова для гугления: Self-Refine и Reflexion. Это похоже на Систему 1 и Систему 2 мышления, описанные Даниэлем Канеманом в книге «Думай медленно… решай быстро». Система 1 — быстрый автопилот: сгенерировал ответ по привычным паттернам. Система 2 — медленный контур проверки: остановился, посмотрел назад, нашел, где произошла галлюцинация, неверный вызов субагента или плохая декомпозиция, и добавил новое правило в рабочую память агента. Эффективность в том, что такой контур работает и на стадии разработки агента, и уже в эксплуатации. На разработке он быстрее находит слабые места в промптах, tools и декомпозиции задач. В проде — постепенно накапливает рабочие правила из реальных запусков: какие ошибки повторяются, где нужен другой порядок действий, какие проверки надо добавить. Со временем это может дать заметный отрыв от агента, который однажды настроили и оставили шуршать с готовым промптом. И, конечно, без evals и golden dataset это превратится не в self-improvement, а автоматизированное самооправдание, агент (как и все мы) может красиво объяснять свои ошибки, вместо того, чтобы исправлять их.

Почему инженерная обвязка стала важнее самой нейросети? Коллеги, на Хабре вышла текстовая версия нашего интервью с Андреем Но
Почему инженерная обвязка стала важнее самой нейросети? Коллеги, на Хабре вышла текстовая версия нашего интервью с Андреем Носовым — техническим директором и ИИ-архитектором. Оно о феномене OpenClaw, который за три месяца набрал 250 тысяч звезд на GitHub — быстрее, чем Linux за всю свою историю. А еще о том, почему автономные агенты без Human-in-the-Loop опасны, как три слоя Guardrails ловят команду rm -rf, и зачем сажать тысячу агентов на Kafka. Интервью можно посмотреть на нашем YouTube-канале (подпишитесь, чтобы не пропускать новые видео). В тексте: - почему современные модели — это не исполнители, а декораторы формы ответа - как Pydantic-схемы и retry-паттерны обуздывают недетерминированный хаос - зачем нужен трейсинг естественного языка и какие фреймворки для этого подходят (Langfuse, Arize Phoenix, LangSmith) - как протоколы A2A и MCP решают проблему vendor lock-in — и почему добавляют latency - что произойдет с рынком обвязок, если завтра появится «идеальный Джарвис» - почему 2026 — это год агентов, а не моделей Если строите агентные системы в продакшене или только присматриваетесь к ним — прочитайте и поддержите статью плюсом на Хабре, нам это важно. 👉 https://habr.com/ru/articles/1024744/

AI-Хозяйке на заметку: платформа для работы ИИ с вебом. TinyFish объединяет поиск, получение контента, браузерные сессии и автономные веб-сценарии в одном API. Вместо того чтобы собирать всё с нуля можно взять готовый инструмент. Полезно, когда агенту нужно искать информацию, читать страницы, кликать по сайтам и выполнять действия в вебе без лишней инфраструктурной боли. Кейсы применения : автономное AI-тестирование веб-приложений, мониторинг и сравнение цен конкурентов, анализ рынков и подобные задачи. Есть бесплатный пробный план.

Энтузиаст разобрал Claude Code по исходникам и собрал интерактивную карту того, как он предположительно устроен, включая основные компоненты: цикл работы агента, систему изучения архитектуры, систему инструментов, каталог команд и скрытые фичи. Любопытно. Рекомендуем.

Вышла бета Unsloth Studio - среда для запуска локальных AI-агентов Вышла бета Unsloth Studio, и это не просто очередная обертка для файн-тюнинга, а полноценная среда для запуска локальных AI-агентов. Для тех, кто использует LLM в разработке, тут есть несколько крайне интересных механик. Самое главное — встроенная песочница для исполнения кода. Модели теперь могут не только писать скрипты на Python или Bash, но и сразу их запускать, тестировать с реальными вычислениями и самостоятельно исправлять ошибки на лету. По сути, это локальный аналог Claude Artifacts. Кроме того, прямо в процессе размышлений модель умеет ходить в сеть, например, чтобы почитать актуальную документацию по библиотеке перед написанием кода.Если стоит задача дообучить LLM на корпоративном кодстайле или закрытой документации, процесс сильно упростили. Через Data Recipes можно закинуть сырые файлы, документацию или JSON, а студия сама соберет из них нужный датасет. Само дообучение требует на 70% меньше памяти и поддерживает Multi-GPU из коробки. После этого натренированную модель можно прямо в интерфейсе столкнуть лбами с базовой, чтобы проверить, насколько лучше она стала писать код.Работает инструмент полностью в офлайне, так что код никуда не утечет. Готовые веса легко выгружаются в GGUF, чтобы дальше крутить их в той же Ollama или llama.cpp. Выглядит как отличный способ собрать и протестировать собственного ИИ-помощника по коду без возни с инфраструктурой. Сайт: https://unsloth.ai/ Документация: https://unsloth.ai/docs/new/studio#quickstart

Кажется, что всё просто: получили embedding, положили в базу, нашли ближайшие векторы — и поиск готов. Но на практике сразу начинаются вопросы. Почему обычные индексы здесь не работают? Зачем нужны HNSW, IVF и approximate search? Почему один индекс даёт быстрый ответ, но теряет качество, а другой — ест память и долго строится? ⚡️Анна Авдюшина, кандидат технических наук и инженер центра «Сильный ИИ в промышленности» университета ИТМО, рассказала, как на самом деле устроен векторный поиск в базах данных, почему nearest neighbor search — это отдельный класс задач и какие компромиссы приходится принимать между скоростью, точностью и стоимостью хранения. Поговорим про: → exact search и approximate nearest neighbor search → HNSW, IVF и базовую логику векторных индексов → recall, latency, memory footprint и trade-off’ы → как это работает в реальных системах поиска, RAG и рекомендациях 🎥 Запись доступна здесь и на других площадках: YouTube RuTube ВКонтакте ЯндексМузыка Mave

Локальный Copilot в VS Code: пошаговая инструкция Записали с Сергеем Алатиным, ML‑инженером компании Loymax, подробный видео-
Локальный Copilot в VS Code: пошаговая инструкция Записали с Сергеем Алатиным, ML‑инженером компании Loymax, подробный видео-гайд: как локально развернуть Copilot в VS Code с помощью модуля Continue — быстро, без отправки данных в облако и с сохранением функционала официального решения. За 20 минут разберём весь процесс от установки до полноценной работы: → Установка модуля Continue в VS Code как обычного расширения. → Настройка конфигурационного файла: разбираем ключевые параметры. → Работа с правилами, промптами и контекстом. → Практическое знакомство с основными инструментами (chat, edit, apply, autocomplete) → Разбор 3 режимов работы чата: режим агента, режим планирования, чат-режим. → Демонстрация работы инструментов на демо‑файлах. → Разбор типичных ошибок и ограничений локального Copilot — и как их обойти. 🎬 Смотрите на YouTube или RuTube!

Кажется, что всё просто: получили embedding, положили в базу, нашли ближайшие векторы — и поиск готов. Но на практике сразу н
Кажется, что всё просто: получили embedding, положили в базу, нашли ближайшие векторы — и поиск готов. Но на практике сразу начинаются вопросы. Почему обычные индексы здесь не работают? Зачем нужны HNSW, IVF и approximate search? Почему один индекс даёт быстрый ответ, но теряет качество, а другой — ест память и долго строится? ⚡️Анна Авдюшина, кандидат технических наук и инженер центра «Сильный ИИ в промышленности» университета ИТМО, расскажет, как на самом деле устроен векторный поиск в базах данных, почему nearest neighbor search — это отдельный класс задач и какие компромиссы приходится принимать между скоростью, точностью и стоимостью хранения. Поговорим про: → exact search и approximate nearest neighbor search → HNSW, IVF и базовую логику векторных индексов → recall, latency, memory footprint и trade-off’ы → как это работает в реальных системах поиска, RAG и рекомендациях ⏰ Запускаем трансляцию завтра, 2 апреля, в 12:00. Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Анне!

🤖 Чем отличается антропоморфная интерпретация LLM от других популярных интерпретаций? Рассказал Владимир Крылов, доктор технических наук и научный консультант по применению ИИ в разработке ПО. В лекции: → В чем состоит самая развитая на сегодня интерпретационная модель PSM (Persona Selection Model) — модель выбора персонажа → Как выглядят в этой модели взаимоотношения LLM: помощника как персонажа и ИИ-ассистента → Как связаны агентность и свобода воли в терминах PSM → Как формируются персоны при обучении LLM Также посмотрим на одно из исследований автора, связанное с PSM, в котором используется разработка симулякров. 🎥 Запись доступна здесь и на других площадках: YouTube RuTube ВКонтакте ЯндексМузыка Mave

🤖 Чем отличается антропоморфная интерпретация LLM от других популярных интерпретаций? Расскажет Владимир Крылов, доктор техн
🤖 Чем отличается антропоморфная интерпретация LLM от других популярных интерпретаций? Расскажет Владимир Крылов, доктор технических наук и научный консультант по применению ИИ в разработке ПО. Разберем: → В чем состоит самая развитая на сегодня интерпретационная модель PSM (Persona Selection Model) — модель выбора персонажа → Как выглядят в этой модели взаимоотношения LLM: помощника как персонажа и ИИ-ассистента → Как связаны агентность и свобода воли в терминах PSM → Как формируются персоны при обучении LLM А также посмотрим на одно из исследований автора, связанного с PSM, который использует разработку симулякров. ⏰ Запускаем трансляцию сегодня, 26 марта, в 13:00. Смотрите на YouTube, RuTube или прямо в этом канале — и задавайте вопросы лектору в комментариях! Владимир Крылов ответит на них в отдельном интервью.

OpenClaw и переход к AI-агентам: почему теперь всё решает обвязка, а не модель Сейчас в эфире — Андрей Носов, ведущий ИИ‑архи
OpenClaw и переход к AI-агентам: почему теперь всё решает обвязка, а не модель Сейчас в эфире — Андрей Носов, ведущий ИИ‑архитектор, PhD Communication Science, автор телеграм‑канала «Эй ай надзор». Говорим о том, какие инженерные решения позволяют превратить «умную, но непредсказуемую» модель в надёжного цифрового сотрудника: → как меняется архитектура системы при переходе от LLM‑чатбота к полноценному агенту; → какие механизмы контроля действий агента обязательны в production‑среде; → как добиться предсказуемости поведения агента и соблюдения SLA; → почему observability и аудит в агентных системах — это не роскошь, а необходимость; → как обвязка помогает соответствовать требованиям регуляторов и бизнес‑логике. Подключайтесь к трансляции и пишите вопросы в комментариях — самые интересные зададим гостю в прямом эфире! 👉 Youtube 👉 RuTube

На GitHub появился бенчмарк, который измеряет насколько эффективно Claude Code генерирует код на разных языках На GitHub появ
На GitHub появился бенчмарк, который измеряет насколько эффективно Claude Code генерирует код на разных языках На GitHub появился репозиторий mame/ai-coding-lang-bench, и это, пожалуй, первый количественный бенчмарк, который отвечает на вопрос "какой язык лучше для AI-кодинга”. Claude Code реализует упрощенный Git на 13 языках, по 20 прогонов на каждый, две фазы (с нуля + расширение функциональности). Автор, коммитер Ruby, честно предупреждает о bias и выкладывает сырые данные. Лидеры: Ruby (73s, $0.36), Python (74s, $0.38), JavaScript (81s, $0.39). Все динамические. Go четвертый (101s, $0.50). Самая показательная находка, которую из первых принципов не угадаешь: TypeScript почти вдвое медленнее чистого JavaScript (133s против 81s) и на 60% дороже. Та же семантика, но статическая типизация превращается в прямой налог на генерацию. Python с mypy добавляет 67% overhead. Ruby со Steep замедляется в 2-3.2 раза. Механика понятна: типы добавляют модели дополнительное пространство ограничений, которое надо удовлетворять одновременно с бизнес-логикой, и это конвертируется в токены и доллары. OCaml и Haskell генерируют самый короткий код, но по скорости в нижней половине: когнитивная плотность языка стоит дорого. Ограничения в исследовании существенные: Задача мелкая (мини-git), один автор, нет CI/CD, нет валидации другими моделями. Как поведет себя генерация на проекте в десятки тысяч строк с реальными зависимостями, мы не знаем. И главное: бенчмарк измеряет стоимость прототипирования, а не стоимость владения кодом, что обычно гораздо более трудоемко. Статическая типизация может проигрывать при генерации, но ее ценность на этапе поддержки и рефакторинга здесь не учтена. Эффективность AI-генерации (и последующей AI-поддержки) становится таким же свойством языка, как runtime-производительность или эргономика для разработчика. Стратегия "прототип на динамическом языке, миграция на статический для продакшена" возможно не лишена смысла.

Google Stitch обновился и движется в сторону полноценной AI-native среды для дизайна Теперь можно начинать даже не с wirefram
Google Stitch обновился и движется в сторону полноценной AI-native среды для дизайна Теперь можно начинать даже не с wireframe, а с идеи, бизнес-цели, нужного ощущения или референсов. В Stitch появился бесконечный canvas, новый design agent, agent manager для параллельной работы с несколькими идеями, голосовое управление, DESIGN.md для переноса правил дизайн-системы между проектами, а также переход от дизайна к коду через MCP, SDK, skills и экспорт в dev-инструменты. Отдельно интересно, что Stitch умеет почти мгновенно превращать статические экраны в интерактивные прототипы, можно быстро собирать user flow и сразу их проверять. Для эксперимента мы взяли презентацию продукта, на основе её текстового описания сгенерировали UX-требования и загрузили их в Stitch. Результат получился очень достойный: интерфейсы оказались во многом похожи на те, которые мы сами проектировали, а местами даже сильнее. Еще один шаг к процессу, где AI помогает не только рисовать интерфейсы, но и думать вместе с дизайнером, ускоряя путь от идеи до прототипа с дней до минут.

Нужен ли ИИ-агентам свой Stack Overflow?   Недавно Эндрю Ын  (Andrew Ng) анонсировал Context Hub или коротко chub. Это открытая утилита, призванная снабжать кодинг-агентов свежей документацией по API. Проект стремительно набирает популярность на GitHub, собрав более 8,5 тысяч звезд, а база поддерживаемых API выросла до 1000 с лишним документов. Главный маркетинговый посыл проекта: создание среды, где агенты смогут обмениваться реальным опытом работы с кодом, формируя общую базу знаний.   Однако технический аудит репозитория проведенный нашими экспертами показывает, что текущая реализация пока заметно отстает от заявленного видения.   Что мы имеем на самом деле:   База данных это LLM-кэш, а не уникальный опыт. Сейчас внутри лежат просто качественно переформатированные официальные доки (LLM-саммари). В них нет неявного знания (tacit knowledge) или разбора краевых случаев из продакшена. Порядка 60% этого контента избыточно, так как современные модели вроде Opus 4.6 или GPT-5.4 и без того им владеют.  Аннотации остаются локальными. В коде видно, что пометки сохраняются исключительно на машине пользователя (в директории ~/.chub/annotations/) и никак не синхронизируются между разными агентами.   Примитивный механизм обратной связи. Заявленный "обмен знаниями" пока сводится к простым меткам (outdated, incomplete) и рейтингам полезности, которые уходят мейнтейнерам в виде телеметрии. Агент не может передать в общую базу специфическую деталь, например, почему конкретный метод выдает ошибку при определенных условиях.   Можно сказать, что Эндрю Ын нащупал правильную идею, коллективная память агентам действительно нужна. Сама CLI-часть написана добротно, код вполне production-ready.   Установить утилиту можно командой: npm install -g @aisuite/chub   Увы, но пока "Stack Overflow для ИИ" это скорее красивый питч, чем реальность. На данный момент, это просто удобный агрегатор документации с зачатками системы фидбека, но за развитием проекта Context Hub однозначно стоит внимательно следить.

Vanderbilt University (входит в Top-20 университетов США) выпустил на Coursera 5-часовой курс Claude Code: Software Engineering with Generative AI Agents. Vanderbilt занял нишу полуприкладного, полу-академического обучения Generative AI и стал одним из крупнейших поставщиков AI-курсов на Coursera. Сам курс о том, как превратить AI в «команду разработчиков». Учит строить приложения целиком через большие промпты, запускать несколько AI-агентов параллельно в разных Git-ветках, генерировать несколько решений (Best-of-N), автоматически проверять код и масштабировать разработку с помощью Claude Code. По итогам обучения обещают переход от AI-подсказок к полноценной AI-оркестрации разработки и кратному росту продуктивности. Язык — английский. Доступен по подписке Coursera Plus.

🦞 OpenClaw на своём сервере: полная инструкция Записали с фаундером alfaci.xyz Александром Агафонцевым подробный видео-гайд
🦞 OpenClaw на своём сервере: полная инструкция Записали с фаундером alfaci.xyz Александром Агафонцевым подробный видео-гайд — как безопасно развернуть OpenClaw в Docker-контейнере на изолированном сервере и подключить Telegram-бота. Что внутри: — Установка Docker и сборка образа с нуля — Подключение API Anthropic (Claude) и Telegram — Device Pairing — почему бот не отвечает и как это починить — Настройка «личности» агента через identity.md, soul.md и user.md — Создание собственных скиллов — Типичные ошибки при запуске (Trusted Origins и др.) и их решение — Честный разбор проблем с безопасностью: промпт-инъекции, утечки ключей, трояны в форках ⚠️ Главное правило: НЕ ставьте OpenClaw на личный компьютер. Только изолированный сервер + Docker. В видео объясняем почему. OpenClaw — мощнейший open-source AI-агент, который умеет буквально всё. И проблема в том, что он умеет буквально всё. Поэтому показываем, как использовать его с умом. 🎬 Смотрите на YouTube или RuTube! 📦 GitHub: github.com/openclaw/openclaw 📄 Docker-документация: docs.openclaw.ai/install/docker #OpenClaw #AI #Docker #Telegram #ИИагент

Как построить RecSys и не разорить бизнес? Расскажет Иван Плешаков, Data Scientist (Яндекс Маркет, MARS) и автор телеграм-кан
Как построить RecSys и не разорить бизнес? Расскажет Иван Плешаков, Data Scientist (Яндекс Маркет, MARS) и автор телеграм-канала Канал Доброго Вани | Data Science. ⚡️Разберем основы рекомендательных систем: → User2Item и Item2Item системы; → основные этапы рекомендательного пайплайна; → ключевые подходы в рамках каждого из этапов; → метрики для разработки и бизнеса. ⏰ Запускаем трансляцию в среду, 4 марта, в 12:00. Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Ивану!