en
Feedback
AI4Dev — AI for Development

AI4Dev — AI for Development

Open in Telegram

Что надо знать, чтобы остаться востребованным ИТ специалистом в мире с LLM? • Обзоры продуктов, фреймворков и способы взаимодействия с LLM для разработки софта • Реальные кейсы, pet и бизнес проекты с LLM • Публичные лекции В будущее берут не всех!

Show more
5 242
Subscribers
+124 hours
+157 days
+7430 days
Posts Archive
Как LLM решают сложные задачи — и почему иногда терпят неудачу даже в простых рассуждениях?.. Хумай Байрамова — Java-разработ
Как LLM решают сложные задачи — и почему иногда терпят неудачу даже в простых рассуждениях?.. Хумай Байрамова — Java-разработчик и преподаватель Университета ИТМО — расскажет о подходе Active Prompting, основанном на принципах активного обучения и позволяющем эффективно подбирать наиболее информативные примеры для подачи в промпт. В эфире: 🔵Рассмотрим современные методы оптимизации in-context learning — от цепочек рассуждений (Chain-of-Thought) до адаптивного подбора примеров. 🔵Сравним Active Prompting с другими стратегиями: на основе неопределённости, разнообразия, семантической близости и их комбинаций. 🔵Поймем, как появление механизмов Long-Range Memory влияет на подходы к построению промптов и выбору примеров. ⏰ Запускаем трансляцию завтра, 28 мая, в 12:00. Подключайтесь и задавайте вопросы Хумай! Их можно оставить в чате на YouTube или в комментариях к этому посту.

Vibe Coding News за прошедшую неделю: Anthropic анонсировали новые ИИ-модели — Claude Opus 4 и Claude Sonnet 4. Модели лучше справляются со сложными задачами, написанием кода и поиском в интернете, Opus 4 может работать автономно до 7 часов подряд. Модели лучше держат контекст и не теряют детали, даже если работать с большими документами и файлами пользователя, на 65% реже искать «лазейки» и короткие пути — теперь ИИ чаще решает задачи именно так, как вы задумали, а не как проще. По словам Anthropic, в ряде задач по программированию и использованию внешних инструментов (например, веб-поиск), Opus 4 опередила конкурентов — Google Gemini 2.5 Pro, OpenAI o3 reasoning и даже GPT-4.1. Обновления в Cursor - версии 0.50 Новая Tab-модель умеет делать правки сразу в нескольких файлах - пригодится при рефакторинге. Max Mode теперь доступен для всех передовых моделей, можно решать сложные задачи с помощью расширенного контекста - обрабатывать больший объём кода за раз, вызывать инструменты AI. Добавлены мульти-рутовые рабочие пространства. А с помощью команды @folders можно добавить целые папки в контекст AI. Если папка слишком большая, Cursor уведомит об этом специальным значком. Появились фоновые агенты, которые могут в параллельных средах решать мелкие задачи. Также обещают, что интеграция с issue trackerами на подходе. Обновления в GitHub Copilot — теперь это не просто ассистент, а самостоятельный код-агент, который может брать на себя задачи из issue, автоматически создавать окружение, писать код, коммитить и оформлять pull request с полным соблюдением всех политик безопасности. Всё прозрачно, управляется с любого устройства, работает с любыми IDE и интегрируется с инфраструктурой компании. Уже доступен для всех пользователей тарифов Copilot Enterprise и Copilot Pro+. Devstral — новая топовая open-source модель от Mistral для код-агентов! Модель (24B) создана совместно с All Hands AI и оптимизирована для интеграции с OpenHands —open-source платформа для автоматизации рутинных задач в разработке (инструментальная “рука” для код-агентов). Devstral умеет работать с большими проектами и множеством файлов, интегрируется с vLLM, llama.cpp и др., лидирует (среди open-source) на SWE-Bench Verified (46.8%). Уже есть квантованные версии, работает даже на одной RTX 4090 с огромным контекстом. Google представила модель Gemini Diffusion. Вместо классической автогрегрессии (по слову за раз), здесь текст генерируется как картинки "волнами": модель итерационно превращает шум в осмысленный текст. Такой метод позволяет получать результаты быстрее и с меньшими ресурсами — в бенчмарках Gemini Diffusion уже обходит компактную Gemini 2.0 Flash-lite, причем при меньших размерах модели. Модель не требует большого количества памяти, а качество ответа можно улучшать просто увеличив число итераций — без сложных prompt-трюков. Звучит перспективно для запуска LLM на локальных машинах — скорость, экономия, гибкость. Если Google сможет доказать, что диффузионные LLM масштабируются, это может поменять стандарты индустрии и открыть путь новым, быстрым и доступным моделям для локального использования. CodeRabbit запустили бесплатное AI-код-ревью прямо в VS Code, Cursor и Windsurf. Теперь баги, ошибки стиля, и даже забытые тесты можно ловить сразу при работе с кодом, не дожидаясь pull request. Работает на основных популярных языках (Python, JS, Java и др.), а “Fix with AI” позволяет чинить баги одним кликом. Бесплатная версия доступна с ограничениями по количеству проверок, расширенные версии — по подписке. Плагин уже есть в магазине VS Code. Пропустили что-то интересное?

Обсудили с Антоном Мальцевым (ML Lead в Artisight, фаундер RemBrain, автор YouTube- и Telegram-каналов) «железную» сторону AI-разработки: от промышленных GPU-кластеров до революционных нейрочипов. В эфире: 🔵Почему для запуска современных нейросетей требуются гигантские вычислительные мощности? 🔵Сколько на самом деле стоит обучение крупных языковых моделей? 🔵Какие технологические прорывы остаются в тени громких заголовков? Запись интервью доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

Как сделать качественный переводчик, не тратя впустую деньги и время? Расскажет CEO компании Lingvanex Алексей Рудак! В эфире
Как сделать качественный переводчик, не тратя впустую деньги и время? Расскажет CEO компании Lingvanex Алексей Рудак! В эфире разберем: 🟣В чем принципиальное отличие LLM-перевода от других подходов? 🟣Где брать датасеты для обучения переводчика и как их фильтровать? 🟣Как тренировать модель и какое железо для этого нужно? 🟣Как работает Beam-search? 🟣По каким метрикам оценивать качество перевода? ⏰ Запускаем трансляцию 23 мая в 12:00. Подключайтесь и задавайте вопросы Алексею! Их можно оставить в чате на YouTube или в комментариях к этому посту.

🚨 LIVE: "До чего дотянутся руки ИИ: пределы автоматизации в программировании" Прямо сейчас идёт трансляция, которая ответит на вопрос: какой код ИИ напишет сам, а где без программистов не обойтись? ⚙️ В программе: Реальные границы возможностей ИИ в написании кода Где автоматизация уже работает на продакшене Где алгоритмы продолжают фейлиться Как адаптироваться и остаться в обойме 🧠 Спикеры: Валентин Ковалёв (Senior PM, Кросслайф) Владимир Коршунов (CTO, АгроСигнал) 📺 Смотреть: https://www.youtube.com/watch?v=zOjdoSO5RFU 📱 Или в нашем телеграме Вопросы задавайте в комментариях. Git pull будущее!

Vibe Coding News за прошедшую неделю: Google DeepMind представила AlphaEvolve — универсального агента на базе Gemini, предназначенного для автоматического поиска и оптимизации алгоритмов. Ключевые достижения: Обнаружение нового алгоритма умножения 4×4 комплексных матриц с использованием 48 скалярных умножений, что превосходит алгоритм Штрассена 1969 года. Также DeepMind team сообщила, что AlphaEvolve помог оптимизировать внутренние системы Google: ускорение ядра умножения матриц Pallas на 23%, что сократило время обучения моделей Gemini на 1%. Звучит круто! Теперь хочется узнать зачем нужны комплексные матрицы 4х4 и матрицы Pallas. Компания LangChain объявила о запуске Open Agent Platform — open-source платформы без необходимости программирования для создания и управления агентами. Также стала доступна LangGraph Platform, предназначенная для развертывания и масштабирования долгоживущих, обладающих состоянием агентов. Особенности: Развёртывание в один клик, масштабирование, поддержка памяти и асинхронного взаимодействия, интегрированная среда разработки LangGraph Studio для отладки и мониторинга. Open Source лицензия MIT. OpenAI представила Codex — облачного агента для автоматизации задач программирования, встроенного в ChatGPT. Codex работает в изолированной среде в облаеке, способен писать код, исправлять ошибки, запускать тесты и предлагать улучшения. Судя по первым отзывам - без знаний программирования с ним не справится (пока выдыхаем), в процесс работы особо не вмешаешься, интерфейс минималистичен, прорывных результатов пока не попадалось. Т.е. все классно, прямо из среды готовит pull requestы, но в целом на уровне конкурентов. Кроме того, при создании виртуального окружения отключается интернет, что требует предварительной настройки всех зависимостей, а также попадаются мелкие баги. OpenAI начала развёртывание модели GPT-4.1 в ChatGPT для пользователей с подписками Plus, Pro и Team. Напомним, это та модель, которая специализируется на задачах программирования и точном следовании инструкциям, поддерживает контекст до 1 миллиона токенов в API. В ближайшие недели доступ получат пользователи Enterprise и Education.

ChatGPT Codex: недостающее руководство ChatGPT Codex уже здесь — первый облачный Autonomous Software Engineer (A-SWE) от OpenAI. Джош Ма и Александр Эмбирикос рассказывают нам, как WHAMить каждую кодовую базу как опытный пользователь. https://open.substack.com/pub/swyx/p/codex?r=lbfm3&utm_medium=ios

Для тех, кому лучше слушать, чем читать детальное обсуждение

Статья представляет собой анонс AlphaEvolve, нового агента для написания кода, разработанного Google DeepMind и работающего на базе Gemini. Этот инструмент призван автоматизировать обнаружение и оптимизацию алгоритмов, используя возможности больших языковых моделей в сочетании с автоматизированной оценкой результатов. AlphaEvolve уже продемонстрировал значительные улучшения в различных областях, включая оптимизацию инфраструктуры Google и поиск новых решений сложных математических задач. https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/

🔴 Программист и/или ChatGPT?! Друзья, не пропустите горячую дискуссию о том, чем плох или хорош код, созданный искусственным интеллектом! Код от нейросетей пишется за секунды, но какие скрытые уязвимости он несёт? Может ли одна строчка кода от ChatGPT стоить компании миллионы? Или ИИ-помощники — это крутой инструмент: В эфире: Алёшин Николай — Golang разработчик (ШтрафовНет.ру) Карасев Павел — бизнес-партнер (Компьютерные технологии) Владас Жиленас — CTO (ItFox) Иван Кузьминов — техлид (Outlines Tech) Дмитрий Смирнов - Основатель и технический лидер компании codesmirnov Будем разбирать реальные кейсы, анализировать риски и искать золотую середину между удобством ИИ-помощников и безопасностью кода. 📺 Прямой эфир на нашем канале и на Youtube https://www.youtube.com/watch?v=Cvv5y7r9G4o

С небольшим опозданием Vibe Coding News за предыдущую неделю: Модель Gemini 2.5 Pro продемонстрировала улучшения в генерации кода, особенно в создании интерактивных веб-приложений. Она заняла первое место в WebDev Arena, обойдя Claude, и продемонстрировала лучшие результаты в кодинге, математике, креативном письме и обработке длинных запросов. В официальном пресс-релизе выложены сравнения по бенчмаркам с ведущими моделями и Gemini 2.5 лишь немного уступает o3, обгоняя другие модели. OpenAI приобрела стартап Windsurf за $3 млрд. В ветке на Reddit обсуждают, что главная цель покупки не в том, чтобы заполучить форк VS Code или пользователей, сколько получить данные. OpenAI строит платформу для "код-агентов", которые могут работать как полноценные разработчики. Для их обучения нужны реальные паттерны взаимодействия между человеком и AI в кодинге - то, что WindSurf и собирает, и то чего OpenAI видимо не удалось получить от Cursor. Satya Nadella, CEO Microsoft, в недавнем интервью выразил радикальное видение будущего, заявив, что в эпоху ИИ-агентов может исчезнуть сама концепция "приложений", таких как Excel. Имея в виду,что в будущем ИИ-агенты будут просто выполнять задачи по запросу пользователя — без нужды в интерфейсах, кнопках, шаблонах и т.д. Excel нужен чтобы проанализировать данные, а ИИ-агент может выдать пользователю сразу ответ, без промежуточной таблицы или создав на ходу подходящее приложение, если в нем есть необходимость. Пользователи Reddit в комментах считают, что идея «смерти всех приложений» пока это больше маркетинговый ход и утопия, чем реальное предсказание. Многие области деятельности, например, финансы, требуют не только ответ, но полную и понятную трассировку расчета, да и модели пока не демонстрируют безупречных результатов. Будущее — это гибрид: ИИ-помощники в связке с понятными, проверяемыми инструментами, а не полная замена. В youtube интервью разработчик, запустивший проект Claude Code (агент для программирования), заявил, что 80% кода был сгенерирован самим ИИ, а человек лишь задавал направление и проверял результат. Пользователи Redditа предсказывают скорое появление AGI (искусственного общего интеллекта) и подтверждают, что разработка с ИИ уже радикально изменилась. Побеждает не тот, кто пишет код, а тот, кто умеет грамотно ставить задачи ИИ.

Последнее время с ростом способностей искусственного интеллекта нередко обсуждается, кому будет принадлежать будущее — "кремн
Последнее время с ростом способностей искусственного интеллекта нередко обсуждается, кому будет принадлежать будущее — "кремниевым" или "кожаным"... 15 мая в 12:00 Владимир Крылов проведет новую лекцию, на которой познакомит вас с симбиотическим объектом, получившим название биокомпьютер CL1. В нем совместно функционируют и живые нейроны человека, и кремниевые электрические схемы. Энергию им несут и электрический ток, и питательный бульон. Что может CL1 уже сегодня? Куда ведут исследования и стоит ли задуматься о покупке? Ведь он уже продается за 35 тысяч долларов... Подключайтесь и задавайте вопросы лектору! Их можно оставить в чате на YouTube или в комментариях к этому посту.

Как устроены AI-агенты? Рассказала Анна Авдюшина, основываясь на систематическом обзоре, где выделены 18 архитектурных паттернов для построения таких агентов. Анна Авдюшина преподаёт на факультете «Программная инженерия и компьютерная техника» и работает инженером в центре «Сильный ИИ в промышленности» университета ИТМО. Вместе разбираем: 🔵как агенты интерпретируют расплывчатые цели пользователей и превращают их в планы действий; 🔵каким образом они могут рефлексировать, запрашивать помощь у других агентов или человека и принимать коллективные решения; 🔵какие подходы позволяют повысить надёжность, объяснимость и гибкость работы агентов. Запись лекции доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

Vibe Coding News за эту неделю: Cursor опубликовал список самых популярных и быстрорастущих моделей среди разработчиков. Ведущие позиции заняли Claude 3.7 Sonnet и Gemini 2.5 Pro. DeepSeek V3.1 и модели o3, o4-mini показывают стремительный рост. У Claude появилась MCP интеграция с продуктами Atlassian, Zapier, Intercom. Cursor теперь может создавать, читать и изменять Figma-файлы, создавая дизайн через новый сервер MCP. Согласно данным от Anthropic, ИИ преимущественно используется в задачах разработки программного обеспечения, что указывает на его трансформирующее влияние на отрасль. На конференции Meta LlamaCon Сатья Наделла заявил, что 20–30% кода в репозиториях Microsoft создается ИИ. Лучше всего ИИ справляется с Python, хуже — с C++. CTO Microsoft ожидает, что к 2030 году до 95% кода будут писать ИИ. Для сравнения: Google уже генерирует более 30% кода с помощью ИИ. Meta пока не раскрывает свои цифры. Точные методики подсчета неясны, но тренд очевиден. Марк Цукерберг заявил, что в ближайшие 12–18 месяцев LLM-модели смогут сами писать большую часть кода для дальнейшего развития ИИ - по крайней мере внутри Meta. В комментариях скепсис: Сроки уже сдвигались (раньше говорил «до конца 2025»), модели часто выдают раздутое и переусложнённое решение, с фундаментальной наукой ИИ всё ещё не справляется. Сайлас Альберти из Cognition (создатели Devin) анонсировал DeepWiki —энциклопедию всех репозиториев GitHub обработав 4 млд строк кода. Заменив любой URL публичного репозитория GitHub на https://deepwiki.com/org/repo, можно получить вики-подобное описание библиотеки и чат-бота на базе Devin для помощи в использовании. Cognition’s DeepWiki интегрирован с чат-ботом, поддерживаемым Devin, для объяснения кода в репозиториях. Пропустили что-то важное?

Есть ли у вас какие соображения о специфичности UX/UI для взаимодействующих с ИИ систем в режиме диалога? Исследование, опубликованное в https://dl.acm.org/doi/10.1145/3706598.3714222 показало, что текстовое чат-взаимодействие может быть значительно улучшено для удобства пользователя, если его дополнить GUI , отражающим прогресс - Conversation Progress Guide (CPG). Сегодня мы вместо текстового обзора содержания статьи предлагаем аудиозапись подкаста, подготовленную ИИ после прочтения.

Завтра в 14:30 проведем прямой эфир с Антоном Мальцевым (ML Lead в Artisight, фаундер RemBrain, автор YouTube- и Telegram-кан
Завтра в 14:30 проведем прямой эфир с Антоном Мальцевым (ML Lead в Artisight, фаундер RemBrain, автор YouTube- и Telegram-каналов) о технической стороне современных нейросетей. Мы поговорим: 🔵об аппаратных компонентах, критичных для эффективной работы с ИИ; 🔵о том, как оптимизировать код под разные аппаратные архитектуры; 🔵об особенностях инфраструктуры для обучения и инференса; 🔵о практических решениях проблемы дефицита GPU. Антон поделится техническими деталями и ответит на ваши вопросы в прямом эфире. Присоединяйтесь, чтобы узнать о «железной» стороне AI-разработки — это особенно актуально в условиях растущей стоимости вычислительных ресурсов. 📅 Подключайтесь! #ML_инфраструктура #оптимизация_моделей #разработка_ИИ #прямой_эфир

Пост от Andrej Karpathy про подход к профессиональной коммерческой разработке с применением AI. Как создавать код, за который надо будет потом отвечать. Замечаю, что при серьезной работе с AI над кодом у меня выработался ритм. И он сильно отличается от «Vibe Coding». Кратко по шагам: 1. Собрать весь контекст. Если проект небольшой — всё подряд в промпт:
files-to-prompt . -e ts -e tsx -e css -e md --cxml --ignore node_modules -o prompt.xml
На больших — тщательно выбираю нужные файлы. Чем полнее контекст, тем меньше шансов на бред в ответах. 2. Описать маленькую конкретную задачу. Не просить сразу код, а попросить несколько вариантов реализации с их плюсами и минусами. Почти всегда есть несколько способов сделать что-то, и LLM не всегда выбирает оптимальный способ. 3. Выберите один подход, попросите первый набросок кода. 4. Проверка и обучение. Открываю всю документацию по API функций, которые я раньше не вызывал или с которыми я менее знаком, прошу объяснений, уточнений, изменений, порой вернуться и попробовать другой подход. The Answer to the Ultimate Question of Vibe Coding, Life, the Universe, and Everything is hidden in point 5 — tragically off-limits to the uninitiated. 6. Тестирую 7. Git commit. Затем спрашиваю: "что можно улучшить дальше?". Повторяю. Вот такой цикл разработки с ИИ. Акцент делается на том, чтобы держать на очень коротком поводке этого нового чрезмерно рьяного младшего разработчика с энциклопедией в голове и нулевым чувством вкуса к хорошему коду. Он блефует, ошибается, не отличает красивое решение от костыля. И акцент на том, чтобы быть медленным, осторожным, параноидально все проверять и контролировать, сталкиваясь с чем-то незнакомым обучаться на ходу самому, а не делегировать Эти шаги приходится выполнять вручную. Это неудобно, не автоматизировано, не поддерживается в современных инструментах. Мы все еще на начальной стадии развития и в области UI/UX для программирования с применением AI еще предстоит многое сделать. PS. Возможно, вы заметили, что здесь нет пункта 5 - это потому, что его нет и в оригинальном посте Karpathy. Думаем, что в пункте 5 ответ на главный вопрос вайбкодинга, жизни, вселенной и всего такого, но к сожалению он только для посвященных.