AI4Dev — AI for Development

前往频道在 Telegram

Что надо знать, чтобы остаться востребованным ИТ специалистом в мире с LLM? • Обзоры продуктов, фреймворков и способы взаимодействия с LLM для разработки софта • Реальные кейсы, pet и бизнес проекты с LLM • Публичные лекции В будущее берут не всех!

显示更多

俄罗斯110 383 技术与应用18 609

5 244

订阅者

+124 小时

+177 天

+8130 天

1 238

帖子浏览量

~ 79524 小时

~ 87548 小时

23.61%

参与率

无数据

每日帖子数

Ads index

beta

帖子存档

5 244

Вспоминаем формат дайджеста за неделю: В ноябре прошёл AI Engineer Code Summit - событие со звёздными докладчиками из OpenAI, Anthropic, Google, Meta, Cursor, Netflix и других лидеров индустрии. В открытом доступе - 8 часов докладов, ориентированных на практикующих инженеров, которые пишут код с ИИ и для ИИ: работа с агентами, оптимизация кодовой базы под агентов, вот это все. Обнаружили опенсорсный проект Mimir - векторную и графовую базу знаний для AI-агентов разработки. Работает на базе Neo4j, автоматически строит связи между задачами и хранит и шерит весь контекст для всех агентов навсегда. Создатели утверждают, что это идеальный вариант для долгосрочных проектов с мультиагентной работой и оркестрацией сложных задач. Сейчас 125 звёзд на GitHub. Antigravity IDE - нам, как и многим, почему-то никак не удавалось авторизоваться на прошлой неделе в новой AI-среде разработки на базе Gemini от Google. Впрочем с выходом Opus 4.5 стало уже и не так интересно. Новость недели, которую все знают - вышел Claude Opus 4.5: победил всех на всех бенчмарках, включая Gemini 3. Цена - $25 за output MTok. Тестируем: пока всем нравится. Ждём прикладных инсайтов и прорывов.

5 244

🎙Говорим о вайб-кодинге 28 ноября в 12:00! Что случилось с понятием "вайб-кодинг" за этот год и чего ждать в следующем, расскажет Константин Чуйков — автор канала "Вайб-кодинг по Чуйкову" и лидер сообщества Vibe Coding Community. 🎥 В эфире: → Как вайб-кодинг появился и какую вызвал реакцию → Как изменились подходы и инструментарий → Как мы перешли из промпт-инженерии в контекст-инженерию → Как мы пришли к пониманию рабочего воркфлоу и spec-first подходу → Как изменился рынок найма → Бум курсов по вайб-кодингу Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Константину!

5 244

Говорят, что поиск работы — это ещё одна отдельная работа... Как подойти к трудоустройству в ИТ системно? Своим опытом поделится Дмитрий Савелко, Senior Data Scientist (Сбер, Газпром, Точка Банк) и автор телеграм-канала Ebout Data Science. ⚡️ В эфире: → Как собрать данные о потенциальном работодателе и адаптировать рассказ о себе, чтобы продать свое умение решать их конкретную проблему → Играть с позиции изобилия, а не нужды, чтобы создать у нанимателя ощущение срочности и дефицита → Манипулировать ценностями: для BigTech — преданность и корпоративная культура, для стартапов — самостоятельность и готовность "вжаривать" для решения хаоса → Самопрезентация: уверенный голос, паузы и диалог "на равных" → Поиск работы как ML-проект: учет всех коммуникаций и анализ ошибок. Отказ — это не провал, а просто новый data point. ⏰ Запускаем трансляцию 27 ноября в 12:00. Смотрите на YouTube, в ВК или прямо в этом канале! P. S. Конечно, немного оффтоп для нашего канала, но тема настолько полемичная, что мы не удержались ☺️

5 244

Рассуждающие модели развиваются быстрее, чем пользователь успевает понять, как же они работают... LRM генерируют ответ через множество шагов — промежуточных вопросов и утверждений — и благодаря этому справляются с очень сложными задачами. Доктор технических наук Владимир Крылов рассказал о новейших исследованиях, которые объясняют, как формируется ответ такой модели на промпт и как влияют на этот процесс нейронные паттерны активаций и внедрённые концепты. Также в лекции: → базовые идеи устройства и принципы работы LRM; → ключевые алгоритмы и техники результативного рассуждения; → примеры применения этих моделей на практике. Запись лекции доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

5 244

В последнее время часто всплывает опенсорс-тул для создания приложений - Spec Kit. Его авторы утверждают, что инструмент «помогает сосредоточиться на сценариях использования и предсказуемых результатах, а не на вайб-кодинге с нуля». 50 тысяч звёзд на GitHub звучит убедительно. Мы решили разобраться, что это за зверь, и сравнить его с нашим подходом. 1. Первое впечатление Пожалуй, самый интересный из менеджеров разработки, что нам попадались. Но, как всегда, нюансы решают всё. 2. Наш эксперимент Один и тот же разработчик, один и тот же проект: MVP веб-приложения на 5 ролей, у каждой роли по 4-6 разделов. Около 26 тысяч строк кода с тестами (в «прошлой жизни» это примерно год работы). • чистый Claude Code - 3 дня • Spec Kit + Claude Code - 5 дней Результат: ускорение отрицательное. 3. Как это устроено По сути, Spec Kit - это набор промптов поверх вашего агента (Claude Code, Cursor, Copilot и т. д.). Сначала формулируете продукт и бизнес-требования, затем на их основе генерируете документацию, потом - задачи, и уже по ним пишется код. Метод классный, даже прорывной, если до этого вы работали стихийно. Но когда процесс уже выстроен, он может добавить больше трения, чем скорости. 4. Ограничения В процессе планирования инструмент выдал фразу, что он «хорошо работает с проектами до 50 задач», а дальше контекст разваливается. Не знаем, можно ли этому доверять - в документации Spec Kit такого нет. Наш эксперимент был на проекте примерно в 200 задач. Возможно, на меньших проектах эффективность выше. 5. Почему у нас не взлетело Мы и так начинаем с бизнес-требований, затем делаем техзадание, потом задачи - и в таком режиме работаем с агентами. Spec Kit не дал принципиального улучшения, зато как только начинаются правки (а они начинаются всегда), появляется двойная каша: классическая от модели и новая - от методологии Spec Kit. Стоит добавить кастомные инструкции - и Spec Kit теряет фокус: забывает собственные требования и стили кодирования, отключает тесты и т. д. 6. Ещё один барьер Чтобы получить внятный результат, нужно уметь ~~послать запрос во Вселенную~~ формулировать бизнес-требования. Это ровно то, чего Spec Kit не решает. Он неплохо превращает бизнес требования в техзадание и таски, но принцип garbage in - garbage out всё ещё актуален. Вам все еще надо уметь описывать чего вы хотите. У нас для этого есть собственный инструмент - Аналитик-Кентавр, который помогает быстро формировать Видение проекта и User Stories. Вывод Хороший инструмент, если вы только начинаете систематизировать процесс. Но если у вас уже есть сильный аналитический контур - пользы немного, а трений добавится. P.S. Пока мы всё это тестировали, кто-то уже успел написать инструкцию по использованию на Хабре!

5 244

Как фоновые агенты решат проблемы неэффективности дата-центров? Расскажет Максим Шаланкин, Machine Learning Team Lead из MWS. ⚡️В лекции: → Простаивающие мощности: как фоновые агенты превращают простой GPU и CPU в источник ценности. → Технические особенности работы LLM: где именно в инференсе появляются окна для запуска фоновых задач. → Фоновые агенты как новый слой инфраструктуры: автономные рабочие, встроенные в дата-центры и корпоративные системы. → Класс задач для фоновых агентов: исследование данных, безопасность кода, документооборот и рыночная аналитика. → Как считать пользу фоновых агентов: от загрузки железа и эквивалента майнинга до бизнес-метрик и ROI. → Стратегия компании в эпоху фоновых агентов: почему раннее внедрение даёт устойчивое конкурентное преимущество. ⏰ Запускаем трансляцию завтра, 19 ноября, в 12:30. Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Максиму!

5 244

Рассуждающие модели развиваются быстрее, чем пользователь успевает понять, как же они работают... LRM генерируют ответ через множество шагов — промежуточных вопросов и утверждений — и благодаря этому справляются с очень сложными задачами. Доктор технических наук Владимир Крылов расскажет о новейших исследованиях, которые объясняют, как формируется ответ такой модели на промпт и как влияют на этот процесс нейронные паттерны активаций и внедрённые концепты. Также в лекции: → базовые идеи устройства и принципы работы LRM; → ключевые алгоритмы и техники результативного рассуждения; → примеры применения этих моделей на практике. ⏰ Запускаем трансляцию 13 ноября в 12:00. Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы лектору!

5 244

Обсудили с Игорем Асоновым, как выбраться из карьерного кризиса с помощью ИИ. Игорь работает в онлайн-кампусе ВШЭ, руководит его центром аналитики и прогнозирует востребованность различных направлений обучения. Это видео — небольшой оффтоп для нашего канала. Но, кажется, если коллега ML'щик делится собственным ~~выстраданным~~ опытом, такое лучше не пропускать ☺️ Итак, в этом выпуске: → Личная история поиска своего профессионального трека → Преимущества и недостатки кремниевого коуча → Метод взаимодействия с ИИ, который развивает, а не отупляет → Как ИИ влияет на систему образования (тесты бесполезны, а дети учат ChatGPT кукарекать) → Почему LLM в роли напарника — must have для современного специалиста Запись доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

5 244

Вайб-кодинг — это не просто новый тренд, это философия разработки, где интуиция важнее идеального плана, а ИИ становится твоим со-пилотом в потоке. Вместе с Александром Агафонцевым, экспертом по автоматизации с ИИ и автором телеграм-канала "ИИзи Бизнес", разбираем: 🔵Что такое вайб-кодинг и почему это будущее разработки? 🟣Как ИИ меняет подход к написанию кода? 🔵Почему "идеальная архитектура" иногда убивает скорость? 🟣Как найти баланс между хаосом и структурой? 🔵Реальные кейсы: что можно автоматизировать уже сегодня? 🟣Почему молодое поколение разработчиков кодит по-другому? Запись интервью доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

5 244

Заходят как-то директор по развитию бизнеса, проджект-менеджер и аналитик в бар. А бармен им и говорит: — Зачем вам троим Vision & Scope? 💥 Это и обсудим сегодня в 14:00. Разберём, зачем нужен этот документ, из чего он состоит и как теперь его создают вместе с ИИ. Подключайтесь к обсуждению на YouTube или прямо в этом канале!

5 244

Говорим о применении LLM в найме с Николаем Шейко — экспертом по внедрению ИИ в неайтишный бизнес, который строил HR-продукты для американских технологических гигантов. Он расскажет, как искусственный интеллект меняет рекрутинг, собеседования и найм персонала. 🔥 Обсудим: → Как ИИ уже изменил собеседования в BigTech → Можно ли обмануть ИИ-рекрутера (и стоит ли) → Какие навыки станут бесполезны, а какие — критичны → Как готовиться к собеседованиям в эпоху ИИ → Инсайды из разработки HR-систем для крупнейших компаний → Внедрение ИИ в найм вне IT: кейсы и ошибки ⏰ Запускаем трансляцию завтра, 6 ноября, в 14:00! Смотрите на YouTube, в ВК или прямо в этом канале!

5 244

🔝Говорим о безопасности LLM с Сергеем Зыбневым — тимлидом-пентестером (белым хакером) и создателем телеграм-канала "Похек". Обсуждаем: 🔵тестирование безопасности LLM и обнаружение уязвимостей; 🔵использование ИИ для поиска багов и тестирования безопасности; 🔵практический опыт работы с безопасностью ChatGPT и других LLM; 🔵вайб-кодинг: как изменилась разработка с приходом LLM; 🔵реальные кейсы из практики пентестинга; 🔵будущее AI в кибербезопасности. Запись интервью доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

5 244

История диалогов с LLM в Cursor и Claude Code устроена чудовищно: сотни и тысячи сообщений улетают в трубу при обновлениях или переносе папки проекта, найти что-то двухнедельной давности при плотной работе практически нереально. А ведь там (я точно помню!) были настоящие алмазы и в вопросах, и в ответах. Поэтому вдохновитель и гуру вайбкодинга в нашей команде, Николай Докутович, собрал мощный вьюер Cursor & Claude Code History Viewer (Enhanced) — десктопное приложение, которое: • подтягивает историю сообщений из Cursor и Claude Code; • даёт быстрый полнотекстовый поиск по всем сессиям; • показывает таймлайн и фильтры (дата, проект, файл, роль); • считает базовую статистику (кол-во сессий/сообщений, диапазоны дат); • работает локально, ничего никуда не отправляет; • Mac/Win/Linux. В основе открытый проект, к которому Коля избирательно и аккуратно добавил лучшие фичи из нескольких форков, допилил работу с Cursor, настроил через GitHub Actions сборки под три ОС (macOS, Linux, Windows) и добавил английскую и русскую локали (где-то ещё может проскочить корейский — не обессудь, вайбкодер). Github: исходники тут, скачать тут. Инджой!

5 244

В Claude Code появился полноценный sandbox (filesystem + network isolation). Теперь Claude может свободно править код и гонять bash-команды без постоянных permission-запросов, но строго внутри изолированной среды. В Anthropic утверждают, что количество подтверждений сократилось на 84%, а prompt-inject более не страшны. Что даёт: - Не дотянется до системных файлов (читать/писать можно только в разрешённых директориях); - Сетевая изоляция, ходить можно только туда, куда разрешено, а отправить ваши SSH ключи и паспортыне данные га shady-server.biz не получится. Всё остальное выполняется без лишних диалогов и подтверждений, ведь даже если Claude сойдёт с ума, он остаётся «в мягкой комнате». Также появился Claude Code в облаке, где git-ключи живут снаружи — пуши идут через безопасный прокси. Песочница реализована с помощью bubblewrap (Linux) и Seatbelt (macOS) + прокси для сетевых ограничений. Windows - пока не заявляли. Это open source, можно встроить в своих агентов.

5 244

Упоминали вот тут инструменты управления контекстом от Anthropic, но не сказали о статье с теоретической частью - Effective context engineering for AI agents. Исправляемся. Если совсем коротко, то там о том, что промпт-инжиниринг - все, так уже не носят, теперь говорим контекст-инжиниринг. Если чуть подробнее - в эпоху «prompt engineering» важно было правильно сформулировать запрос. Теперь на первый план выходит context engineering - умение управлять всем, что попадает в окно модели: инструкции, история, данные, инструменты. Контекст - ограниченный ресурс. Чем он больше, тем выше риск «шума» и потери фокуса. Задача инженера оставить в нём только самое ценное: сжатые факты, нужные подсказки, минимальные, но точные примеры. 🔹 Контекст = рабочая память агента 🔹 Цель = максимум сигнала при минимуме токенов 🔹 Методы = краткость, субагенты, динамическое извлечение данных В общем, база, особенно для строителей агентов.

5 244

Теория мертвого интернета — чистая конспирология или реальный прогноз? Рассказывает Владимир Крылов, доктор технических наук и научный консультант по применению ИИ в разработке ПО. Посмотрим свежим взглядом на опубликованную в 2021 году теорию DIT — Dead Internet Theory. Многие назвали её конспирологической, с таким комментарием она присутствует в Википедии и сегодня. Но прошедшие годы ознаменовались событиями, которые скорее развеивают конспирологические основания, чем подтверждают их. Факты доказывают утверждения об отдалении "сети сетей" от первоначальных целей и "расчеловечивании" the Internet. Запись лекции доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

5 244

Вайб-кодинг — это не просто новый тренд, это философия разработки, где интуиция важнее идеального плана, а ИИ становится твоим со-пилотом в потоке. Вместе с Александром Агафонцевым, экспертом по автоматизации с ИИ и автором телеграм-канала "ИИзи Бизнес", разберем: 🔵Что такое вайб-кодинг и почему это будущее разработки? 🟣Как ИИ меняет подход к написанию кода? 🔵Почему "идеальная архитектура" иногда убивает скорость? 🟣Как найти баланс между хаосом и структурой? 🔵Реальные кейсы: что можно автоматизировать уже сегодня? 🟣Почему молодое поколение разработчиков кодит по-другому? ⏰ Запускаем трансляцию сегодня, 15 октября, в 18:00! Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Александру! Поспорим с классическими подходами в разработке ☺️

5 244

Еще одни создатели кодинг-агента Augment Code сравнили Sonnet 4.0 и 4.5 — и... 4.5 оказался быстрее и качественнее. Кто бы мог подумать. Их результаты такие: Приложение с нуля: - 4.5: 20 мин, работающие приложение. - 4.0: 40+ мин, качество хуже. Простое изменение кода: - 4.5: 3 вызова, корректный апдейт. - 4.0: более длинная цепочка, такой же результат. Сложный рефакторинг: - 4.5: быстрее + тесты пройдены. - 4.0: медленнее + тесты завалены.

5 244

Пост в блоге кодинг агента Cline о том, что открытые модели стремительно догоняют закрытые в области агентов редактирования кода. Новая модель GLM-4.6 ( от Zhipu / Z.ai одной из китайских компаний-«ИИ-тигров») показала 94.9% успеха в тестах Cline против 96.2% у Claude 4.5, при этом стоит в 8 раз дешевле (или open source, если есть где развернуть). PS: на картинке кажется перепутали Sonnet 4 и 4.5

5 244

Anthropic пару месяцев назад выпустили Claude Code Security Reviewer - бот-ревьюер, который ищет уязвимости в GitHub-репо и советует, что починить. Теперь Google DeepMind ответил своим CodeMender — агентом, который не советует, а сразу лезет чинить код сам: патчит, тестит, откатывает, и т.д. Пока что оба под присмотром людей. Гугл заявляет, что в процессе разработки за полгода CodeMender уже внёс 72 security-фикса в open source-проекты, включая те, где кода под 4,5 миллиона строк.