ИИ для продакта & CPO | Влад Прошинский
رفتن به کانال در Telegram
Авторский блог об ИИ Обо мне: https://t.me/AImademyday/4 Ссылки: https://asmadey.created.app/ Для связи: @asmadeyi
نمایش بیشتر1 372
مشترکین
اطلاعاتی وجود ندارد24 ساعت
+27 روز
+1130 روز
آرشیو پست ها
Защита от Prompt Injection и слива PII
У ИИ агентов просматривающих веб-страницы, есть проблема: они читают всё — баннеры с уведомлениями о файлах cookie, скрытые инструкции, теневые паттерны — и не могут отличить настоящий контент от ловушки.
Agent Browser Shield находится между агентом и вебом, удаляя промпт инъекции, маскируя перс. данные, устраняя теневые паттерны и фильтруя информационный шум, который расходует токены.
Бесплатно, исходный код доступен, работает с Browser-use и Browserbase.
Не знаете тех, кто хотел раскатить ИИ в компании, но всё ещё не сделал это?
Это нужно не для сотрудникам, а компании, которая несет риски.
выгоды:
- в 8,5 раз дешевле чем каждому покупать подписку
- на РФ сервере
- с интерфейсом как у ChatGPT
- с контролем прав, аналитикой трат и токенов
- можно локально на своем железе (опен-сорс Gemma / QWEN / DeepSeek и т.)
За успешную рекомендацию = вам 30% (50 тыс.)
Есть преза, там план работ, стоимость и ответы на часто задаваемые вопросы.
Пишите в ЛС @asmadeyi
== Зачем нужен корп. ИИ? ==
я не понимаю зачем это компаниям? Если реально например у штатного сотрудника и так есть и ChatGPT и Claude?↓↓↓ 1. Сотрудники сливают корп. и перс. данные (когда работают с таблицами / договорами) - сотруднику слившему с рабочего ПК — лишение свободы до 6 лет + штраф до 1 млн руб. по ст. 272.1 УК РФ - юр.лицу — штраф до 6 млн руб. по ч. 8 ст. 13.11 КоАП РФ - ген. диру — уголовка по ст. 272.1 УК РФ (до 6 лет + штраф до 1 млн руб.) 2. РКН запрещает использовать западные сервисы для передачи ПД по ч. 8 ст. 13.11 КоАП РФ. Физике без ПД ничего не будет, компании — штраф до 6 млн руб. 3. Не у всех есть стабильный и рабочий VPN. 4. ИИ использует ~10-20% от всего числа сотрудников организации. В век ИИ в интересах компании, чтобы 95% штата использовали ИИ. Компания от этого выигрывает. 5. Результат работы с ИИ принадлежит компании. Уходит сотрудник — уходит процесс (к конкуренту?), в рамках которого был достигнут результат 6. Без корп. ИИ каждый сотрудник делает работу по своему → разное качество. С корп. ИИ: единые шаблоны для работы, единая база знаний о компании, клиентах, целях, показателях. У личного ИИ этого нет.
↓
Роль PM умирает в эпоху ИИ?
Скорее она расщепляется: крут не тот, кто лучше пишет PRD, а тот, кто умеет быстрее строить, тестировать и принимать решения по реальности, а не по согласованиям.
==
Что такое скорость в контексте роли РМ с ИИ?
1. Дата: Есть накопленная И структурированная база, с которой ИИ может работать:
- инфа о компании, продукте (а не хаос в конфлюенс)
- БД с логами куда ИИ может ходить (ему это не запрещено)
- настроена интеграция с Jira / Linear
- собрано 90% компонентов в дизайн системе в Figma/HTML
- четко сформированы цели
и т.п.
2. Прототипы: У вас есть база фреймворков для сборки прототипов/MVP/PoC (GSD, Superpowers и т.п.)
3. MVP: Есть готовые плагины / фреймворки / Skills для работы, которые позволяют ускорять каждый кусок свои работы. Можете отдекомпозировать «Что строить сейчас, а что позже?»
4. Спеки. Вам не нужен бизнес-аналитик / системный аналитик / продуктовый аналитик. 80% их работы вы уже научились автоматизировать с помощью ИИ:
- Пишет понятную спеку для агента
- проектирование А/B-тестов
- написание аналитической записки для рук-ва
- разбор логов, извлечение данных из БД
- написание спек/ТЗ/БФТ/PRD
и т.п.
5. Майндсет продакта Обновленный майндсет за счет практики и экспериментов за те 2-3 года, которые ИИ уже активно развивается. У вас должно быть сформировано Мышление чтобы вы могли разложить хаос в строимую систему.
6. Коммуникации: ИИ сжимает координацию, письма, статусы и мониторинг почти до нуля. Вы больше не пишите письма, а наговариваете + ИИ форматирование.
7. Процессы: вы оператор, и проектируете рабочие процессы под LLM-driven (вход → модель → выход → петля обратной связи) и координируете агентов как коллег (назначить → проверить → слить)
9. evals: вы рассуждаете о задержках, стоимости токенов и качестве как о продуктовых решениях
10. экономика: вы уже знаете что SLOP не продается, а потому не бежите что-то вайбкодить сломя голову, как 90% спецов сейчас.
11. жизненный цикл: вы понимаете что должно быть на каждом этапе зрелости: прототип → пилот → прод. и что каждый этап имеет свой confidence на успех в метриках. И не стремитесь его перепрыгнуть.
12. целеполагание: вы понимаете как решение встроится в текущий бизнес/бизнес-процесс (сюрприз: 80% не встраиваются (!), хотя решают важную задачу, люди должны получать существенно больше пользы в сравнении со старым решением, иначе churn стремится к 0)
13. безопасность: проектируя публичные ИИ решения, вы руководствуетесь DLP политиками, требованиями ФСБ к обработке и хранению PII.
13. стратегия. так, как ты кожаный мешок, и можешь много чего забыть/не учесть, то понимаешь что ИИ, сильно лучше в этом, если имеет достаточно контекста. ИИ ведёт диалог-интервью с тобой, пока не сгенерирует полный strategy.md.
14. планирование: ты не планируешь. ты управляешь планированием /co-ideate /co-brainstorm /co-plan, автоматически генерирует все тикеты и пушит их прямо в Linear.
15. мониторинг: ты не смотришь в дашборды, ты реагируешь на изменения: по крону в 8 утра автоматически приходит 1page отчёт о пульсе продукта, аномалии в данных помечаются автоматически.
==
Если это начать делать, то PM перестает быть человек-процесс / говорун / выскочка и прочие высказывания которые я слышал о продактах от коллег кто "делает реальный результат".
Google выпустили Speech-2-speech переводчик Gemini 3.5 Live Translate
🎞 https://youtu.be/TNwKs39uSVk
70 языков
По API ~2$ в час
Модель поддерживает 70+ языков и уже интегрируется в Translate / Meet / Gemini Live API / AI Studio.
====
можно строить продукты вокруг этого
Интересный вектор изменения роли Product Manager → Product Engineer
🎞 доклад
Будущее за генералистами?
Аудит кэша ключ-значение между провайдерами
Подглядел у Рефата зачетный скилл, который не херово так экономит токены..
Проблема: бывает что повторное использование кэша LLM обычно (тихо) завершается с ошибкой. Причины могут быть разные: измененные схемы tool calls, измененное первое сообщение пользователя, резервный вариант вызова OpenRouter могут превратить ретрай на 20 000 токенов в холодное предварительное заполнение.
sernote/audit-prompt-caching - Skill, который вы запускаете в своем проекте и агент проходится по реальному коду: проверяет шаблоны промптов, сборку tools и схемы, логику истории, конфиги роутинга, специфичные для провайдеров особенности (OpenAI / Anthropic / OpenRouter / vLLM). Включая пачку полезных скриптов, например статический анализатор истории LLM вызовов - что сделать чтобы улучшить попадание в кэш (= сделать AI приложение дешевле и быстрее).
Пример модели ROI для 1000 запросов с 9000 статическими входными токенами, 300 динамическими входными токенами, 2000 выходными токенами, коэффициентом попадания в кэш 71% и явными примерами цен:
Total cost: $34.60 -> $23.10
Total savings: 33.24%
Input savings: 61.84%
🛠 Инструменты
• Magic Layers в Canva — Автоматическое разделение изображений на редактируемые слои.
• Google: открытая модель 2.4B для генерации музыки — Локальное создание музыки в реальном времени на мобильных устройствах.
• Gemma 4 12B в формате GGUF — Возможность локального запуска мощной модели Google.
• Cursor: Design Mode — Редактирование веб-интерфейсов визуальными указателями прямо в IDE.
• pg_durable — SQL DSL для организации рабочих процессов ИИ внутри Postgres.
• sem — Семантический контроль версий, отслеживающий изменения функций и классов.
• Vokal — Рабочее пространство для запуска и анализа проектов ИИ-агентов.
• Papera — ИИ-блокнот, преобразующий текст в многоблочные макеты страниц.
• Miso — Голосовые агенты с клонированием голоса и локальным развертыванием.
• ChartCool — Создание профессиональных диаграмм по одному текстовому запросу.
Ключевое за 3 дня
⚡ Главное
• NVIDIA представляет Nemotron 3 Ultra — Открытая MoE-модель на 550 млрд параметров для долгосрочных агентов.
• США и Япония запускают ИИ-партнерство на 1 млрд долларов — Партнерство для ускорения научных открытий в рамках миссии Genesis.
• Anthropic: Claude теперь достигает 52-кратного ускорения кода — Модель Mythos Preview решает задачи оптимизации кода в 52 раза быстрее.
• NVIDIA представляет исследовательского гуманоидного робота — Представлен референсный дизайн гуманоида для академических исследований.
• Nydia и SK Hynix заключают пакт о разработке чипов ИИ — Многолетний договор о совместной разработке памяти и чипов нового поколения.
• NVIDIA Cosmos 3: платформа для физического ИИ — Среда для разработки роботов от симуляции до реального воплощения.
📈 Рост и Оптимизация
• Боты впервые обогнали человеческий трафик в интернете — Агентский трафик превысил человеческий объем данных в сети.
• Исследование Стэнфорда: ИИ превосходит профессоров права — В 75% случаев ответы ИИ были признаны лучше ответов экспертов-людей.
• GPT-4.5 официально прошел тест Тьюринга — Исследование подтвердило человечное поведение модели в диалоге.
• Аналитика KPMG: 75% компаний не знают расходов на ИИ — Три четверти организаций не имеют точного учета затрат на внедрение нейросетей.
🤖 Промпты и Практика
• 20 лучших промптов для повышения креативности — Набор запросов для генерации идей и творческих концепций.
Чек-лист готовности к внедрению ИИ
немного обновил после общения с С-директорами на ProductCamp
Нужно отвечать на вопросы Да / Частично / Нет
Стратегия
1. Мы понимаем, зачем внедряем ИИ и какие задачи он решает
2. Инициатива поддержана руководством и есть в стратегии
3. Есть хотя бы один бизнес-сценарий, на котором зарабатывают
4. Понятно где можно измерить эффект (время, качество, стоимость)
Люди
1. Есть те, которым интересно в ИИ + эксперименты
2. Руководители активно используют ИИ в работе
3. Команды не боятся ошибок и готовы шерить опыт
4. Задачи по внедрению ИИ есть у С-левела в KPI
Процессы
1. Целевой процесс уже стандартизирован, прежде чем быть автоматизированным
2. Есть ответственные и определены роли при внедрении
3. Мы умеем доводить эксперименты до устойчивого результата
Данные
1. У нас есть материалы (документы, базы, инструкции), на которые ИИ может опираться
2. Эти данные структурированы, актуализируются и доступны (БД/API)
3. Есть понимание, какие данные можно, а какие нельзя (политики работы с data)
4. Мы можем подключить ИИ к потоковым данным через API
5. Понимаем, как обновлять контекст модели без ручного вмешательства
Оценка эффекта
1. Мы оцениваем не «замену людей», а эффект от внедрения ИИ в конкретных процессах
2. Понимаем, что ИИ может ошибаться и требует проверки человеком
3. Принимаем, что результат приходит поэтапно: прототип → пилот → прод
4. Не ждём мгновенного ROI без подготовки данных и процессов
Масштабирование
1. Мы можем описать, что именно улучшится после внедрения
2. Есть способ измерить эффект (время, ошибки, качество, идеи)
3. Пользователи реально используют ИИ и дают обратную связь
4. Есть план масштабирования успешных кейсов
5. СЕО может похвастаться результатом на борд-комитете
6. МЫ сможем обеспечить 152-ФЗ и PII
↓↓↓
Подсчитай количество ответов «Да» (максимум 26).
0–7 → AI-Tourist Интересно, красиво, но без стратегии и данных.
8–13 → AI-Explorer Есть пилоты, энтузиазм и первые выводы, но нет потоков и интеграций.
14–19 → AI-Optimizer ИИ помогает в задачах, но работает локально, не системно.
20–23 → AI-First ИИ встроен в процессы, подключён к данным, создаёт измеримую пользу.
24–26 → AI-Native ИИ и данные живут в одной экосистеме. Компания обучается вместе с технологией.
Product Hunt за 2026-06-01 — 2026-06-06
1. Fundraisly
AI агент для сбора средств, который находит инвесторов и назначает встречи
👍 1119 голосов
💬 273 комментария
🧱 AI, Fundraising, Venture Capital
2. Mailwarm
Инструмент для разогрева email, улучшенный для доставляемости.
👍 592 голоса
💬 106 комментариев
🧱 Email, Email Marketing
3. Elentaria
Ваш GTM: от диагностики до исполнения
👍 561 голос
💬 97 комментариев
🧱 Marketing, Sales
4. Insforge Alpha
Ветвление в стиле Git для вашего бэкенда
👍 538 голосов
💬 185 комментариев
🧱 Developer Tools, GitHub, Open Source
5. SellerClaw
Команда AI агентов, которая управляет вашими магазинами по всем каналам
👍 527 голосов
💬 163 комментария
🧱 E-Commerce, SaaS
6. Shram
Ваша фоновая память для Claude
👍 497 голосов
💬 112 комментариев
🧱 AI, Productivity, Tech
7. Vokal
Пространство для совместной работы для 10x коллег с их AI агентами
👍 478 голосов
💬 54 комментария
🧱 AI, Messaging, Productivity
8. Mina Meeting Assistant
Ваш AI коллега теперь отвечает и выполняет задачи во время ваших звонков
👍 472 голоса
💬 135 комментариев
🧱 AI, No-Code, Productivity
9. Superlog
Сделайте ваш продукт без ошибок
👍 457 голосов
💬 79 комментариев
🧱 Developer Tools, GitHub, Open Source, Software Engineering
10. Astra Security
AI агенты, которые находят, проверяют и исправляют каждую уязвимость
👍 415 голосов
💬 56 комментариев
🧱 Developer Tools, SaaS, Security
11. SocialEcho
AI помощник для соцсетей для команд и агентов
👍 388 голосов
💬 134 комментария
🧱 Marketing, SaaS, Social Media
12. Leni
Самый точный в мире AI для инвесторов
👍 387 голосов
💬 65 комментариев
🧱 AI, Data & Analytics, Investing
13. Databox
Общайтесь с вашими бизнес-данными внутри Claude, ChatGPT и других
👍 361 голос
💬 60 комментариев
🧱 AI, Analytics, Productivity
14. Dune
Контекстно-зависимая клавиатурная панель для Mac, с Claude + расширениями сообщества
👍 359 голосов
💬 56 комментариев
🧱 AI, Developer Tools, Productivity
15. Google
Профиль для издателей/создателей, чтобы выделить свою работу в Поиске
👍 356 голосов
💬 15 комментариев
🧱 News, SEO, Search
16. Empromptu
Обучайте тонко настроенные модели с помощью AI приложений, которые вы уже создаете
👍 328 голосов
💬 114 комментариев
🧱 AI, Developer Tools, No-Code
17. Folk
AI в ваших сообщениях, который выполняет задачи
👍 307 голосов
💬 70 комментариев
🧱 AI, Messaging, Productivity
18. Gigacatalyst AI Builder for B2B SaaS
Дайте вашим командам продаж и поддержки суперспособности инженеров
👍 299 голосов
💬 39 комментариев
🧱 AI, SaaS, Sales
19. Typeahead
AI автодополнение для каждого приложения на вашем Mac
👍 299 голосов
💬 47 комментариев
🧱 AI, Productivity, Writing
20. Gemma 4 12B
Запускайте мультимодальный AI локально с архитектурой без энкодера
👍 297 голосов
💬 7 комментариев
🧱 Developer Tools, GitHub, Open Source
Добавил в YouTube канал +1 сценарий
→ Топ-10 прикладных видео по ИИ за неделю по количеству лайков и просмотрам.
Первый дайджест уже в канале → Videos of AI @ YouTube
Механика:
1. Робот ищет по таким ключам:
// --- Оригинальные (сохранены) --- "AI agents tutorial step by step", "AI tools tutorial for beginners", "AI agent building tutorial", "AI prompt engineering techniques", "best AI tools training", "prompt engineering best practices", // --- Claude Code (топ-тема в данных) --- "Claude Code tutorial beginners", "Claude Code agents how to build", "Claude Code best practices", "how to use Claude Code step by step", "Claude Code subagents tutorial", // --- Vibe Coding (частая тема) --- "vibe coding tutorial for beginners", "vibe coding with AI step by step", "how to vibe code AI app", "vibe coding no experience", // --- No-code AI app builders --- "build app with AI no code tutorial", "Lovable AI tutorial for beginners", "Cursor AI tutorial beginners", "how to build app with Cursor AI", "no code AI app builder tutorial", // --- n8n автоматизация --- "n8n tutorial for beginners", "n8n AI agents tutorial", "n8n workflow automation tutorial", "how to build n8n workflow step by step", "n8n automation for beginners 2025", // --- MCP (Model Context Protocol) --- "MCP tutorial for beginners", "how to use MCP AI agents", "MCP AI tools explained", // --- AI automation & workflows --- "AI automation workflow tutorial", "how to automate work with AI agents", "AI workflow automation beginners", "build AI workforce tutorial", // --- Конкретные инструменты --- "how to use ChatGPT agents tutorial", "OpenAI agent builder tutorial", "Gemini AI tutorial for beginners", "Google AI Studio tutorial beginners", // --- Монетизация (высокий спрос в данных) --- "how to make money with AI agents", "AI side hustle tutorial step by step", "build AI SaaS app tutorial beginners", // --- Продвинутые агенты --- "multi agent AI system tutorial", "autonomous AI agent build tutorial", "AI agent with memory tutorial", "local AI agent setup tutorial"↓↓ 2. 4 regex-фильтра отсекают шлак и кликбейт:
- tutorial|course|guide|training|learn|education|explained|masterclass|complete.*guide|step.*by.*step|beginners.*guide|how.*to.*build|fundamentals - money|rich|profit|earn|cash|income|\$|💰|sell|agency|business|client|freelance|side.*hustle|make.*money - autopilot|passive.*income|[\d]+k.*subs|faceless.*videos|youtube.*automation.*money|100%.*automated.*money - insane|crazy|ultimate.*secret|hack|trick|must.*do|steal.*these|best.*way.*to.*make|ways.*to.*make|you.*need.*to|[\d]+.*ways|[\d]+.*insane3. Фильтр по количеству просмотров и лайков: - >10000 views - >100 likes ↓↓↓ 🎬 YouTube дайджест — 07.06.2026 Hermes Agent - Full Course & Setup Guide - For COMPLETE Beginners Tech With Tim 👁 17851 | 👍 612 | 📅 05.06.2026 ────────────── Build Your Own AI Agent – Full Course with OpenAI, Langchain, Render Deployment freeCodeCamp.org 👁 60444 | 👍 2310 | 📅 02.06.2026 ..... Остальное в канале → 🔗Videos of AI @ YouTube
+1
Перешел с SuperWhisper (до этого был WhisperFlow) на Eloquent от Google
Бесплатно для iOS и macOS.
Приложение превращает поток речи в аккуратный текст: убирает слова-паразиты, исправляет оговорки и приводит мысли в читаемый вид.
Из интересного:
— Работает локально на устройстве
— Построено на Gemma 4
— Без подписки
— Поддерживает собственный словарь терминов и имён
🔗https://developers.google.com/edge/eloquent
Извлечение данных из счетов/КП/договоров
Позарился на Глеба, который делает SotaOCR и решил собрать под свои задачи похожий флоу, начав с простого agentic workflow:
Gmail Trigger
→ Has Attachment? [true]
→ Upload to Drive → Download from Drive
→ Mistral OCR (Extract Text)
→ Prepare Extracted Content
→ Classify Transaction (Gemini)
→ Is Transactional? [true]
→ Get Chart of Accounts → Aggregate
→ Classify Chart of Account (Gemini)
→ Route by Revenue/Expense
→ Prepare Data → Append to Google Sheet
Mistral OCR и Google Gemini, который автоматически извлекает, структурирует и записывает счета прямо в ваши реестры.
Осталось докрутить evals для оценок
кому надо, вот 🔗описанный pipeline.🛠 Инструменты
• TinyFish Bigset — Конвертация текстовых запросов в живые наборы данных из сети.
• Surface RTX Spark Dev Box — Компактный ПК для локального запуска моделей до 120 млрд параметров.
• ASSERT Framework — Тестирование безопасности AI-агентов через правила на естественном языке.
• Nvidia Cosmos 3 — Модель, объединяющая язык, видео и действия роботов на чипе Jetson.
• DGX Station — Настольный суперкомпьютер для моделей с 1 трлн параметров.
• Aoden Teo TTS 8B — Открытая модель озвучки текста с задержкой всего 110 мс.
• Astra Autonomous Pentesting — ИИ-агенты для непрерывного поиска и исправления уязвимостей в ПО.
• VeoOmni — Генерация кинематографического видео 1080p с синхронным звуком.
• Open Code Review — CLI-инструмент для автоматического ревью кода с помощью LLM.
• Gemma 4 12B с динамическим сжатием — Запуск 12-миллиардной модели на устройствах с 8 ГБ ОЗУ.
💰 Инвестиции
• Alphabet инвестирует $80 млрд в ИИ-инфраструктуру — Привлечение средств для расширения вычислительных мощностей.
• OpenAI инвестирует $40 млн в Opal — Поддержка разработки нового AI-аудиоустройства.
• Roblox приобрела стартап Morpheus AI — Сделка для развития генеративных видеомоделей мира.
Ключевое за 3 дня
⚡ Главное
• Новые возможности Codex от OpenAI — Представлены 6 плагинов для аналитики, дизайна и инвестиций.
• Microsoft выпустила семь новых моделей MAI — Модели позволяют настраивать веса и интегрироваться в продукты.
• MiniMax выпустила веса модели M3 с контекстом 1M токенов — Новая модель доступна с окном контекста 1 млн токенов.
• Perplexity представила гибридную систему вывода — Система маршрутизирует легкие задачи на устройство, сложные — в облако.
• MAI-Thinking-1 — Модель Microsoft на 35 млрд параметров с архитектурой MoE.
• Microsoft Execution Containers — Песочница на уровне ядра для изоляции автономных AI-агентов.
• Малые языковые модели Aion 1.0 — Локальные модели в Windows 11 для офлайн-обработки текста.
• Nemotron 3 Ultra — Модель Nvidia на 550 млрд параметров с открытым весом.
• Alibaba запускает Qwen3.7-Plus — Мультимодальная модель для управления компьютером через зрение и текст.
• JetBrains запустила открытую модель MoE — Новая модель Mixture-of-Experts для ускорения кодинга.
📈 Рост и Оптимизация
• Визуальный ИИ переходит к генерации кода — Переход от пикселей к редактируемому HTML/CSS и скриптам Blender.
• Чеклист по внедрению ИИ для бизнеса — Метрики ROI и рабочие процессы интеграции ИИ в компаниях.
• Планировщик для роботов IMLE работает в 19 раз быстрее — Техника создает оптимальный путь за один шаг вместо итераций.
• Anthropic: 80% кода в компании пишет Claude — Переход от помощников к архитектуре автоматизированной фабрики.
• Система контента на основе ИИ за 11 шагов — Автоматизация медиапроизводства с сохранением контроля за человеком.
• Meta запустила ИИ-агента для бизнеса в WhatsApp — Автономное бронирование встреч и проведение платежей в мессенджерах.
🤖 Промпты и Практика
• Топ-1000 промптов — Подборка лучших промптов для ChatGPT.
• 5 подсказок для глубоких ответов чат-ботов — Техники для получения содержательных ответов без воды.
• 100+ подсказок ChatGPT для работы — Готовые шаблоны для маркетинга, продаж и поддержки.
• 30 способов автоматизации Slack — Практическое руководство по автоматизации рутины в мессенджере.
Простая и удобная аналитика за 9$/мес.
Soloпренеры активно используют в США интересный инструмент — 🔗datafa.st
📺 live demo | dashboard demo
Актуально если запускаете свой проект worldwide на минималках и нужна простая аналитическая панель.
Есть CLI доступ 👍🏻
Фикс фичи Goal в Claude Code
Почему `goal` ломается на реальных задачах?
В Claude Code выпустил команду
goal — она держит агента в петле, пока задача не выполнена.
Классная новая фича, когда агент получает от вас описание цели и сам ищет решение, составляя шаги и план достижения.
На практике — три системных проблемы:
- Нет локального стейта. Единственный источник правды — чат-контекст. Сессия упала? Агент не знает, что уже сделано
- Контекстный bloat. На длинных задачах контекст сжимается (compaction), и после этого агент начинает деградировать — теряет детали, повторяет шаги
- Нет структурного плана. Агент сам разбивает задачу на ходу, без зафиксированного списка. Может потерять треть работы из виду
Для коротких задач это терпимо. Для реальных production-воркфлоу — катастрофа.
---
🔗 Goal Buddy: open-source инструмент, который это чинит. Устанавливается одной командой в папку проекта. Работает как плагин для Claude Code и Codex.
Внутри — три агента со строго разделёнными ролями:
- Scout — read-only, картографирует задачу и собирает evidence receipt
- Worker — единственный агент с правом редактирования, выполняет одну задачу за раз
- Judge — read-only, скептически проверяет решения и одобряет/отклоняет с JSON-ратификацией
Плюс PM-роль — главный координатор, единственный, кто может пометить задачу как done.
Что это даёт на практике:
- Перед стартом агент задаёт уточняющие вопросы — убирает амбивалентность в постановке
- Создаёт goal.md с целью в машино-понятном формате и оракулом — конкретным сигналом завершения (тест-сьют, браузерный прогон, артефакт)
- Пишет state.yaml — все задачи разбиты на «слайсы» с ID, назначенным агентом и статусом
- Дашборд в реальном времени: какой агент активен, что в очереди, что готово
==
🎞 видео🛠 Инструменты
• Anchor Browser: браузерные агенты — SDK для использования браузерных агентов корпоративного уровня.
• Firecrawl запускает /monitor — Инструмент мониторинга сайтов, сокращающий расходы на токены на 90%.
• MiniMax M3: мощная open-source модель — Модель с контекстом 1 млн токенов и управлением рабочим столом.
• Bonsai Image 4B: генерация изображений на iPhone — Компактные модели для локального запуска с оптимизацией памяти.
• NVIDIA запускает Cosmos 3 — Открытая модель для создания систем физического ИИ.
• JetBrains представила Mellum 2 — Модель на 12 млрд параметров, оптимизированная для написания кода.
• Mistral Search Toolkit — Фреймворк для интеграции поиска и извлечения данных в ИИ-конвейеры.
💰 Инвестиции
• Airwallex достигла оценки в $12 млрд — Рост оценки на 50% при годовой выручке $1,5 млрд.
• Сделка на $36 млрд для Anthropic — Кредит от Apollo и Blackstone на оплату мощностей Google TPU.
• Saris привлекла $28,8 млн — Развитие агентской платформы для финансовых институтов.
• Sandisk заключает контракты на $42 млрд — Контракты на поставку ИИ-памяти до 2031 года.
• Inherent привлекла $50 млн от экс-сотрудников DeepMind — Разработка платформы для определения научных приоритетов.
• Alphabet привлекает $80 млрд через продажу акций — Средства на развитие инфраструктуры из-за высокого спроса на ИИ.
Ключевое за 3 дня
⚡ Главное
• OpenAI добавляет полноценное использование компьютера в Codex для Windows — Интеграция прямого управления ПК в инструмент Codex.
• Meta работает над ИИ-кулоном и новыми умными очками — Тестирование ИИ-кулона и четырех моделей очков до конца года.
• Сертификация SpaceX для возвращаемых аппаратов Starfall — FAA одобрило испытания аппаратов для космического производства.
• OpenAI запускает платформу биозащиты — Доступ правительства к биомоделям Rosalind для борьбы с пандемиями.
• Nvidia представила новое поколение ИИ-ПК — Прототипы ПК с ИИ-процессорами в 40 моделях от ведущих брендов.
• SoftBank инвестирует €75 млрд во французские ИИ-дата-центры — Проект по увеличению мощностей Европы на 5 ГВт до 2031 года.
• Nvidia представляет чип RTX Spark для AI-ноутбуков — Новый чип для массовых потребительских ИИ-ноутбуков.
📈 Рост и Оптимизация
• Goldman Sachs: ИИ-агенты увеличат денежные потоки в IT — Внедрение агентов улучшит экономику и окупит затраты на инфраструктуру.
• Pinterest сократил расходы на ИИ на 90% — Оптимизация визуального слоя модели позволила радикально сэкономить.
• Трафик ИИ-агентов вырос на 7,851% за год — Автоматизированный трафик растет в 8 раз быстрее человеческого.
• Новая таблетка для лечения рака поджелудочной железы — Лекарство вдвое увеличило выживаемость пациентов в ходе испытаний.
🤖 Промпты и Практика
• Гайд по аннотациям через Gemini Omni — Инструкция по созданию AR-аннотаций для видео и изображений.
• Обучение Claude под Tone of Voice бренда — Методика кастомизации ИИ под правила бренда.
• Фреймворк BeliefTrack снижает ошибки рассуждений — Метод сокращения ошибок ИИ в планировании более чем на 70%.
• Руководство OpenAI по оценке ИИ-моделей — Методология проведения независимых оценок передовых моделей.
• Как перенести память ИИ между ChatGPT, Claude и Gemini — Гайд по синхронизации предпочтений между разными LLM.
🛠 Инструменты
• Anchor Browser — SDK для разработки браузерных агентов корпоративного уровня
• OpenJarvis — Инструмент для создания персональных ИИ-агентов на локальном железе
• Slideshot — Сервис создания видеодемонстраций продуктов с помощью ИИ
• xAI открыла доступ к grok-build-0.1 через API — Модель для автономного программирования с оплатой за токены
• Pinterest сократил расходы на ИИ на 90% — Кейс по оптимизации визуального слоя архитектуры модели
• Firecrawl /monitor: сокращение расходов на токены до 90% — Вебхуки для отслеживания изменений сайтов без полного парсинга
• MiniMax M3 — открытая модель с окном в 1 млн токенов — Модель для кодинга и управления рабочим столом с большим контекстом
• NVIDIA запускает Cosmos 3 для физического ИИ — Открытая модель для систем с мультимодальным восприятием действий
• JetBrains выпустила Mellum 2 — Языковая модель на 12 млрд параметров, оптимизированная для кодинга
• Mistral Search Toolkit — Фреймворк для интеграции сбора и оценки данных в конвейеры ИИ
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
