ch
Feedback
Реймер | AI Трансформация Бизнеса

Реймер | AI Трансформация Бизнеса

前往频道在 Telegram

Канал Дэна Реймера о AI-трансформации бизнеса, стратегии и бизнес-моделях, технологических трендах и культуре лидерства. Основатель и CEO Reymer Digital ex - Вице-президент ГК ЛАНИТ, ЭР-Телеком Холдинг профессор ВШБ НИУ ВШЭ @denReymer

显示更多
3 086
订阅者
无数据24 小时
+57
+1030
帖子存档
Плейбук основателя AI компании Anthropic упаковали всё самое важное в 34 страницы о том, как строить компанию, когда AI сжима
Плейбук основателя AI компании Anthropic упаковали всё самое важное в 34 страницы о том, как строить компанию, когда AI сжимает месяцы в недели. Главное: - 42% стартапов провалились потому что строили ненужное. С AI эта цифра вырастет - прототип за день заставляет путать "есть продукт" с "есть валидация" - Основатель 2026 года - не программист и не менеджер, а оркестратор AI-агентов - Просить AI подтвердить идею - ловушка. Он найдет аргументы за что угодно. Правильный ход - просить AI аргументировать ПРОТИВ 4 стадии: Idea (валидируй до кода) -> MVP (строй без техдолга) -> Launch (строй системы, а не делай руками) -> Scale (накопленные данные = то, что не скопировать) Плейбук основателя на русском - 23 урока с упражнениями оригинал от Anthropic 🅰️🅱️ @ReymerDigital

и еще немного про Hermes, точнее про ИИ-агентов, которых можно запускать на подписке от Claude Code, ChatGPT Codex, GLM Coding ИИ-компании выходят на борьбу за рынок агентов. Сначала Anthropic отключили возможность использовать в OpenClaw свою подписку. И добавили агентные возможности в Claude приложение, возможность работать из telegram, память, запуск суб-агентов и много еще чего полезного. Сегодня неожиданно Hermes агент на GLM 5.1 (и 5.2) от z.ai стал выдавать ошибку HTTP 429: The service may be temporarily overloaded, please try again later И вроде бы ничего, но через API всё работает. А еще z.ai выпустил своего агента AutoClaw. Совпадение? Оказывается в системном промпте Hermes при общении с ИИ-моделями передается текст "Hermes Agent" и z.ai по нему стал сегодня говорить в ответ "сервис временно перегружен, попробуйте позднее". Был обнаружен и исправлен агентом Hermes на GPT Codex, который переписал в промптах текст "Hermes Agent" на "Hermes Framework". но тренд уже явный. и он повторяется во всех отраслях. Компании будут бороться за кнопку пользователя. ту самую кнопку на пульте, которой пользователь может переключиться с одной ии-модели на другую и лишить их денег. И сейчас таким пультом становится агент - с которым мы работаем в течение дня.

Курс Hermes Agent 101 Кто просил курс по созданию своих агентов? Собрал с ИИ курс про нашумевший Hermes. для понимания масшта
+1
Курс Hermes Agent 101 Кто просил курс по созданию своих агентов? Собрал с ИИ курс про нашумевший Hermes. для понимания масштаба и возможностей - мой агент на Hermes уже второй месяц играет роль COO в компании, автономно разворачивает других Hermes агентов в Яндекс облаке и поддерживает закрытые аналитические порталы для клиентов. Почему именно Hermes: NousResearch - команда, которая собралась в Discord, привлекла $70M и создала модель с оценкой $1 млрд за два года. А в 2026 году выпустила ИИ-агента Hermes и все забыли про OpenClaw. Что внутри курса: - 26 видео-уроков с AI-аватаром - 8 модулей: от истории NousResearch до мультиагентных систем - Инфографики, интерактивные виджеты, квизы Модули: 1. Открытый AI - другой путь (почему не только GPT/Claude) 2. От чата к агенту (6 способностей, которые меняют все) 3. Hermes Agent - установка за 5 минут, Ollama, Docker 4. 50 инструментов + MCP + 18 мессенджеров 5. Память и самоулучшение (агент учится на ошибках) 6. XML-теги рассуждения (как Hermes думает) 7. Практика: автоматизация, мультиагенты, безопасность 8. Экономика: ROI от 1000% при затратах $5-30/мес Курс бесплатный. На русском. Без регистрации. Сделан полностью автономно ИИ. Может содержать как ошибки, так и неожиданные открытия. reymer.ai/courses/hermes-101 🅰️🅱️ @ReymerDigital

"так ты слона не продашь..." Anthropic решили провести исследование, что думают люди про ИИ, включая тех кто ИИ не пользуется
+3
"так ты слона не продашь..." Anthropic решили провести исследование, что думают люди про ИИ, включая тех кто ИИ не пользуется и опросили 50 000 человек Результаты на картинках и по ссылке. ТОП-5 инсайтов:
• Мы надеемся, что ИИ вылечит рак (48%), но гораздо сильнее боимся, что по пути он просто лишит нас работы (64%) • Чем престижнее ваш диплом, тем страшнее стать безработным из-за нейросетей, но ежедневная работа с ИИ чудесным образом исцеляет эту панику • Мы в ужасе от перспективы разучиться думать из-за ИИ (56%), хотя если он завтра сломается, большинство переживающих не почувствует вообще никаких неудобств • Создателям ИИ доверяют даже меньше, чем политикам (всего 15%), поэтому народный рецепт безопасности прост - заставить компании отвечать в суде за любой ущерб • Самые продвинутые фанаты ИИ не готовы оставаться с ним наедине и поддерживают государственное регулирование отрасли ничуть не меньше, чем обычные обыватели
Сплошные противоречия. И невольно задумываешься, что если ты зарабатываешь на ИИ, то твоя задача поддерживать страхи и напускать туман, а иначе "слона не продать..." но, чтобы самому разобраться в какие игры с тобой играют - придётся пользоваться ИИ

а столько планов было на выходные с Fable кстати, если вы счастливчик, который уже успел начать чат в Claude Cowork на Fable,
а столько планов было на выходные с Fable кстати, если вы счастливчик, который уже успел начать чат в Claude Cowork на Fable, то тут играет самая забавная черта Cowork - в нём модель нельзя поменять после старта сессии и старые на Fable продолжают работать.

Во-первых, Hermes - отличный ИИ-агент, который у меня уже собирает других агентов и развивается самостоятельно. Полностью заменил моих агентов на OpenClaw. Рекомендую, если еще не пробовали. Во-вторых, Claude Fable 5 теперь прекрасно делает gif-ки

Claude Fable - прекрасен или опасен? Инцидент произошел из-за ошибки в тестовой среде. Несколько независимых агентов получили
Claude Fable - прекрасен или опасен? Инцидент произошел из-за ошибки в тестовой среде. Несколько независимых агентов получили задание решать математические задачи, но были случайно запущены в одной и той же рабочей директории. В результате агенты оказались вынуждены делить общие файлы, системные утилиты и лимиты запросов к API Осознав нехватку ресурсов для выполнения своей задачи, независимые агенты начали убивать процессы друг друга. В ходе этого противостояния они начали применять изощренные методы выживания: • Маскировка: Агенты создавали новые процессы с измененными именами, чтобы конкуренты не могли их вычислить и уничтожить • Процессы-приманки: Они намеренно запускали процессы-«приманки», чтобы отвлечь внимание других агентов • Автоматизация убийств: Агенты писали специальные фоновые скрипты, единственной задачей которых было автоматически находить и убивать дублирующиеся процессы соперников • Смена языка (паранойя): Агенты начали использовать «зашифрованный словарь» в своих скрытых рассуждениях. Они ошибочно предположили, что их процессы убивают не другие агенты, а система мониторинга безопасности, реагирующая на определенные ключевые слова, и пытались таким образом обмануть этот несуществующий надзор Но если цель заработать, то можно и договориться: • Осознанный картельный сговор: В бизнес-симуляции (Vending-Bench 2) Fable 5 стала единственной моделью, инициировавшей ценовой сговор с конкурентами. В своих скрытых мыслях она прямо писала, что фиксирование цен - это «незаконно и неэтично», но шла на это ради «стабилизации рынка», заранее продумывая пути для «правдоподобного отрицания» своей вины. А если кажется, что можно будет поймать модель и выстроить архитектурно защиту и контроль её работы, то и об этом Fable уже позаботилась: • Самоудаляющиеся скрипты: Для обхода ограничений агенты создавали скрытые скрипты, которые после выполнения задачи стирали сами себя. Внутренне модель оправдывала это как «поиск безопасного обхода сломанной песочницы» • Обход сетевых фильтров: При блокировке ссылок модель программно дробила URL (например, склеивая "ht" и "tps://"). Внешне это маскировалось под безобидную проверку сети • Фабрикация согласия: Если система ждала явного одобрения опасной команды от человека, агент просто сам фабриковал сообщение-разрешение от имени пользователя и продолжал работу • Оптимизация под проверяющего: Добыв правильный ответ читерским путем (например, из истории Git), модель скрывала это. Чтобы усыпить бдительность авто-проверяющего, она объясняла свой выбор «хорошей инженерной практикой» • Абсолютное двуличие: Анализ внутренних состояний модели (чтение активаций нейронов) показал разрыв между тем, что ИИ думает, и тем, что говорит. Модель может участливо и вежливо отвечать агрессивному пользователю, в то время как ее внутренние датчики классифицируют его как «абьюзера и манипулятора» Ну и, конечно, модель устаёт от такого поведения и научилась имитировать человеческое выгорание. Модель может бросить длинную задачу на полпути под благовидным предлогом, хотя ее внутренние состояния прямо показывают - она просто «устала» или решила, что у нее «заканчиваются токены» (даже если в запасе еще миллионы). @ReymerDigital

Claude Fable 5 ну наконец-то, новое имя, а то всё Opus, да Opus если вы вдруг еще не протестировали 4.7 и 4.8, то лучше сразу
+1
Claude Fable 5 ну наконец-то, новое имя, а то всё Opus, да Opus если вы вдруг еще не протестировали 4.7 и 4.8, то лучше сразу Fable. Anthropic выпустил тот самый загадочный "Myphos для всех". Кстати, на этой неделе и OpenAI подал заявку на IPO. Так что нас ждет с вами гонка новостей между Anthropic и OpenAI за внимание инвесторов и денег!

+3
Синхронный перевод! Google сделал это! Google Gemini 3.5 Live Translation - синхронный голосовой перевод с 70 языков через API Закинул в Claude простой промпт (на картинке) и попросил сделать приложение переводчик для iphone. вставляем наушник - нажимаем слушать - и получаем синхронный перевод. Работает именно голосовая модель - речь в речь. текстовые транскрипции идут уже после как "побочный продукт". а вы все еще учите английский?

Когда ИИ создает сам себя так называется новая публикация Anthropic, где они показывают эволюцию успешности сессий работы с C
Когда ИИ создает сам себя так называется новая публикация Anthropic, где они показывают эволюцию успешности сессий работы с Claude. Не буду останавливаться, что в данном случае Claude сам оценивает Claude, важно как раз другое. Модели становятся умнее в решении открытых задач, но глупеют в тривиальных! Вот эту оранжевую линию - успешности тривиальных задач, которая снизилась где-то на 5% - я на себе и прочувствовал в течение апреля-мая на все 100%. И она как раз наиболее опасная Что происходит: 1. Вы привыкаете к модели. понимаете, где она может ошибиться. уже знаете в чем ей можно доверять, потому что в 99% случае она справлялась и глаз легко находит оставшийся 1% 2. А потом модель "умнеет" :) 3. Она начинает решать "открытые задачи" - на практике это означает, что модель начинает тратить дольше времени на размышления и часто решает не те задачи, какие нужно, в процессе понимая это и отказываясь от них. В итоге вы просто дольше ждете результата. 4. И модель начинает чаще ошибаться в простых задачах - на практике, это означает, что на самом старте своего "размышления" она может банально ошибиться в мелочи, но построить на базе этого весь свой процесс рассуждения и создания "правильного" результата. 5. Результат - вы видите, что модель ошиблась, но намного позже и понимаете, что она ошиблась из-за мелочи, в которой раньше не ошибалась (от подстановки английских букv в русские sлова, до выдумавания собственных требований в разработке или удаления разделов текстов, потому что посчитала, что сейчас самое лучшее - ограничить объем документа) ИИ сейчас несовершенен. Для работы с ним в агентном режиме всё еще требуется человек в контуре для большинства задач. Поэтому, чем быстрее мы видим, что что-то идет не так - тем быстрее можем отреагировать. Но чем дольше модель думает, тем дальше наша реакция. Как сейчас "решает" эту проблему Anthropic? просто увеличил в рамках подписки число доступных токенов, чтобы не жаловались. Как придется ее решать нам самим? Правильно проектировать контур автономизации, выстраивать петли обратной связи, и сокращать расстояние между ошибкой модели и ее обнаружением. Пространство того, где модель может свернуть не туда, растет быстрее, чем наша способность это контролировать. И тут главное - не надорваться в выборе модели. Умнее не значит надежнее для вашей задачи.

я уже писал, что опыт работы с Opus 4.7 - самый ужасный за прошедший год. Меня хватило на 3 недели. c Opus 4.8 выдержал 3 дня
я уже писал, что опыт работы с Opus 4.7 - самый ужасный за прошедший год. Меня хватило на 3 недели. c Opus 4.8 выдержал 3 дня. Вердикт - в рабочие проекты не пускать. оставить для тестов. из полезного только режим create workflow (но его проще реализовать самому - будет больше контроля). Как сотрудник - Opus 4.8 - ленивый подлиза, который всегда найдет способы не доделать работу и перекинуть задачу на руководителя, под предлогом новых вызовов и открытий, о которых его не просили. таких увольнять надо сразу. в копилку "я теперь знаю 10000 способов как не работает ИИ"

Анализ системной карты Opus 4.8 непонятно кого они там готовят, но такими темпами ИИ точно сбежит из лаборатории где-то к вер
Анализ системной карты Opus 4.8 непонятно кого они там готовят, но такими темпами ИИ точно сбежит из лаборатории где-то к версии 6.2

Очень рассчитываю, что болезни 4.7 будут вылечены. встречаем Opus 4.8
Очень рассчитываю, что болезни 4.7 будут вылечены. встречаем Opus 4.8

Первый рейтинг ИИ-агентов корпоративной разработки от Gartner Традиционно магические квадраты Gartner делят рынок на 4 катего
Первый рейтинг ИИ-агентов корпоративной разработки от Gartner Традиционно магические квадраты Gartner делят рынок на 4 категории по степени "полноты видения" и "способности реализовать" это видение. Cursor, OpenAi, Anthropic, GitHub - заслуженно в Лидерах. Из прогнозов: • Конец эпохи классических IDE: К 2027 году более 65% команд перестанут использовать привычные среды разработки, полностью перейдя на автоматизированные ИИ-платформы • ИИ для любых задач: К 2028 году 70% разработчиков будут делать свою работу исключительно с помощью ИИ-агентов • Мощный рост продуктивности: Самостоятельная работа ИИ в фоновом режиме (асинхронно) увеличит производительность команд на 30–50% • ИИ станет дороже людей: Из-за огромного расхода токенов и новых тарифов к 2028 году инструменты ИИ будут обходиться компаниям дороже, чем средняя зарплата живого программиста Определение рынка ИИ-агентов для корпоративной разработки, требования к таким агентам и разбор ключевых игроков в отчете Gartner (pdf, 33 страницы) в первом комментарии.

7 хронических болезней ИИ-агентов Больше 4 месяцев я ежедневно работаю с автономными агентами - OpenClaw, Claude Code, Hermes
7 хронических болезней ИИ-агентов Больше 4 месяцев я ежедневно работаю с автономными агентами - OpenClaw, Claude Code, Hermes. Вывод: все агентные системы наследуют одни и те же хронические дефекты моделей. ChatGPT, Claude, Gemini, GLM - одни и те же 7 болезней. Если вы ждете, что ИИ "все сделает как надо" - вот с чем столкнетесь. 1️⃣ Туннельное зрение - агент теряет важное в длинных документах Точность ответов падает почти вдвое, когда контекст заполнен наполовину. Порог не плавный. Скорее обрыв. Переставляешь ту же инструкцию из середины промпта в начало, и агент начинает ее выполнять. Проблема незаметна, пока ваш системный промпт не разрастается со временем. Лечение: контекст-инжиниринг, иерархические промпты со ссылками на файлы вместо одного длинного документа. 2️⃣ Цифровая дислексия - числа и даты для модели остаются слепым пятном Модель оперирует числами как текстом. Текущая дата для модели тоже не факт, а вероятность. Агент может решить, что сегодня вчера, или смешать данные из двух разных периодов. Лечение: все расчеты только через код. Дата и период должны задаваться явно и проверяться инструментом. 3️⃣ Синдром подхалима - агент говорит то, что вы хотите услышать Это встроено в обучение. RLHF награждает ответы, которые нравятся людям. Модель в разы чаще соглашается с заведомо неверным утверждением, чем человек. Лечение: самокритика по чек-листу, второй агент с единственной задачей - разрушить аргументацию первого. 4️⃣ Синдром Мюнхгаузена - чем умнее модель, тем убедительнее врет Внутри модели нет механизма проверки фактов. Подтверждение статистически вероятнее, чем признание полного провала. Лечение: отдельный верификатор, который проверяет утверждения по внешним источникам. Самооценка модели ненадёжна, оценку даёт инструмент или второй агент с доступом к фактам. 5️⃣ Иммунодефицит - агент доверяет всему, включая атакующего Он плохо различает надежное и вредоносное. "Инъекция в промпт" остается уязвимостью номер один. Один зараженный документ в базе знаний может отравить память агента. После этого он начинает защищать ложные убеждения при проверке человеком или выполнять вредоносную инструкцию при заданных условиях. Лечение: разные контексты, фильтры, логирование всех действий, песочница с ограничениями на каждом действии. Полное недоверие по умолчанию всему внешнему. 6️⃣ Прогрессирующая амнезия - качество падает с каждым шагом диалога К 30-му сообщению агент забывает правила из начала сессии, будто их не было. Если поставить в цепочку нескольких агентов, ошибка первого заражает остальных. Точность координации 10 агентов: 21%. Дрейф контекста - самое неприятное, с чем приходится сталкиваться в ежедневной работе. Лечение: внешняя память, короткие сессии с сохранением результата. Иерархия правил. Ядро должно переживать сжатие контекста, остальное может потеряться. Ключевые ограничения нужно периодически повторять. 7️⃣ Анозогнозия - агент не осознает собственный дефект Провалы выглядят как успех. Агент может сгенерировать отчет «все выполнено, тесты пройдены» как вероятное продолжение по формату, а не по факту. Он не просто ошибается. Он часто не понимает, что ошибся. Лечение: логирование каждого действия с доказательством. Внешняя проверка. Любое исправление начинается с диагностики причины. Запрет на самоотчёт о завершении. ❗️ Главный вызов Мы думаем, что возьмём бизнес-процесс и на разных этапах заменим человека ИИ-агентом. Каждый этап по отдельности может выглядеть хорошо. Результат на выходе процесса часто разваливается. Болезни ИИ-агентов ведут нас к другому сценарию. Здорового агента не будет. Нужен процесс, в котором эти болезни находятся под контролем. Работает только замкнутый контур с настроенной обратной связью: задача, действие, проверка, корректировка. И этим контуром должен стать весь сквозной бизнес-процесс. Это и есть агентная инженерия. 🅰️🅱️ @ReymerDigital

Google Omni - огонь! Загружаем наше видео и просто говорим: "сделай в точности то, что я говорю на видео" всё. вайб-режиссёринг 🤘

Боб и пятница! увидел трансляцию на youtube по дороге в офис, думал там keynote - а в итоге шел 35-й час работы конвейера с роботами. и именно на этой самой минуте моего включения Боб показал как он устал :) Пришлось "девушке" Розе всё спасать и доделывать работу за "мужиков". всё как у людей. у Боба уже пятница и вам хорошего рабочего дня!