Внутри AI | Кейсы ИИ Агентов в бизнесе
رفتن به کانال در Telegram
Внедрение AI в компании от анализа до запуска - https://kts.tech/ai. AI Агенты и их применение в бизнесе Обзоры, кейсы, практика
نمایش بیشتر3 598
مشترکین
-224 ساعت
+747 روز
+47330 روز
آرشیو پست ها
Repost from Программисты делают бизнес
От RAG до агентов: что бизнес ждет от AI?
В подкасте «Большой разговор про AI» Александр Опрышко, сооснователь KTS, рассказал, как AI уже меняет разработку и digital-рынок: от оцифровки базы знаний к агентам конкретных действий, от отдельных ассистентов к AI-центричному подходу в SDLC.
Обсудили:
▫️почему компании так активно смотрят в сторону RAG, ассистентов проектировщиков и аналитики?
▫️как бизнес оценивает эффективность AI-проектов?
▫️почему многие хотят on-premise решения?
▫️куда перестраивается рынок?
▫️какой тренд показывает наш кейс ассистента Альфа-Банка с ROI 6 месяцев?
🔴 Посмотреть выпуск
Продолжаем вместе с вами улучшать Agent Platform
Ценим обратную связь и стараемся оперативно добавлять функции по вашим пожеланиям на платформу. Один из частых запросов — детализация расходов и запросов.
▪️ Мониторинг активности: просматривайте расход токенов и количество запросов по разным параметрам — модели, времени и ключам. В личном кабинете доступна история списаний и пополнений, чтобы вам было удобнее контролировать расходы.
▪️ LLM-логи: смотрите историю запросов за последние 30 дней — без содержимого промптов и ответов. Вы увидите, какая модель использовалась, статус запроса и его стоимость.
Обновление открывает возможность добавлять новых топовых провайдеров LLM, а также модели для изображений и видео. Пишите, каких ещё функций вам не хватает — обязательно учтём пожелания в будущих релизах.
Как я нахожу инсайты и отслеживаю личный прогресс с помощью скиллов в Claude
Каждый день я работаю в Claude Code с разными задачами: бизнес- и продуктовые исследования, настройка агентов, проверка новых идей.
В процессе столкнулся с двумя проблемами:
1) При параллельной работе в нескольких окнах с включённым auto-mode часть решений проходит мимо — можно пропустить интересные и полезные инсайты в выборе тактики.
2) Когда фоном ведёшь несколько задач, иногда в порыве теряешь фокус. При этом хочется фиксировать, что ежедневная работа действительно ведёт к поставленным целям.
Чтобы закрыть эти боли, я настроил скиллы /insight и /progress.
/insight. В конце сессии смотрит, было ли в ней то, что стоит запомнить. Если да — пишет короткую запись в журнал (.md) в фиксированном формате. Если нет — молчит. Встроил фильтр по критериям интересного, адаптировал под свою роль (например, исключил решения про кодинг — для меня они мало применимы) и установил запрет выдумывать инсайты в рутинный день.
/progress. Запускается ежедневно, читает все сессии Claude Code, сжимает их и прогоняет через агента. Тот выбирает факты: над какими проектами шла работа, что решили, какие коммиты сделаны. Затем сверяет с указанными целями (.md) и фиксирует, где есть движение, а где нет.
Раз в неделю вижу полную картину через призму работы в Claude Code: где продвинулся, что запустил, какие инсайты нашёл. Получается такая внутренняя ретроспектива.
#иван_лавров
ИИ застрял в «одиночном режиме»
За неделю несколько ведущих ресерчеров независимо высказались об одном: следующий рубеж развития ИИ — не интеллект, а интерактивность. Не «насколько умна модель», а «насколько хорошо она работает вместе с человеком».
В чём проблема: сегодня модели воспринимают реальность одним потоком. Пока не дописали запрос — LLM ждёт и не видит, что вы делаете. Это узкий канал: до модели доходит лишь часть вашего знания, намерения и оценки.
Thinking Machines сравнивает текущий формат взаимодействия с попыткой решить важный спор по почте вместо личной встречи. Они вводят новую концепцию — interaction models. Ключевая идея: интерактивность не «обвязка» вокруг модели, а часть самой архитектуры. Сегодня системы имитируют перебивания и многоканальность через harness (внешнюю «обвязку» — готовые компоненты, склеенные вокруг модели) и VAD (voice activity detection — отдельный модуль, который определяет, говорит человек или молчит) для распознавания границ реплик.
Аргумент от Bitter Lesson: рукотворные надстройки проиграют общим масштабируемым методам. Если интерактивность встроена в модель — масштабирование одновременно делает её умнее и улучшает качество взаимодействия с человеком.
Гонка за «интеллектом» упёрлась в то, как этот интеллект передать человеку и принять обратно правки.
#александр_опрышко #развитие_ИИ
RAG-платформа для 12 000 операторов Альфа-Банка: ускорили поиск данных в 20 раз
Раньше операторы контакт-центра вручную искали информацию в базе знаний, чтобы ответить клиенту. На обработку одного запроса в среднем уходило 5 минут.
Чтобы ускорить работу операторов, Альфа-Банк решил внедрить RAG-платформу. За помощью обратились к команде KTS.
За 4 месяца мы вместе вывели проект в production и настроили систему так, чтобы данные всегда были актуальны, и каждый оператор получал ответ с учётом его уровня доступа.
Платформу развернули внутри контура банка и запустили на двух GPU H100. Это позволило уложиться в экономику проекта и при этом обеспечить запас по производительности.
В результате RAG-платформа ускорила и упростила работу операторов:
▪️ среднее время обработки запроса уменьшилось на 40 секунд: с 5 минут до 4 минут 20 секунд
▪️ поиск данных стал в 20 раз быстрее: 3 секунды вместо 60
93% операторов положительно оценили работу платформы, и решение масштабировали на всех сотрудников Альфа-Банка. Сегодня система обрабатывает 85 000 запросов в сутки.
Больше деталей про настройку и работу RAG-системы показали в кейсе
Repost from Программисты делают бизнес
Вы всё ещё переплачиваете за инфраструктуру? Тогда мы идём к вам.
Расходы на облако часто растут незаметно. Тестовые среды работают ночью и в выходные. Неиспользуемые ресурсы продолжают списывать деньги. У команд нет общего правила, кто следит за потреблением и где проходит граница между «нужно» и «просто осталось включенным».
В итоге счета растут, а ясности, за что платит бизнес, становится меньше.
Мы поможем найти, где инфраструктура расходует лишнее, и сократить затраты без риска для продукта и команды.
Что делаем:
— проводим аудит расходов на облако;
— оптимизируем инфраструктуру;
— настраиваем мониторинг потребления и уведомления;
— выделяем центры затрат;
— прогнозируем бюджет;
— считаем TCO и ROI.
Если есть ощущение, что можно сэкономить на инфраструктуре, начните с бесплатного аудита. За 5 рабочих дней покажем, где вы теряете деньги. Сначала доведем до результата и только потом возьмем оплату. Гонорар KTS = подтвержденная экономия за 6 месяцев.
Знаем, как найти лишние расходы на инфраструктуру и сократить их без риска ↗️
Поговорим, как AI влияет на OKR: от горизонтов планирования до управленческого мышления
12 мая в 11:30 приглашаем на подкаст с Иваном Лавровым, Head of AI в KTS и основателем OKRsana — платформы для управления OKR с интегрированными AI-агентами.
В прямом эфире обсудим:
— каковы актуальные горизонты планирования
— помогает ли AI формулировать более сильные цели или, наоборот, упрощает мышление
— можно ли уйти от таблиц в OKR и не потерять управляемость
— какие инструменты реально работают, а какие остаются модными практиками
Регистрируйтесь по ссылке, приходите за инсайтами и задавайте вопросы — обещаем, будет интересно!
Этика AI в продаже недвижимости: можно ли прослушивать разговоры с клиентами?
Застройщики часто приходят к нам с запросом записывать встречи и прогонять их через LLM: хочется контролировать качество консультаций, собирать все возражения и автоматизировать работу с ними.
Технологически это несложно, но на практике подход может сыграть против девелопера.
При покупке квартиры люди обсуждают с агентом чувствительные темы: финансовые возможности, семейные обстоятельства, размер первоначального взноса. Если человек понимает, что разговор записывается и анализируется AI, доверие рушится. Прослушка и контроль со стороны искусственного интеллекта пугают клиентов, поэтому сделка может сорваться.
Эффективнее внедрить AI-ассистента для продавцов. Он помогает со сложными вопросами в реальном времени: за секунды находит информацию в базе знаний и формулирует точный ответ. Это сохраняет динамику сделки, показывает экспертность и не нарушает приватность клиента.
AI — только для enterprise. Доказываем, что это не так
Средний и малый бизнес отказывается от внедрения AI, потому что считает его дорогим инструментом для крупных корпораций с миллионными бюджетами.
На самом деле ИИ-решения подходят любому бизнесу, в котором есть повторяющиеся процессы.
В новой статье разбираем:
▫️ почему проекты остаются на уровне вечного пилота
▫️ процессы, которые стоит автоматизировать в первую очередь
▫️ какие метрики использовать, чтобы оценить результат
▫️ как платформенный подход меняет экономику AI-проектов
▫️ сроки и этапы запуска кастомного решения
Статья будет интересна малому и среднему бизнесу, который думает о внедрении AI, но не знает, с чего начать. Заходите в блог, чтобы узнать, как за 1-2 месяца сделать AI прикладным инструментом с измеримым эффектом.
Мой MCP-стек для Claude Code
Сам по себе Claude Code — просто CLI. Реальную пользу ему даёт обвязка из MCP-серверов: они подключают агента к твоим данным и workflow.
Делюсь стеком, который использую ежедневно. Разбил его на три контура:
▫️ Автоматизация рутины (менеджерская часть)
workbook — самописный MCP, который постепенно наращиваю под свои задачи. Сейчас в нём: работа с Твиттером, Контур.Толк, календарём, почтой, to-do list.
yandex-tracker — управляю загрузкой, создаю задачи на основе транскрибации.
excel-mcp-server и mcp-google-sheets — читаю локальные xlsx и Google Sheets. Удобно для работы со сметами.
▫️ Исследования
arXiv — для поиска и чтения свежих статей, чтобы понимать, как устроены SoTA-подходы.
reddit-mcp-buddy — быстро снять пульс сообщества: что обсуждают, какие инструменты хвалят, на что жалуются. Хороший сигнал для продуктовых решений.
playwright/computer-use — когда WebSearch и WebFetch не справляются (авторизация, JS-рендеринг, закрытый контент) или нужна автоматизация без API.
▫️ Программирование
context7, deepwiki — инструменты, которые дают актуальную документацию для агента. Подробно рассказывал об этом в посте.
everything-claude-code (affaan-m) — готовый набор из 47 агентов, 181 скилла и 79 команд: code-review, TDD, planner, build-fix, мультиагентная оркестрация. Беру как стартер и выкидываю лишнее.
spec-kit от GitHub — тулкит для spec-driven development. Вместо вайб-кодинга выстраивает пайплайн: constitution → specify → clarify → plan → tasks → implement → verify. Спеки становятся исполняемыми артефактами, агент работает с чёткими входами вместо расплывчатых промптов.
#александр_опрышко
Managed Agents от Anthropic: зачем агентам своя операционная система
Anthropic опубликовал инженерный разбор Managed Agents — своего сервиса для запуска агентов. Это интересное объяснение того, как стоит проектировать инфраструктуру агентов в 2026.
Проблема. Агент — это не один вызов LLM, а длинный цикл: модель думает → вызывает инструмент → получает результат → думает дальше. Если жёстко зашить этот цикл под текущее поколение моделей, через полгода придётся переписывать инфраструктуру. Авторы формулируют это одной фразой, которую уже растащили на цитаты: «Harnesses encode assumptions that go stale as models improve».
Идея. Решение не новое — так операционные системы в своё время справились с «программами, которых ещё не существует». Они не пытались угадать будущие приложения, а виртуализировали железо в стабильные абстракции: процесс, файл, сокет. Приложения менялись, абстракции оставались.
Anthropic применяет этот приём к агентам — раскладывает их на три независимые сущности:
▪️Session — append-only лог всего, что произошло. Живёт отдельно от модели и её контекстного окна. Это «память» агента, к которой можно обращаться произвольно.
▪️Harness — цикл, который крутит модель и маршрутизирует tool calls. Stateless, одноразовый, заменяемый.
▪️Sandbox — среда, где исполняются инструменты. Тоже одноразовая: упала — подняли новую.
Подробный разбор можно прочитать по ссылке.
#александр_опрышко
6 сценариев внедрения ИИ в девелопмент
Собрали решения, которые можно быстро встроить в работу и получить измеримый результат: снизить количество ошибок, увеличить производительность команд и оптимизировать расходы.
▪️AI-ассистент менеджера по продажам
Чат-бот подключается к привычным каналам: CRM, сайту, Telegram. Помогает найти ответы на вопросы клиентов и даёт подсказки по документам.
▪️Консультант по недвижимости
Обрабатывает запросы на естественном языке, точнее выявляет потребности и подбирает персональные объекты. Может работать как плагин на сайте, в мессенджере или личном кабинете.
▪️Голосовой помощник для колл-центра или шоурума
Работает как дополнение к телефонии или робот-консультант. Воспринимает вопросы клиентов, отвечает по базе знаний и формирует персонализированные подборки решений.
▪️Анализ диалогов операторов колл-центра
Выявляет ошибки и отклонения от сценариев, классифицирует причины отказа и помогает оценить качество работы сотрудников. ИИ-ассистент может анализировать диалоги как в реальном времени, так и в ретроспективе.
▪️ИИ-помощник для управляющей компании
Чат-бот или голосовой робот отвечает на частые вопросы жителей, фиксирует обращения и снижает нагрузку на операторов.
▪️Компьютерное зрение на стройке
Программно-аппаратный комплекс, веб- и мобильное приложение для мониторинга целевых событий. Фиксирует передвижение техники и персонала, контролирует опасные зоны и выявляет простои.
Подробнее о том, какие AI-решения можно внедрить в девелопмент уже сейчас, смотрите в презентации коммерческого директора KTS Александра Баталова.
Продолжаем развивать Agent Platform. Ниже — ключевые изменения за последний месяц.
▫️Повысили планку доступности и надежности системы.
▫️Добавили прозрачный мониторинг. Теперь по каждой модели пользователям доступны метрики времени отклика и доступности.
▫️Детализировали траты токенов и списания в личном кабинете. Появилась разбивка по периодам и возможность выгрузки данных. Упрощает контроль затрат и подготовку отчетности.
▫️Улучшили работу с графическими моделями OpenAI, включая GPT Image и DALL·E.
▫️Запустили партнерскую программу в бета режиме. Если вы работаете с AI-проектами или ведете блог на AI-тематику, напишите нам на почту agentplatform@kts.tech, мы открыты к сотрудничеству
Александр Опрышко, один из основателей KTS, прямо сейчас на круглом столе конференции GoCloud 2026.
Обсуждаем проблемы при развертывании CI/CD-пайплайна, ограничения облачных и on-premise решений и где оправдан гибрид. А также делимся, как AI помогает в этом направлении на примере своих кейсов.
Прямая трансляция конференции по ссылке.
Как я использую Claude в менеджерских задачах
Чтобы AI выдавал хороший результат, он должен знать всё, что знаешь ты. Не «напиши правильный промпт» — а дай весь контекст.
Для этого нужно создать базу знаний и регулярно загружать в неё данные. Сделать это задним числом — сложно и муторно. Намного проще «скормить» предыдущие заметки, начать вести базу знаний в понятном для Claude формате и регулярно к нему обращаться.
С чего я начал в январе:
▫️ создал git-репу, описал себя и свои цели за 3 года
▫️ подключил календари, почту и ремайндеры через MCP
▫️ написал скилл для старта дня: Claude скачивает повестку на сегодня/завтра и ведёт архив
▫️ разложил артефакты по проектам
Через 3 месяца:
▫️ goals/ — цели и стратегия
▫️ projects/ — все проекты с артефактами и контекстом
▫️ meets/ — записи и саммари встреч
▫️ memory/ — персональная память Claude, которой я управляю вручную
▫️ schedule/ — расписание, синхронизированное с календарём
▫️ todolist/ — задачи из Apple Reminders
▫️ tgposts/ — автоматизация контента для Telegram-канала
▫️ main_mcp.py — единая точка входа для собственных автоматизаций: код автоматизаций лежит рядом с базой знаний, база знаний в формате Markdown
Обычный иерархический текст превратился в динамическую базу знаний, которая кумулятивно увеличивает свою ценность. При этом управление контекстом я не отдаю на откуп AI. Модель не определяет самостоятельно, что важно — я вручную управляю необходимой информацией.
Ещё один инсайт: многие процессы можно автоматизировать через человекопонятные алгоритмы на базе скиллов Claude Code. Пишешь по шагам, что нужно сделать — и получаешь не просто детерминированную автоматизацию, а процессы с интеллектом внутри: декомпозиция смет, саммари встреч и собеседований, анализ новостей из Twitter, разбор стартапов из YC.
С удивлением обнаружил, что лидеры индустрии приходят к похожему. Karpathy на этой неделе описал концепцию LLM Wiki: складываешь сырые источники в папку, LLM компилирует из них wiki с бэклинками и категоризацией. Его главная мысль — память AI должна быть явной (видишь, что он знает и не знает), в файлах (не привязана к провайдеру) и интероперабельной (любая модель работает с теми же файлами).
#александр_опрышко #ai #claude_code
Стоит ли бизнесу маскировать AI-ассистента под человека?
На демо AI-ассистента для крупной сети фитнес-центров нам задали ожидаемый вопрос: должен ли робот мимикрировать под человека? Ведь посетители сайта легко могут определить, что перед ними ИИ. Моя точка зрения: нет никакого смысла скрывать виртуальную сущность ассистентов.
Объясню, почему:
1. В попытке «очеловечивания» робот отходит от своей агентской задачи, что иногда приводит к фейлам. ИИ-ассистент австралийской сети Woolworths рассказывал клиентам про свою маму и дядю, убеждая в своей «кожаности», пока компания не отключила эти скрипты после волны возмущения. Есть и данные: по исследованию Nielsen Norman Group, добавление «человеческой теплоты» снижает точность ответов ИИ на 10—30%.
2. Решение вопросов через ИИ может вызвать даже бОльшее доверие со стороны людей. На моём опыте компании с действительно топовой коммуникацией редкость. У части компаний сервис заложен в ценностях, но это исключения. В остальных случаях робот выполняет работу/дает ответы быстрее и точнее, чем человек, а это именно то, что мы ожидаем от профессионального сервиса. Порог качества, ожидаемого от людей, тоже вырастет: зачем средний сервис от человека, если можно получить такой же или лучше от робота? В конечном счёте это хорошо для клиента.
3. Человеку проще спросить у робота, чем у другого человека, в чувствительных, а может и где-то постыдных вопросах. Перед роботом не нужно оправдываться за «глупый» вопрос, не страшно переспрашивать.
4. В какой-то момент раскрытие ИИ при предоставлении сервиса станет законодательно обязательным и в РФ. В ЕС это уже закон — с августа 2026 AI Act обязывает сообщать пользователю, что он общается с ИИ. Россия обычно перенимает регуляторные тренды с лагом в пару лет — лучше быть готовым заранее, чем перестраиваться потом.
Но есть важный момент!
Не прятать робота за человеком — не значит убирать людей из процесса. Наоборот, стоит подчеркивать их роль: кто разрабатывает, обучает, анализирует работу ИИ-системы. Доверие клиента строится не на иллюзии, что с ним говорит человек, а на понимании, что за роботом стоит команда, которая его обучила на специфике конкретного бизнеса.
Отдельная тема — гибридные схемы. Где люди проверяют и улучшают работу ИИ-агентов. В каких ситуациях необходимо подключение живого специалиста. Совместная работа, где ИИ подсказывает решения, но ответственность и коммуникация остается за человеком. Это не костыль на переходный период, а живая целевая модель.
Что мы ответили фитнес-сети? Сейчас нет необходимости притворяться, что это не виртуальный помощник. Их посетителю не нужен фальшивый друг на ресепшен. Ему нужен тот, кто за минуту ответит на все вопросы, подберет клуб с подходящим расположением и расписанием и поможет оформить абонемент, что напрямую влияет на бизнес-метрики.
#иван_лавров
RAG без облака: как запустить LLM для FinTech и уложить inference в одну H100
В KTS обратился крупный клиент из FinTech с запросом на корпоративную базу знаний.
Сначала мы собрали демоверсию на собственной облачной инфраструктуре. По качеству она устраивала клиента и показывала нужный результат. Но облачные AI-инструменты для FinTech часто не подходят из-за высоких требований к безопасности данных.
В таких проектах обычно используют open source LLM. У этого подхода есть две проблемы: качество таких моделей часто ниже, чем у облачных, а inference обходится дорого.
Мы рассчитали инфраструктуру для решения. Оценили стоимость видеокарт, которые понадобятся для запуска модели, и возможный экономический эффект.На старте экономика выглядела неочевидной — стоимость видеокарт могла съесть значительную часть потенциальной выгоды.
Поэтому мы начали экспериментировать с демоверсией продукта и искать способ повысить качество и снизить стоимость inference. В итоге решение удалось запустить полностью на одной карте h100 с требуемым качество (более 94% процентов корректных ответов на базе знаний).
В результате задача, которая изначально выглядела слишком дорогой для on-premise инфраструктуры, стала экономически оправданной.
Для FinTech и других регулируемых отраслей это важный кейс Облачные AI-сервисы часто недоступны из-за требований к данным, а стоимость локальной инфраструктуры останавливает такие проекты ещё на старте.
#александр_опрышко
KTS на GoCloud 2026: поговорим про AI и облака
9 апреля в Москве пройдёт конференция GoCloud от Cloud.ru. В этом году ключевая тема — простые и безопасные инструменты для работы с AI, которые можно использовать уже сейчас.
Что ждёт участников:
■ 4 трека про AI, Data, инструменты разработки и облачную
инфраструктуру
■ 50+ спикеров из ведущих российских компаний
■ 15+ демозон с live-демонстрациями облачных и AI-сервисов, партнёрских продуктов и нетворкинг с экспертами
■ 7 воркшопов под руководством экспертов
Александр Опрышко, управляющий партнёр и системный архитектор KTS, примет участие в круглом столе на тему «DevOps-инструменты в облаке». Вместе с коллегами он обсудит, как AI помогает в этом направлении, и поделится опытом организации процесса.
Конференция проходит в двух форматах: офлайн и онлайн-трансляция на сайте.
Когда: 9 апреля, 10:00
Где: кинотеатр «КАРО 11 Октябрь», ул. Новый Арбат, д. 24
Для участия нужно зарегистрироваться. До встречи на GoCloud 2026!
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
