ch
Feedback
Внутри AI | Кейсы ИИ Агентов в бизнесе

Внутри AI | Кейсы ИИ Агентов в бизнесе

前往频道在 Telegram

Внедрение AI в компании от анализа до запуска - https://kts.tech/ai. AI Агенты и их применение в бизнесе Обзоры, кейсы, практика

显示更多
3 598
订阅者
-224 小时
+747
+47330
帖子存档
От RAG до агентов: что бизнес ждет от AI? В подкасте «Большой разговор про AI» Александр Опрышко, сооснователь KTS, рассказал, как AI уже меняет разработку и digital-рынок: от оцифровки базы знаний к агентам конкретных действий, от отдельных ассистентов к AI-центричному подходу в SDLC. Обсудили: ▫️почему компании так активно смотрят в сторону RAG, ассистентов проектировщиков и аналитики? ▫️как бизнес оценивает эффективность AI-проектов? ▫️почему многие хотят on-premise решения? ▫️куда перестраивается рынок? ▫️какой тренд показывает наш кейс ассистента Альфа-Банка с ROI 6 месяцев? 🔴 Посмотреть выпуск

Продолжаем вместе с вами улучшать Agent Platform Ценим обратную связь и стараемся оперативно добавлять функции по вашим пожел
Продолжаем вместе с вами улучшать Agent Platform Ценим обратную связь и стараемся оперативно добавлять функции по вашим пожеланиям на платформу. Один из частых запросов — детализация расходов и запросов. ▪️ Мониторинг активности: просматривайте расход токенов и количество запросов по разным параметрам — модели, времени и ключам. В личном кабинете доступна история списаний и пополнений, чтобы вам было удобнее контролировать расходы. ▪️ LLM-логи: смотрите историю запросов за последние 30 дней — без содержимого промптов и ответов. Вы увидите, какая модель использовалась, статус запроса и его стоимость. Обновление открывает возможность добавлять новых топовых провайдеров LLM, а также модели для изображений и видео. Пишите, каких ещё функций вам не хватает — обязательно учтём пожелания в будущих релизах.

Как я нахожу инсайты и отслеживаю личный прогресс с помощью скиллов в Claude Каждый день я работаю в Claude Code с разными задачами: бизнес- и продуктовые исследования, настройка агентов, проверка новых идей. В процессе столкнулся с двумя проблемами: 1) При параллельной работе в нескольких окнах с включённым auto-mode часть решений проходит мимо — можно пропустить интересные и полезные инсайты в выборе тактики. 2) Когда фоном ведёшь несколько задач, иногда в порыве теряешь фокус. При этом хочется фиксировать, что ежедневная работа действительно ведёт к поставленным целям. Чтобы закрыть эти боли, я настроил скиллы /insight и /progress. /insight. В конце сессии смотрит, было ли в ней то, что стоит запомнить. Если да — пишет короткую запись в журнал (.md) в фиксированном формате. Если нет — молчит. Встроил фильтр по критериям интересного, адаптировал под свою роль (например, исключил решения про кодинг — для меня они мало применимы) и установил запрет выдумывать инсайты в рутинный день. /progress. Запускается ежедневно, читает все сессии Claude Code, сжимает их и прогоняет через агента. Тот выбирает факты: над какими проектами шла работа, что решили, какие коммиты сделаны. Затем сверяет с указанными целями (.md) и фиксирует, где есть движение, а где нет. Раз в неделю вижу полную картину через призму работы в Claude Code: где продвинулся, что запустил, какие инсайты нашёл. Получается такая внутренняя ретроспектива. #иван_лавров

ИИ застрял в «одиночном режиме» За неделю несколько ведущих ресерчеров независимо высказались об одном: следующий рубеж развития ИИ — не интеллект, а интерактивность. Не «насколько умна модель», а «насколько хорошо она работает вместе с человеком». В чём проблема: сегодня модели воспринимают реальность одним потоком. Пока не дописали запрос — LLM ждёт и не видит, что вы делаете. Это узкий канал: до модели доходит лишь часть вашего знания, намерения и оценки. Thinking Machines сравнивает текущий формат взаимодействия с попыткой решить важный спор по почте вместо личной встречи. Они вводят новую концепцию — interaction models. Ключевая идея: интерактивность не «обвязка» вокруг модели, а часть самой архитектуры. Сегодня системы имитируют перебивания и многоканальность через harness (внешнюю «обвязку» — готовые компоненты, склеенные вокруг модели) и VAD (voice activity detection — отдельный модуль, который определяет, говорит человек или молчит) для распознавания границ реплик. Аргумент от Bitter Lesson: рукотворные надстройки проиграют общим масштабируемым методам. Если интерактивность встроена в модель — масштабирование одновременно делает её умнее и улучшает качество взаимодействия с человеком. Гонка за «интеллектом» упёрлась в то, как этот интеллект передать человеку и принять обратно правки. #александр_опрышко #развитие_ИИ

RAG-платформа для 12 000 операторов Альфа-Банка: ускорили поиск данных в 20 раз Раньше операторы контакт-центра вручную искал
RAG-платформа для 12 000 операторов Альфа-Банка: ускорили поиск данных в 20 раз Раньше операторы контакт-центра вручную искали информацию в базе знаний, чтобы ответить клиенту. На обработку одного запроса в среднем уходило 5 минут. Чтобы ускорить работу операторов, Альфа-Банк решил внедрить RAG-платформу. За помощью обратились к команде KTS. За 4 месяца мы вместе вывели проект в production и настроили систему так, чтобы данные всегда были актуальны, и каждый оператор получал ответ с учётом его уровня доступа. Платформу развернули внутри контура банка и запустили на двух GPU H100. Это позволило уложиться в экономику проекта и при этом обеспечить запас по производительности. В результате RAG-платформа ускорила и упростила работу операторов: ▪️ среднее время обработки запроса уменьшилось на 40 секунд: с 5 минут до 4 минут 20 секунд ▪️ поиск данных стал в 20 раз быстрее: 3 секунды вместо 60 93% операторов положительно оценили работу платформы, и решение масштабировали на всех сотрудников Альфа-Банка. Сегодня система обрабатывает 85 000 запросов в сутки. Больше деталей про настройку и работу RAG-системы показали в кейсе

Вы всё ещё переплачиваете за инфраструктуру? Тогда мы идём к вам. Расходы на облако часто растут незаметно. Тестовые среды работают ночью и в выходные. Неиспользуемые ресурсы продолжают списывать деньги. У команд нет общего правила, кто следит за потреблением и где проходит граница между «нужно» и «просто осталось включенным». В итоге счета растут, а ясности, за что платит бизнес, становится меньше. Мы поможем найти, где инфраструктура расходует лишнее, и сократить затраты без риска для продукта и команды. Что делаем: — проводим аудит расходов на облако; — оптимизируем инфраструктуру; — настраиваем мониторинг потребления и уведомления; — выделяем центры затрат; — прогнозируем бюджет; — считаем TCO и ROI. Если есть ощущение, что можно сэкономить на инфраструктуре, начните с бесплатного аудита. За 5 рабочих дней покажем, где вы теряете деньги. Сначала доведем до результата и только потом возьмем оплату. Гонорар KTS = подтвержденная экономия за 6 месяцев.

Знаем, как найти лишние расходы на инфраструктуру и сократить их без риска ↗️

Поговорим, как AI влияет на OKR: от горизонтов планирования до управленческого мышления 12 мая в 11:30 приглашаем на подкаст
Поговорим, как AI влияет на OKR: от горизонтов планирования до управленческого мышления 12 мая в 11:30 приглашаем на подкаст с Иваном Лавровым, Head of AI в KTS и основателем OKRsana — платформы для управления OKR с интегрированными AI-агентами. В прямом эфире обсудим: — каковы актуальные горизонты планирования — помогает ли AI формулировать более сильные цели или, наоборот, упрощает мышление — можно ли уйти от таблиц в OKR и не потерять управляемость — какие инструменты реально работают, а какие остаются модными практиками Регистрируйтесь по ссылке, приходите за инсайтами и задавайте вопросы — обещаем, будет интересно!

Этика AI в продаже недвижимости: можно ли прослушивать разговоры с клиентами? Застройщики часто приходят к нам с запросом зап
Этика AI в продаже недвижимости: можно ли прослушивать разговоры с клиентами? Застройщики часто приходят к нам с запросом записывать встречи и прогонять их через LLM: хочется контролировать качество консультаций, собирать все возражения и автоматизировать работу с ними. Технологически это несложно, но на практике подход может сыграть против девелопера. При покупке квартиры люди обсуждают с агентом чувствительные темы: финансовые возможности, семейные обстоятельства, размер первоначального взноса. Если человек понимает, что разговор записывается и анализируется AI, доверие рушится. Прослушка и контроль со стороны искусственного интеллекта пугают клиентов, поэтому сделка может сорваться. Эффективнее внедрить AI-ассистента для продавцов. Он помогает со сложными вопросами в реальном времени: за секунды находит информацию в базе знаний и формулирует точный ответ. Это сохраняет динамику сделки, показывает экспертность и не нарушает приватность клиента.

AI — только для enterprise. Доказываем, что это не так Средний и малый бизнес отказывается от внедрения AI, потому что считае
AI — только для enterprise. Доказываем, что это не так Средний и малый бизнес отказывается от внедрения AI, потому что считает его дорогим инструментом для крупных корпораций с миллионными бюджетами. На самом деле ИИ-решения подходят любому бизнесу, в котором есть повторяющиеся процессы. В новой статье разбираем: ▫️ почему проекты остаются на уровне вечного пилота ▫️ процессы, которые стоит автоматизировать в первую очередь ▫️ какие метрики использовать, чтобы оценить результат ▫️ как платформенный подход меняет экономику AI-проектов ▫️ сроки и этапы запуска кастомного решения Статья будет интересна малому и среднему бизнесу, который думает о внедрении AI, но не знает, с чего начать. Заходите в блог, чтобы узнать, как за 1-2 месяца сделать AI прикладным инструментом с измеримым эффектом.

Мой MCP-стек для Claude Code Сам по себе Claude Code — просто CLI. Реальную пользу ему даёт обвязка из MCP-серверов: они подключают агента к твоим данным и workflow. Делюсь стеком, который использую ежедневно. Разбил его на три контура: ▫️ Автоматизация рутины (менеджерская часть) workbook — самописный MCP, который постепенно наращиваю под свои задачи. Сейчас в нём: работа с Твиттером, Контур.Толк, календарём, почтой, to-do list. yandex-tracker — управляю загрузкой, создаю задачи на основе транскрибации. excel-mcp-server и mcp-google-sheets — читаю локальные xlsx и Google Sheets. Удобно для работы со сметами. ▫️ Исследования arXiv — для поиска и чтения свежих статей, чтобы понимать, как устроены SoTA-подходы. reddit-mcp-buddy — быстро снять пульс сообщества: что обсуждают, какие инструменты хвалят, на что жалуются. Хороший сигнал для продуктовых решений. playwright/computer-use — когда WebSearch и WebFetch не справляются (авторизация, JS-рендеринг, закрытый контент) или нужна автоматизация без API. ▫️ Программирование context7, deepwiki — инструменты, которые дают актуальную документацию для агента. Подробно рассказывал об этом в посте. everything-claude-code (affaan-m) — готовый набор из 47 агентов, 181 скилла и 79 команд: code-review, TDD, planner, build-fix, мультиагентная оркестрация. Беру как стартер и выкидываю лишнее. spec-kit от GitHub — тулкит для spec-driven development. Вместо вайб-кодинга выстраивает пайплайн: constitution → specify → clarify → plan → tasks → implement → verify. Спеки становятся исполняемыми артефактами, агент работает с чёткими входами вместо расплывчатых промптов. #александр_опрышко

Managed Agents от Anthropic: зачем агентам своя операционная система Anthropic опубликовал инженерный разбор Managed Agents — своего сервиса для запуска агентов. Это интересное объяснение того, как стоит проектировать инфраструктуру агентов в 2026. Проблема. Агент — это не один вызов LLM, а длинный цикл: модель думает → вызывает инструмент → получает результат → думает дальше. Если жёстко зашить этот цикл под текущее поколение моделей, через полгода придётся переписывать инфраструктуру. Авторы формулируют это одной фразой, которую уже растащили на цитаты: «Harnesses encode assumptions that go stale as models improve». Идея. Решение не новое — так операционные системы в своё время справились с «программами, которых ещё не существует». Они не пытались угадать будущие приложения, а виртуализировали железо в стабильные абстракции: процесс, файл, сокет. Приложения менялись, абстракции оставались. Anthropic применяет этот приём к агентам — раскладывает их на три независимые сущности: ▪️Session — append-only лог всего, что произошло. Живёт отдельно от модели и её контекстного окна. Это «память» агента, к которой можно обращаться произвольно. ▪️Harness — цикл, который крутит модель и маршрутизирует tool calls. Stateless, одноразовый, заменяемый. ▪️Sandbox — среда, где исполняются инструменты. Тоже одноразовая: упала — подняли новую. Подробный разбор можно прочитать по ссылке. #александр_опрышко

6 сценариев внедрения ИИ в девелопмент Собрали решения, которые можно быстро встроить в работу и получить измеримый результат
6 сценариев внедрения ИИ в девелопмент Собрали решения, которые можно быстро встроить в работу и получить измеримый результат: снизить количество ошибок, увеличить производительность команд и оптимизировать расходы. ▪️AI-ассистент менеджера по продажам Чат-бот подключается к привычным каналам: CRM, сайту, Telegram. Помогает найти ответы на вопросы клиентов и даёт подсказки по документам. ▪️Консультант по недвижимости Обрабатывает запросы на естественном языке, точнее выявляет потребности и подбирает персональные объекты. Может работать как плагин на сайте, в мессенджере или личном кабинете. ▪️Голосовой помощник для колл-центра или шоурума Работает как дополнение к телефонии или робот-консультант. Воспринимает вопросы клиентов, отвечает по базе знаний и формирует персонализированные подборки решений. ▪️Анализ диалогов операторов колл-центра Выявляет ошибки и отклонения от сценариев, классифицирует причины отказа и помогает оценить качество работы сотрудников. ИИ-ассистент может анализировать диалоги как в реальном времени, так и в ретроспективе. ▪️ИИ-помощник для управляющей компании Чат-бот или голосовой робот отвечает на частые вопросы жителей, фиксирует обращения и снижает нагрузку на операторов. ▪️Компьютерное зрение на стройке Программно-аппаратный комплекс, веб- и мобильное приложение для мониторинга целевых событий. Фиксирует передвижение техники и персонала, контролирует опасные зоны и выявляет простои. Подробнее о том, какие AI-решения можно внедрить в девелопмент уже сейчас, смотрите в презентации коммерческого директора KTS Александра Баталова.

Продолжаем развивать Agent Platform. Ниже — ключевые изменения за последний месяц. ▫️Повысили планку доступности и надежности
Продолжаем развивать Agent Platform. Ниже — ключевые изменения за последний месяц. ▫️Повысили планку доступности и надежности системы. ▫️Добавили прозрачный мониторинг. Теперь по каждой модели пользователям доступны метрики времени отклика и доступности. ▫️Детализировали траты токенов и списания в личном кабинете. Появилась разбивка по периодам и возможность выгрузки данных. Упрощает контроль затрат и подготовку отчетности. ▫️Улучшили работу с графическими моделями OpenAI, включая GPT Image и DALL·E. ▫️Запустили партнерскую программу в бета режиме. Если вы работаете с AI-проектами или ведете блог на AI-тематику, напишите нам на почту agentplatform@kts.tech, мы открыты к сотрудничеству

Александр Опрышко, один из основателей KTS, прямо сейчас на круглом столе конференции GoCloud 2026. Обсуждаем проблемы при развертывании CI/CD-пайплайна, ограничения облачных и on-premise решений и где оправдан гибрид. А также делимся, как AI помогает в этом направлении на примере своих кейсов. Прямая трансляция конференции по ссылке.

Как я использую Claude в менеджерских задачах Чтобы AI выдавал хороший результат, он должен знать всё, что знаешь ты. Не «напиши правильный промпт» — а дай весь контекст. Для этого нужно создать базу знаний и регулярно загружать в неё данные. Сделать это задним числом — сложно и муторно. Намного проще «скормить» предыдущие заметки, начать вести базу знаний в понятном для Claude формате и регулярно к нему обращаться. С чего я начал в январе: ▫️ создал git-репу, описал себя и свои цели за 3 года ▫️ подключил календари, почту и ремайндеры через MCP ▫️ написал скилл для старта дня: Claude скачивает повестку на сегодня/завтра и ведёт архив ▫️ разложил артефакты по проектам Через 3 месяца: ▫️ goals/ — цели и стратегия ▫️ projects/ — все проекты с артефактами и контекстом ▫️ meets/ — записи и саммари встреч ▫️ memory/ — персональная память Claude, которой я управляю вручную ▫️ schedule/ — расписание, синхронизированное с календарём ▫️ todolist/ — задачи из Apple Reminders ▫️ tgposts/ — автоматизация контента для Telegram-канала ▫️ main_mcp.py — единая точка входа для собственных автоматизаций: код автоматизаций лежит рядом с базой знаний, база знаний в формате Markdown Обычный иерархический текст превратился в динамическую базу знаний, которая кумулятивно увеличивает свою ценность. При этом управление контекстом я не отдаю на откуп AI. Модель не определяет самостоятельно, что важно — я вручную управляю необходимой информацией. Ещё один инсайт: многие процессы можно автоматизировать через человекопонятные алгоритмы на базе скиллов Claude Code. Пишешь по шагам, что нужно сделать — и получаешь не просто детерминированную автоматизацию, а процессы с интеллектом внутри: декомпозиция смет, саммари встреч и собеседований, анализ новостей из Twitter, разбор стартапов из YC. С удивлением обнаружил, что лидеры индустрии приходят к похожему. Karpathy на этой неделе описал концепцию LLM Wiki: складываешь сырые источники в папку, LLM компилирует из них wiki с бэклинками и категоризацией. Его главная мысль — память AI должна быть явной (видишь, что он знает и не знает), в файлах (не привязана к провайдеру) и интероперабельной (любая модель работает с теми же файлами). #александр_опрышко #ai #claude_code

Стоит ли бизнесу маскировать AI-ассистента под человека? На демо AI-ассистента для крупной сети фитнес-центров нам задали ожидаемый вопрос: должен ли робот мимикрировать под человека? Ведь посетители сайта легко могут определить, что перед ними ИИ. Моя точка зрения: нет никакого смысла скрывать виртуальную сущность ассистентов. Объясню, почему: 1. В попытке «очеловечивания» робот отходит от своей агентской задачи, что иногда приводит к фейлам. ИИ-ассистент австралийской сети Woolworths рассказывал клиентам про свою маму и дядю, убеждая в своей «кожаности», пока компания не отключила эти скрипты после волны возмущения. Есть и данные: по исследованию Nielsen Norman Group, добавление «человеческой теплоты» снижает точность ответов ИИ на 10—30%. 2. Решение вопросов через ИИ может вызвать даже бОльшее доверие со стороны людей. На моём опыте компании с действительно топовой коммуникацией редкость. У части компаний сервис заложен в ценностях, но это исключения. В остальных случаях робот выполняет работу/дает ответы быстрее и точнее, чем человек, а это именно то, что мы ожидаем от профессионального сервиса. Порог качества, ожидаемого от людей, тоже вырастет: зачем средний сервис от человека, если можно получить такой же или лучше от робота? В конечном счёте это хорошо для клиента. 3. Человеку проще спросить у робота, чем у другого человека, в чувствительных, а может и где-то постыдных вопросах. Перед роботом не нужно оправдываться за «глупый» вопрос, не страшно переспрашивать. 4. В какой-то момент раскрытие ИИ при предоставлении сервиса станет законодательно обязательным и в РФ. В ЕС это уже закон — с августа 2026 AI Act обязывает сообщать пользователю, что он общается с ИИ. Россия обычно перенимает регуляторные тренды с лагом в пару лет — лучше быть готовым заранее, чем перестраиваться потом. Но есть важный момент! Не прятать робота за человеком — не значит убирать людей из процесса. Наоборот, стоит подчеркивать их роль: кто разрабатывает, обучает, анализирует работу ИИ-системы. Доверие клиента строится не на иллюзии, что с ним говорит человек, а на понимании, что за роботом стоит команда, которая его обучила на специфике конкретного бизнеса. Отдельная тема — гибридные схемы. Где люди проверяют и улучшают работу ИИ-агентов. В каких ситуациях необходимо подключение живого специалиста. Совместная работа, где ИИ подсказывает решения, но ответственность и коммуникация остается за человеком. Это не костыль на переходный период, а живая целевая модель. Что мы ответили фитнес-сети? Сейчас нет необходимости притворяться, что это не виртуальный помощник. Их посетителю не нужен фальшивый друг на ресепшен. Ему нужен тот, кто за минуту ответит на все вопросы, подберет клуб с подходящим расположением и расписанием и поможет оформить абонемент, что напрямую влияет на бизнес-метрики. #иван_лавров

RAG без облака: как запустить LLM для FinTech и уложить inference в одну H100 В KTS обратился крупный клиент из FinTech с запросом на корпоративную базу знаний. Сначала мы собрали демоверсию на собственной облачной инфраструктуре. По качеству она устраивала клиента и показывала нужный результат. Но облачные AI-инструменты для FinTech часто не подходят из-за высоких требований к безопасности данных. В таких проектах обычно используют open source LLM. У этого подхода есть две проблемы: качество таких моделей часто ниже, чем у облачных, а inference обходится дорого. Мы рассчитали инфраструктуру для решения. Оценили стоимость видеокарт, которые понадобятся для запуска модели, и возможный экономический эффект.На старте экономика выглядела неочевидной — стоимость видеокарт могла съесть значительную часть потенциальной выгоды. Поэтому мы начали экспериментировать с демоверсией продукта и искать способ повысить качество и снизить стоимость inference. В итоге решение удалось запустить полностью на одной карте h100 с требуемым качество (более 94% процентов корректных ответов на базе знаний). В результате задача, которая изначально выглядела слишком дорогой для on-premise инфраструктуры, стала экономически оправданной. Для FinTech и других регулируемых отраслей это важный кейс Облачные AI-сервисы часто недоступны из-за требований к данным, а стоимость локальной инфраструктуры останавливает такие проекты ещё на старте. #александр_опрышко

KTS на GoCloud 2026: поговорим про AI и облака 9 апреля в Москве пройдёт конференция GoCloud от Cloud.ru. В этом году ключева
KTS на GoCloud 2026: поговорим про AI и облака 9 апреля в Москве пройдёт конференция GoCloud от Cloud.ru. В этом году ключевая тема — простые и безопасные инструменты для работы с AI, которые можно использовать уже сейчас. Что ждёт участников: ■ 4 трека про AI, Data, инструменты разработки и облачную инфраструктуру ■ 50+ спикеров из ведущих российских компаний ■ 15+ демозон с live-демонстрациями облачных и AI-сервисов, партнёрских продуктов и нетворкинг с экспертами ■ 7 воркшопов под руководством экспертов Александр Опрышко, управляющий партнёр и системный архитектор KTS, примет участие в круглом столе на тему «DevOps-инструменты в облаке». Вместе с коллегами он обсудит, как AI помогает в этом направлении, и поделится опытом организации процесса. Конференция проходит в двух форматах: офлайн и онлайн-трансляция на сайте. Когда: 9 апреля, 10:00 Где: кинотеатр «КАРО 11 Октябрь», ул. Новый Арбат, д. 24 Для участия нужно зарегистрироваться. До встречи на GoCloud 2026!