Внутри AI | Кейсы ИИ Агентов в бизнесе

前往频道在 Telegram

Внедрение AI в компании от анализа до запуска - https://kts.tech/ai. AI Агенты и их применение в бизнесе Обзоры, кейсы, практика

显示更多

俄罗斯127 634 技术与应用20 739

4 213

订阅者

-424 小时

+1637 天

+27830 天

728

帖子浏览量

~ 25224 小时

~ 29048 小时

17.29%

参与率

无数据

每日帖子数

Ads index

beta

帖子存档

4 211

Nocode умер, да здравствует nocode Всю дорогу разработчики пытались упрощать создание программ. Начинали с Assembler, с каждым новым языком программирования повышали уровень абстракции, создавали библиотеки / фреймворки для упрощения и ускорения разработки. В итоге мы дошли от Assembler до Python, Go, TypeScript и других языков. Попытались пойти дальше и сделать инструменты nocode — ещё одну абстракцию, которая позволит создавать системы не программистам. В итоге получали очень нишевый инструмент автоматизации или очередной язык программирования мышкой с проблемами версионируемости и наблюдаемости. Характерный пример — n8n. Кто на нём пытался собрать что-то больше прототипа, неизбежно сталкивался с множеством проблем, которые решались большими костылями. С приходом кодинговых агентов целесообразность в ноукоде драматически упала: агенты кратно лучше работают с кодом, чем с платформами ноукода, е2е реализуют более сложные системы без болей ноукода, так как системы построены на коде, для которого придумали механизмы версионирования, стабильного обновления и наблюдаемости. Но все же возникает вопрос, как построить систему с идеологией ноукода, где разрабатывают и обновляют не программисты, есть простой деплой без девопсов и наглядная визуализация. При этом без минусов ноукода, описанных выше. Этот подход — Spec-Driven Development. Давайте вспомним подход enterprise-компаний: есть бизнес аналитики, которые формируют требования и скоуп, есть системные аналитики и архитекторы — они придумывают, как система вписывается в текущий ландшафт и взаимодействует с другими системами. Программисту в таких компаниях остаётся транслировать проработанные требования в код, доработав детали, которые не учли на этапе проектирования. В итоге получается, что текущие процессы компании уже заточены под формирование требований и только процесс создания кода остаётся всё ещё на людях. А что, если принять документацию как код, и на её основе генерировать код с помощью агентов. В итоге мы получим новый уровень абстракции nocode в виде спецификации и детерминированную реализацию в формате кода и тестов, которая лишена минусов ноукод-систем. При этом полностью отходим от участия кодера (намеренно использовал эту формулировку вместо «разработчика») в создании кода. Возникает справедливое возражение: агенты же нейрослоп кодовый генерируют. Через некоторое время это невозможно будет поддерживать. Да, всё так. Поэтому нужно строить принципы-правила-навыки, по которым агент будет работать. То есть задача разработчика смещается от ручной трансляции требований из спецификации в код в создание конвейера для агентов, мониторинга качества «продукции» и оперативного реагирования на нарушение технологического процесса. Как это реализовать, поделюсь в следующем посте. Чтобы сузить скоуп, расскажу про агентские автоматизации, а не системы общего назначения. #александр_опрышко

4 211

Repost from Код в каске — герои цифровизации девелопмента

Про ИИ говорят много. Про то, где он реально помогает девелоперам — значительно меньше. На карточках собрали конкретные сценарии, которые уже используют наши клиенты: с форматом и ожидаемым эффектом. Большинство из них запускается на базе того, что у девелопера уже есть: внутренние документы, регламенты, данные из CRM. 💬 Листайте и оставляйте заявку, чтобы связаться с нашим экспертом и обсудить внедрение ИИ в вашей компании

4 211

ИИ вне разработки В прошлых постах много писал про разработку. А что поменялось в процессах других команд? Сегодня поговорим про эволюцию отдела продаж. За последние несколько месяцев попробовали много инструментов. Начиналось всё, думаю, как и у всех, с того, что сейлзы начали использовать нейро-инструменты. Например, пробовали обсуждать с ChatGPT свои сделки. Сами лиды при этом лежат в CRM, сметы считаются в таблицах, КП готовится в Фигме, а процесс выработки решения довольно сложный и состоит из встреч с партнёрами, клиентом, технической командой и т. д. Когда сейлзы начали использовать ИИ-инструменты, это, как и в случае с разработкой, ускорило работу и сделало её местами более качественной за единицу времени. Но это всё ещё не кратное ускорение / улучшение. Мы смогли продвинуться чуть дальше. Но сначала нужно понять классические проблемы отдела продаж (не только наших). Изучение кейсов и продуктов компании обычно занимает пару месяцев, адаптация сейлза к процессу сбора КП, синхронизация с командой — всё это приводит к продолжительному онбордингу, на который накладывается ещё и длинный цикл сделки. В итоге сейлз может начать что-то приносить через полгода. При этом капитализация отдела продаж в основном в: ▫️ контактах в CRM ▫️ отработанных лидах и кейсах (которые часто неструктурированы и разбросаны по системам) ▫️ всяческих шаблонах и готовых упаковках ▫️ опыте конкретных людей Соответственно, чтобы выходить на новый уровень качества и скорости, нужно усиливать эту капитализацию с ИИ. Все перечисленные пункты на самом деле раскладываются на 2 задачи: — накопление знаний: чёткая структура, быстрый и простой доступ — типовые кросс-командные решения Поэтому первое, что мы сделали — ИИ-агента с поиском по нашим решениям. Он позволяет быстрее ориентироваться в продуктах и кейсах (которых, на минуточку, несколько сотен, и никто не знает про все). А второе — агент, который помогает оценивать уровень качества КП по оформлению и принятым практикам. Таким образом регламенты и подходы становятся не просто рекомендациями (которые на практике быстро деградируют), а правилами, заложенными в систему. Но этого было недостаточно. Во-первых, оба инструмента находятся в нашей внутренней системе. Получается, сейлз работает в CRM, сидит в чатах и почте, звонит по телефону, готовит КП вместе с GPT и ещё кучу всего делает. И тут ему ещё одну вспомогательную систему дали. Мотивации туда заходить не так много. Новые инструменты добавляются централизованно, а значит долго, и не извлекают экспертизу и знания конкретного сейлза в общие практики. Артефакты подготовки конкретного КП всё также передаются в гугл-папках, CRM, чатах и т. д. И тут становится понятно, что эти проблемы давно решены в разработке: ▫️ экспертиза, знания и правила — это скиллы для ИИ-агентов ▫️ общее хранилище данных — репозитории, где работают все инженеры (вместе с ИИ-агентами) в одном контексте ▫️ генерация артефактов с кодинговыми агентами работает лучше всяких чатов с GPT Поэтому решение стало очевидным: сейлзы должны начать накапливать знания о своих пресейлах и генерить решения вместе с техническими командами так же, как это делают разработчики. Мы сделали один общий git-репозиторий для продаж. Он содержит: схему данных о клиентах и их заявках для накопления всех артефактов, MCP CRM, набор скиллов для работы с кодинговыми агентами. Процесс выглядит так: когда поступает новая заявка, сейлз получает данные о ней из CRM с помощью скилла. Другой скилл делает предварительный анализ клиента и заявки. Сейлз может поразгонять его в глубину вместе с агентом. Дальше первичный созвон с клиентом. Запись попадает в папку лида в репозитории, и агент может использовать её для помощи в генерации первичного решения. Аналогично с записью брейншторма команды. На основе собранных артефактов сейлз составляет план КП. А партнёр или архитектор решения сразу получает весь набор артефактов, просто спуллив апдейт репозитория.

4 211

Как управлять LLM в закрытом контуре и не потерять контроль над безопасностью и бюджетом Завершаем обзор AI Platform. Сегодня разберём фундамент всего стека — LLM-платформу. Обычно для решения разных задач одной модели недостаточно. Для части запросов нужен уровень качества мировых SOTA. В других задачах критически важно обрабатывать чувствительную информацию локально. В промышленной эксплуатации используются десятки LLM. У них могут быть разные размеры, расположение в контурах и типы обрабатываемых данных. LLM-платформа позволяет контролировать безопасность и бюджет на уровне инфраструктуры. Это единый OpenAI-совместимый шлюз, который входит в реестр российского ПО. Встроенный ПДн-роутер распределяет запросы на основании содержимого и политик безопасности заказчика: ▪️ локальная инфраструктура — персональные и конфиденциальные данные, чувствительные задачи ▪️ в российские облака — YandexGPT, GigaChat, Cloud.ru — если важна юрисдикция и нужно масштабирование без собственных GPU ▪️ к мировым SOTA-моделям — OpenAI, Anthropic, Google, DeepSeek — только запросы без ПДн, где критично качество ответа Функциональность платформы позволяет отслеживать токены, стоимость, латентность по каждому запросу и контролировать лимиты и расходы в реальном времени. Локальные модели разворачивается по запросу из админки, поддерживается разделение GPU для эффективной утилизации ресурсов. Платформы агентов, данных и LLM образуют единый стек для внедрения AI в закрытом контуре. Компании получают готовую инфраструктуру с контролем безопасности, качества и бюджета, что позволяет быстрее переходить от пилотов к промышленной эксплуатации и масштабировать AI-сценарии без пересборки архитектуры. Проверьте, как AI Platform работает на ваших данных. Запишитесь на демо

4 211

Монорепы на пути к AI SDLC В прошлом посте рассказывал про то, как мы перенесли документацию в гит и сделали удобный инструмент согласования бизнес-требований с заказчиками. Следующий шаг «сближения» данных и сбора общего контекста для разработчиков и агентов — создание монорепы / общего воркспейса с несколькими репозиториями у проекта. Классическая картинка выглядит так: есть репа с бекендом, есть с фронтендом, и еще несколько вспомогательных реп на какие-то смежные сервисы. Сама структура репозиториев не позволяет одним коммитом добавить функционал: нужно, например, сделать бек, потом фронт, а часто это еще и разные специалисты и разные задачи в трекере, за синхронизацией которых между собой следят менеджеры и тимлиды. Это очевидная точка оптимизации на пути к AI SDLC. Если я могу (утрированно) сгенерить код фронта за час, но мне нужно ждать целый день, чтобы его передать следующему спецу, который сделает бек, а потом это все сливать в стейдж, чтобы отдельно интеграционно потестит, то я теряю уйму времени на передаче контекста и отслеживание статусов атомарных задачек и контроля их синхронизации. Никаким кратным ускорением не пахнет. Соответственно, возможность, которую хочется использовать в AI SDLC — атомарной задачей должна стать сама фича, а не ее кусочки. А для этого мне нужно в одном месте собирать все артефакты: от бизнес-требований (см предыдущий пост) до автотестов. Это место — в идеале монорепа. Тогда я смогу одним коммитом вмержить целый блок функционала: и актуальные бизнес-требования, и техническую спецификацию, и реализацию, и автотесты. Это гарантирует синхронизацию артефактов между собой, сократит время на менеджмент подзадач, позволит агентам точнее выполнять задачу. Идеальный процесс тогда может выглядеть так: – Аналитик собирает требования, кладет расшифровки звонков в репу, любые другие артефакты в процессе анализа, и генерит документацию по бизнес требованиям. Все это в ветке монорепы. – Опционально аналитик может даже сгенерировать прототип в реальном коде на основе своих же бизнес-требований и показать клиенту (автоматический деплой из фича-ветки, такая вот нативная интеграция наших услуг) – Менеджер / тимлид в этой же ветке может загрумить задачки, поразгоняв с агентом. И сразу же завести их в трекере по mcp, если нужно. Автоматически приложив в задачу ссылку на документацию в нашем же сервисе. – Разработчик вместе с агентом реализует фичу в этой же ветке, глядя на согласованные бизнес-требования и прототип (который он потом просто выкинет) прямо в этой же ветке. Обновляет автоматически документацию, если есть изменения в процессе. – Ветка проходит ревью у тимлида целиком. – Тестировщик тестит эту же ветку (снова нативная интеграция фича-стендов) в изолированном окружении и дописывает автотесты. Фича стала набором связанных артефактов и они все одной транзакцией попали в основную ветку при мерже. Я специально на каждом шаге в примере приводил разных специалистов, хотя уже видно, что следующие шаги на пути к AI SDLC — это скиллы, которые позволяют с должным уровнем качества делать эти шаги с помощью агентов. А потом какие-то шаги делать автономно. Про это буду писать в следующих постах по мере реализации на практике. #сергей_чернобровкин

4 211

Безопасно ли запускать AI-агента на корпоративных данных? Продолжаем разбирать AI Platform для закрытого контура. В прошлый раз рассказали, как агентская платформа ускоряет создание агентов в десятки раз. Сегодня поговорим о работе с базами знаний. Корпоративные данные — один из основных барьеров внедрения AI в enterprise. Компании хотят их контролировать, поэтому требуют создавать контуры индексации на базе собственной инфраструктуры. Для этого нужны готовые решения по работе с структурированными (базами, таблицами) и неструктурированными данными (PDF-документами). Платформа данных устраняет этот барьер. Мы встроили в неё 6 инструментов для разных типов запросов с проверкой на качество и безопасность данных: ▪️ Парсинг PDF с таблицами, схемами и сложными структурами, поддержка работы с DOCX, PPTX, XLS. ▪️ Классический RAG — гибридный поиск: BM25 + векторный. Подходит для быстрого семантического поиска по большим массивам информации. ▪️ Графовый RAG — поиск по многосвязанным данным, где важны связи между фактами, а не отдельные фрагменты. ▪️ Табличный доступ — SQL, API, CSV, DWH подключаются как инструменты через MCP. ▪️ Валидация данных — подсветка конфликтов и дублей в документах. Позволяет найти конфликты, устранить их и таким образом значительно снизить галлюцинации решений. ▪️ Сквозной RBAC — ролевая модель из корпоративной AD/Keycloak на каждом запросе. Агент видит только ту информацию, которая доступна конкретному пользователю. Чувствительные данные не попадают в LLM и внешние контуры. Запрос проходит через маскировку и гардрейлы по правилам безопасности. В наших проектах запуск AI-агентов на корпоративных данных даёт измеримый результат: поиск информации ускоряется на 50-80%, а обработка документов — на 70-90%. Как это работает, показали в кейсе с Альфа-Банком.

4 211

👀 Новые модели в Agent Platform Хорошая новость для тех, кто тестирует разные LLM под агентские сценарии, внутренние ассистенты, работу с текстом и изображениями. Недавно добавили несколько новых моделей: Новые модели Anthropic: — anthropic/claude-fable-5 нашумевшая fable-5 — anthropic/claude-sonnet-5 для задач, где важны качество ответа, работа с контекстом и сложными инструкциями. Новые опенсорсные модели, которые показывают хорошие результаты в кодировании, с хостингом в РФ у нашего партнера Cloud.ru: — cloudru/MiniMaxAI/MiniMax-M3 — cloudru/zai-org/GLM-5.2 Новая модель для работы с изображениями: — google/gemini-3.1-flash-lite-image Заходите в Agent Platform протестировать

4 211

Сегодня студенты живут свою лучшую жизнь… ... потому что им помогают AI-агенты Обычно подготовка научной или дипломной работы начинается с попыток сформулировать тему и часов поиска подходящей литературы. Для ДВФУ и РАНХиГС мы разработали AI-агента, который выдаёт готовую основу для исследования за минуты. Вместе с командой ГигаЧат реализовали проект за 3 недели: спроектировали инфраструктуру, настроили RAG и векторизовали 200 000 книг из библиотечных фондов. По запросу пользователя агент подбирает источники из базы знаний и передаёт их в LLM. Модель ГигаЧата суммаризирует данные и генерирует ответ с формулировками темы, структурой научной работы и списком литературы. Так за один короткий запрос студент получает всё необходимое для начала исследования без привлечения научного руководителя. 🤨 Этот проект показывает, как AI-решения на основе RAG помогают структурировать разрозненные источники данных, упрощают работу с базами знаний и экономят часы на поиске информации. Подробности — в кейсе

4 211

🏆 Ворвались в Рейтинг Рунета 2026 В этом году KTS впервые участвовал в AI-направлении Рейтинга Рунета 2026 — и сразу попал в топ-20, заняв 12 место в номинации «Разработка и внедрение искусственного интеллекта». Участников рейтинга оценивали по проектам, услугам, отраслевой экспертизе и достижениям за 2025–2026 годы. Попадание в топ-20 — подтверждение, что наш опыт в AI уже заметен на рынке. Для нас это важный результат: AI-направление в KTS быстро растёт, а проекты становятся все более прикладными — от внедрения LLM и RAG до AI-агентов и внутренних инструментов для бизнеса. Благодарим ключевых партнеров: Альфа-Банк, Гигачат, Столото и других лидеров рынка за доверие! Работаем дальше: усиливаем экспертизу, развиваем AI-решения и двигаемся выше.

4 211

Спецификации на пути к автономной разработке В прошлых постах рассуждал про инженеров будущего и про автономный цикл создания ПО. Мы работаем над инструментами для такого AI SDLC (как сейчас модно говорить), и масштаб компании даёт как преимущества, так и создаёт проблемы. С одной стороны, мы видим очень много разных проектов. Это даёт возможность проанализировать их и найти общие паттерны, выработать общие подходы к разработке, стараться автоматизировать их. С другой стороны, внутренние инструменты, которые мы создаём, должны отвечать требованиям очень разных команд. Нет возможности срезать углы и закастомить под конкретную команду — всегда должно быть общее решение. Теперь вернемся к AI SDLC. По моему мнению, сейчас не столь важны инструменты, сколько создание общей среды для агентов и людей. Накопление знаний и создание единого контекста. LLM и инструменты меняются, данные и знания остаются. Это значит, что первая задача на пути к автономному созданию ПО — максимально «сблизить» данные, которыми оперируют разные специалисты и агенты. И в первую очередь все собирают бизнес-требования. Spec driven development уже давно звучит из каждого утюга. Но проблема в том, что конечный стейкхолдер выдаёт требования обычно обрывочно и неструктурированно. Их нужно собирать с заказчика, анализировать и на основе этих данных синтезировать спецификацию. А потом согласовывать. И обычно этот процесс ведется в удобных инструментах типа гугл-доков или конфлюенсов, где можно оставить комментарии, предложить изменения и т.д. Но даже после согласования документации есть не менее объёмная задача — поддержание этой документации в актуальном состоянии. И при этом хочется, чтобы конечные доки лежали в том же месте, что и код, и другие артефакты по проекту. Тогда и получится максимально использовать агентов для последующей генерации уже технической спецификации, кода, тестов и т.д. В целом, работать через mcp с теми же гугл-доками можно. И мы так и делали в первых итерациях. Проблема в том, что «мостиком» между агентом и документацией тогда является человек, который работает с ними. Он должен указать документ, изменить его (например, автоматически обработать комментарии заказчика), а через MCP часто бывает неудобно (перетирается весь док, нельзя включить режим предложений). А обновить документацию уже потом в процессе разработки — отдельный шаг, который точно кто-нибудь забудет. Мы даже разработали плагин к гугл-докам, который умеет обрабатывать комментарии и вносить правки в режиме предложений. Но этого все ещё недостаточно, потому что кодинговый агент, живущий в репозитории, лучше всего работает с артефактами из этого репозитория. Поэтому единственное качественное решение, к которому мы пришли: вся документация по бизнес-требованиям должна быть в той же репе в гите. Ок, это не проблема для аналитиков, но заказчик точно не захочет смотреть мерж-реквесты в Гитлабе. Он привык к удобным гугл-докам. Поэтому нам пришлось разработать сервис для просмотра и согласования документации, которая лежит в репозитории. Сервис позволяет комментировать (через комменты к мерж-реквестам) и редактировать (через коммиты) документы прямо онлайн, полностью имитируя процесс гугл-доков. Теперь большинство аналитиков согласуют с заказчиками документацию в нашем сервисе и она автоматически попадает в репозиторий, где её же использует агент. А комменты от заказчиков можно обрабатывать автоматически. Затем разработчики используют документацию уже для программирования и в процессе разработки могут автоматически (агентом) проапдейтить документацию, если было изменение в процессе реализации. Но мало сделать, надо еще и внедрить. Для внедрения мы сделали простой yaml-конфиг, описывающий структуру документации в репозитории. Разработчикам / аналитикам нужно добавить только этот конфиг и репозиторий автоматически покажется в интерфейсе сервиса для просмотра и согласования документов. Вуаля, и вот мы сделали маленький, но важный шажок на пути к автономному AI SDLC. #сергей_чернобровкин

4 211

Как запускать AI-агентов в закрытом контуре за пару часов Мы уже рассказывали об AI Platform — это три связанные платформы в одном стеке. Сегодня подробнее разберём верхний слой — агентскую платформу, которая кратно ускоряет запуск AI-решений. Обычно новый AI-агент в enterprise — это отдельный проект с длительным циклом разработки и внедрения. Нужно проектировать архитектуру, настраивать взаимодействие с другими агентами, права доступа и интеграции с корпоративными системами. В результате деплой одного AI-агента занимает 2-3 месяца. Агентская платформа сокращает этот цикл до нескольких часов. Что внутри: ▪️ шаблоны под основные классы задач, деплой по коммиту через GitLab CI ▪️ поддержка полноценных агентских сценариев: human in the loop, остановка и возобновление работы агента, ретраи при сбоях инфраструктуры ▪️ мультиагентное взаимодействие, оркестрация каскадов и подключение оператора для подтверждения ▪️ трассировка всей цепочки: промпты, инструменты, стоимость, латентность по каждому шагу ▪️ регрессионные прогоны и сравнение метрик между промптами и моделями перед релизом

«Кроме базового инфраструктурного слоя, сейчас тестируем новый SDLC разработки: агенты разрабатываются кодинг-агентом, а платформа визуализирует потоки данных. Так мы реализуем возможность создавать агентов нетехническими специалистами, как это предполагает no-code-подход. При этом сохраняются все преимущества и надежность классической разработки», — Александр Опрышко, управляющий партнёр KTS

Оцените, как AI Platform работает на ваших данных. Запишитесь на демо, сравните качество и стоимость, чтобы принять решение о пилоте

4 211

Корпоративное ПО в эпоху AI 8 месяцев назад мы с коллегами обсуждали выбор ПО для автоматизации части внутренних процессов. Были в классической ситуации, которую помогаем решать нашим клиентам: каждый отдел использует свои инструменты разного уровня автоматизации, от экселек с аппскриптами до специализированного ПО под конкретные задачи. Типичная «лоскутная автоматизация». Мастер-данные при этом не хранятся в единой системе: сотрудники в 1С, клиенты в CRM, финансы в агрегаторе, отчетность в таблицах, ДО и КЭДО в отдельных сервисах, управление проектами в трекере. Все это помазано сверху самописными сервисами, которые перекладывают данные между системами. Мы, как и наши клиенты, встали перед выбором: либо делать кастомную систему, либо покупать коробочное решение. Прикинув, что коробка обойдется скорее всего дешевле, мы начали смотреть варианты. И пока выбирали, я начал переделывать одну из систем для хранения маркетинговых данных с nocode на самописную. А мы все еще выбирали, смотрели альтернативы. Любые из них, как и полагается коробкам, были не совсем подходящими для наших данных и процессов. Мы начали обсуждать, как будем натягивать потенциальное решение на текущие системы, что придется поменять в процессах и какие системы придется сделать для синхронизации текущих источников данных. Тем временем вышел opus4.5, я смог достаточно качественно «кодить» в перерывах между звонками по 5-10 минут. Моя самописная система разрасталась и уже покрывала несколько важных процессов. Затем прошел этап внедрения. Часть администраторов проектов стали работать в моей системе. Постепенно к созданию системы подключились и другие разработчики. За несколько месяцев довели продукт до продакшн-уровня, заместили часть текущих систем, выработали подходы к работе и документации для еще более быстрой разработки. Даже дали менеджерам делать простые инструменты (не затрагивающие кор-функционал) под себя самостоятельно через согласование спецификаций. Это дало кратный буст и уже значительно сказалось на бизнесе: от прямой экономии ФОТ (проще всего посчитать в экономике) до онлайн-мониторинга показателей и сокращения времени принятия управленческих решений. Всего за несколько месяцев я увидел, как капитализировалась большая часть нашего опыта, данных, процессов, живущая до этого в головах, документах и разрозненных системах. Более того, благодаря подключению «нетехнарей» получилось сократить цикл создания ценности в продукте: бизнес-пользователи лучше всего знают свои процессы и теперь они могут не рассказывать аналитикам, а что же нужно сделать, чтобы те написали ТЗ, передали в разработку и т.д. Теперь они сами часто пишут ТЗ, согласуют его и реализуют нужный им функционал. (Для скептиков: не пугайтесь, есть гардрейлы и централизованная архитектура, а эффект от распараллеливания кратно превосходит риски). Раньше это было невозможно в принципе. Сейчас, при правильной подготовке, это дает намного больший синергичный эффект для бизнеса, чем классическая лоскутная автоматизация из кучи коробочных решений. Видимо, нас ждёт новая эра расцвета кастомной автоматизации, где даже небольшие компании смогут делать ПО под свои процессы, тогда как раньше даже не подумали бы об этом. #сергей_чернобровкин

4 211

AI-платформа для закрытого контура: агенты, данные, LLM — в одном стеке Каждая AI-инициатива в enterprise вызывает одни и те же задачи: где взять модель, как её безопасно вызвать, подключить корпоративные данные и развернуть агента в продакшене. Новые AI-решения требует отдельной инфраструктуры и контроля качества, безопасности и бюджета. В результате запуск пилотов растягивается на несколько месяцев. Для быстрой сборки агентов в закрытом контуре мы разработали решение — AI Platform. Это три платформы в одном стеке, которые работают самостоятельно и предоставляют API соседним слоям. Агентская платформа. Обеспечивает быстрый деплой нового агента по коммиту из GitLab CI. Доступны мультиагентная оркестрация, точки подтверждения оператора, трассировка всей цепочки: промпты, инструменты, стоимость, латентность по каждому шагу. Платформа данных. Превращает корпоративные документы в инструменты для агентов: классический RAG, графовый поиск для многосвязанных данных, табличный доступ через MCP без галлюцинирования чисел. При каждом запросе AI-агент видит только те данные, которые доступны конкретному пользователю. LLM-платформа. Единый OpenAI-совместимый шлюз для on-premise моделей, российских облаков и внешних SOTA. Входит в реестр российского ПО и соответствует 152-ФЗ. Есть учёт расходов в реальном времени, разделение GPU-ресурсов между несколькими LLM на одной карте, наблюдаемость и аудит требований безопасности. С помощью AI Platform компании быстро тестируют гипотезы и сокращают затраты: агенты разворачиваются на одной инфраструктуре, и маржинальная стоимость каждого снижается с новой итерацией. Подробнее о том, как работает платформа, рассказали на сайте

4 211

Repost from Программисты делают бизнес

От RAG до агентов: что бизнес ждет от AI? В подкасте «Большой разговор про AI» Александр Опрышко, сооснователь KTS, рассказал, как AI уже меняет разработку и digital-рынок: от оцифровки базы знаний к агентам конкретных действий, от отдельных ассистентов к AI-центричному подходу в SDLC. Обсудили: ▫️почему компании так активно смотрят в сторону RAG, ассистентов проектировщиков и аналитики? ▫️как бизнес оценивает эффективность AI-проектов? ▫️почему многие хотят on-premise решения? ▫️куда перестраивается рынок? ▫️какой тренд показывает наш кейс ассистента Альфа-Банка с ROI 6 месяцев? 🔴 Посмотреть выпуск

4 211

Продолжаем вместе с вами улучшать Agent Platform Ценим обратную связь и стараемся оперативно добавлять функции по вашим пожеланиям на платформу. Один из частых запросов — детализация расходов и запросов. ▪️ Мониторинг активности: просматривайте расход токенов и количество запросов по разным параметрам — модели, времени и ключам. В личном кабинете доступна история списаний и пополнений, чтобы вам было удобнее контролировать расходы. ▪️ LLM-логи: смотрите историю запросов за последние 30 дней — без содержимого промптов и ответов. Вы увидите, какая модель использовалась, статус запроса и его стоимость. Обновление открывает возможность добавлять новых топовых провайдеров LLM, а также модели для изображений и видео. Пишите, каких ещё функций вам не хватает — обязательно учтём пожелания в будущих релизах.

4 211

Как я нахожу инсайты и отслеживаю личный прогресс с помощью скиллов в Claude Каждый день я работаю в Claude Code с разными задачами: бизнес- и продуктовые исследования, настройка агентов, проверка новых идей. В процессе столкнулся с двумя проблемами: 1) При параллельной работе в нескольких окнах с включённым auto-mode часть решений проходит мимо — можно пропустить интересные и полезные инсайты в выборе тактики. 2) Когда фоном ведёшь несколько задач, иногда в порыве теряешь фокус. При этом хочется фиксировать, что ежедневная работа действительно ведёт к поставленным целям. Чтобы закрыть эти боли, я настроил скиллы /insight и /progress. /insight. В конце сессии смотрит, было ли в ней то, что стоит запомнить. Если да — пишет короткую запись в журнал (.md) в фиксированном формате. Если нет — молчит. Встроил фильтр по критериям интересного, адаптировал под свою роль (например, исключил решения про кодинг — для меня они мало применимы) и установил запрет выдумывать инсайты в рутинный день. /progress. Запускается ежедневно, читает все сессии Claude Code, сжимает их и прогоняет через агента. Тот выбирает факты: над какими проектами шла работа, что решили, какие коммиты сделаны. Затем сверяет с указанными целями (.md) и фиксирует, где есть движение, а где нет. Раз в неделю вижу полную картину через призму работы в Claude Code: где продвинулся, что запустил, какие инсайты нашёл. Получается такая внутренняя ретроспектива. #иван_лавров

4 211

ИИ застрял в «одиночном режиме» За неделю несколько ведущих ресерчеров независимо высказались об одном: следующий рубеж развития ИИ — не интеллект, а интерактивность. Не «насколько умна модель», а «насколько хорошо она работает вместе с человеком». В чём проблема: сегодня модели воспринимают реальность одним потоком. Пока не дописали запрос — LLM ждёт и не видит, что вы делаете. Это узкий канал: до модели доходит лишь часть вашего знания, намерения и оценки. Thinking Machines сравнивает текущий формат взаимодействия с попыткой решить важный спор по почте вместо личной встречи. Они вводят новую концепцию — interaction models. Ключевая идея: интерактивность не «обвязка» вокруг модели, а часть самой архитектуры. Сегодня системы имитируют перебивания и многоканальность через harness (внешнюю «обвязку» — готовые компоненты, склеенные вокруг модели) и VAD (voice activity detection — отдельный модуль, который определяет, говорит человек или молчит) для распознавания границ реплик. Аргумент от Bitter Lesson: рукотворные надстройки проиграют общим масштабируемым методам. Если интерактивность встроена в модель — масштабирование одновременно делает её умнее и улучшает качество взаимодействия с человеком. Гонка за «интеллектом» упёрлась в то, как этот интеллект передать человеку и принять обратно правки. #александр_опрышко #развитие_ИИ

4 211

RAG-платформа для 12 000 операторов Альфа-Банка: ускорили поиск данных в 20 раз Раньше операторы контакт-центра вручную искали информацию в базе знаний, чтобы ответить клиенту. На обработку одного запроса в среднем уходило 5 минут. Чтобы ускорить работу операторов, Альфа-Банк решил внедрить RAG-платформу. За помощью обратились к команде KTS. За 4 месяца мы вместе вывели проект в production и настроили систему так, чтобы данные всегда были актуальны, и каждый оператор получал ответ с учётом его уровня доступа. Платформу развернули внутри контура банка и запустили на двух GPU H100. Это позволило уложиться в экономику проекта и при этом обеспечить запас по производительности. В результате RAG-платформа ускорила и упростила работу операторов: ▪️ среднее время обработки запроса уменьшилось на 40 секунд: с 5 минут до 4 минут 20 секунд ▪️ поиск данных стал в 20 раз быстрее: 3 секунды вместо 60 93% операторов положительно оценили работу платформы, и решение масштабировали на всех сотрудников Альфа-Банка. Сегодня система обрабатывает 85 000 запросов в сутки. Больше деталей про настройку и работу RAG-системы показали в кейсе

4 211

Repost from Программисты делают бизнес

Вы всё ещё переплачиваете за инфраструктуру? Тогда мы идём к вам. Расходы на облако часто растут незаметно. Тестовые среды работают ночью и в выходные. Неиспользуемые ресурсы продолжают списывать деньги. У команд нет общего правила, кто следит за потреблением и где проходит граница между «нужно» и «просто осталось включенным». В итоге счета растут, а ясности, за что платит бизнес, становится меньше. Мы поможем найти, где инфраструктура расходует лишнее, и сократить затраты без риска для продукта и команды. Что делаем: — проводим аудит расходов на облако; — оптимизируем инфраструктуру; — настраиваем мониторинг потребления и уведомления; — выделяем центры затрат; — прогнозируем бюджет; — считаем TCO и ROI. Если есть ощущение, что можно сэкономить на инфраструктуре, начните с бесплатного аудита. За 5 рабочих дней покажем, где вы теряете деньги. Сначала доведем до результата и только потом возьмем оплату. Гонорар KTS = подтвержденная экономия за 6 месяцев.

4 211

Знаем, как найти лишние расходы на инфраструктуру и сократить их без риска ↗️