ideasAI / Идеи для ИИ - Анисимов Андрей
前往频道在 Telegram
Андрей Анисимов Идеи для искусственного интеллекта Канал про Data Science, ML/AI и карьеру в сфере анализа данных AI BP в Альфа Банке, Согаз, ГПБ, Сбер, ВТБ SKOLKOVO MBA15 Бег 1x42.2, 3х21.1 Пишите @aaanisimovvv
显示更多2 111
订阅者
-324 小时
-437 天
-68130 天
帖子存档
Рынок AI-сервисов для пользователей меняется
Главная проблема последних двух лет была не в самих нейросетях. ChatGPT, Claude, Midjourney, Runway, Suno и десятки других инструментов уже давно умеют делать удивительные вещи.
Проблема - в доступе.
VPN отваливается. Карта не проходит. Где-то нужен иностранный номер. Где-то интерфейс только на английском. Где-то подписка стоит как крыло от самолета.
В итоге вместо работы с ИИ люди занимались настройкой ИИ.
Недавно посмотрел на платформу Umnik AI.
Вместо того чтобы покупать доступ к каждой нейросети отдельно, пользователь получает доступ сразу к 160+ инструментам в одном месте. ChatGPT, Claude, генерация изображений, видео, музыки, работа с текстами, аналитика — всё внутри одной платформы.
Особенно интересно это выглядит для тех, кто использует ИИ не как хобби, а как рабочий инструмент.
Студенты могут делать конспекты и готовиться к экзаменам. Маркетологи - генерировать креативы и рекламные тексты. Предприниматели - готовить презентации, коммерческие предложения и анализировать документы. Контент-мейкеры - писать сценарии, делать обложки и искать идеи для новых публикацийМы уже привыкли обсуждать, какая модель лучше: ChatGPT, Claude, Gemini или что-то ещё. Но для большинства пользователей гораздо важнее другой вопрос: «Как быстро я могу решить свою задачу?» А вы сегодня пользуетесь одной нейросетью или уже собираете собственный AI-стек из нескольких инструментов?
Repost from Немалый бизнес
— Мы внедрили ИИ во все процессы! Теперь мы официально технологическая компания. — Круто. А прибыль выросла? — Ну... пока не очень. Зато нейросеть вчера написала хокку про наш отдел продаж. — Понятно.Пока одни хвастаются хокку, другие считают деньги. Изучили прогноз «Рейтинга Рунета» на 2026–2027 годы 🔮 В карточках — ответы на вопросы, почему инвесторы больше не верят разработчикам на слово, как беспорядок в данных тормозит технологии и где нейронки окупаются быстрее всего. Листайте и планируйте стратегию без розовых очков 😎 @aaaa_business
🍏 Apple и ИИ: почему даже $3 трлн не гарантируют победу
После презентации Siri AI акции Apple за несколько часов просели примерно на 1,6%. Для компании такого масштаба это десятки миллиардов долларов капитализации.
Но рынок отреагировал не на сам релиз. Рынок отреагировал на отсутствие внятной AI-стратегии.
1️⃣ Нет единого владельца продукта
По сообщениям инсайдеров, внутри Apple Siri давно стала «горячей картошкой», которую передают между командами.
2️⃣ Компания оптимизирована под другой цикл
Apple десятилетиями строила процессы вокруг железа:
• большие ежегодные релизы
• долгие циклы тестирования
• высокий уровень секретности
• почти идеальное качество на запуске
Для смартфонов это работает прекрасно.
Для ИИ — наоборот.
Сегодня лидируют компании, которые выпускают продукт быстро, собирают обратную связь и улучшают его каждую неделю.
3️⃣ “It just works” может стать проблемой
Главное обещание Apple — качество.
Но современные AI-продукты по своей природе несовершенны.
OpenAI, Anthropic, Google выпускают модели, получают обратную связь от миллионов пользователей и постоянно дообучают систему.
Apple психологически намного сложнее выпустить продукт, который работает на 80%.
А именно так сегодня развивается весь рынок генеративного ИИ. Побеждают компании, которые умеют быстро учиться
Обсуждение в чате -
https://t.me/+IO8oYWP3rblkMWJi
Телеграм канал
Андрей Анисимов
@ideasforai
🎓 Где детям изучать ИИ офлайн? Подборка летних школ и интенсивов в Москве
Пока многие обсуждают, заменит ли ИИ программистов, школьники уже учатся создавать собственных AI-агентов, обучать модели и делать проекты на базе нейросетей.
Собрал несколько сильных очных программ.
📍 One! International School × СберУниверситет
В прошлом году школа One! проводила летний AI-интенсив на площадке СберУниверситета. Я приезжал на кампус, помогал ребятам с генеративным ИИ. Они создавали собственные проекты и знакомились с технологиями будущего.
🔗 https://t.me/oneschoolnews
⸻
📍 Сколково для школьников
Школа управления СКОЛКОВО регулярно проводит образовательные программы, интенсивы и проектные школы для подростков по технологическому предпринимательству, цифровым продуктам и искусственному интеллекту.
🔗 https://t.me/skolkovo_channel
⸻
📍 Летняя школа программирования и ИИ от Центрального университета
Одна из самых сильных программ последних лет. В программе — Python, машинное обучение, работа с данными, создание собственных AI-проектов и встречи с практиками индустрии.
🔗 https://centraluniversity.ru
⸻
📍 Школа анализа данных Яндекса (ШАД) — программы для старшеклассников
Яндекс регулярно запускает очные образовательные инициативы и интенсивы по ML, анализу данных и разработке для школьников.
🔗 https://academy.yandex.ru
⸻
📍 Летние смены Академии искусственного интеллекта для школьников
Проект поддерживается Сбером и партнерами. Участники изучают машинное обучение, компьютерное зрение, NLP и готовят проекты для соревнований.
🔗 https://ai-academy.ru
⸻
📍 Иннополис. Летние школы по ИИ и робототехнике
Хотя площадка находится не в Москве, многие школьники из столицы ездят именно сюда. Сильная программа по AI, программированию, робототехнике и инженерным проектам. Очно в Иннополисе
🔗 https://dovuz.innopolis.university
⸻
📍 Кружковое движение НТИ
Регулярно проводит проектные школы и интенсивы по искусственному интеллекту, беспилотникам, робототехнике и анализу данных.
🔗 https://kruzhok.org
⸻
Что особенно интересно — еще 3–5 лет назад детские курсы по ИИ были редкостью. Сегодня ребенок может познакомиться с генеративными моделями раньше, чем с классическим программированием.
Если знаете хорошие очные программы по ИИ для детей или уже были на этих программах - делитесь в комментариях. Соберем самый полный список)
Обсуждение в чате -
https://t.me/+IO8oYWP3rblkMWJi
Телеграм канал
Андрей Анисимов
@ideasforai
📄 Вышел whitepaper AI-Disrupt PDLC — попытка описать, как будет выглядеть разработка программного обеспечения в эпоху агентного ИИ
Самая интересная мысль документа — дело уже давно не в выборе модели.
Пока рынок спорит, кто лучше — OpenAI, Anthropic, Gemini или open-source, авторы предлагают смотреть на другое: конкурентным преимуществом становится среда вокруг моделей, корпоративный контекст и процессы работы агентов.
Как пишут в исследовании: «В эпоху стремительной смены поколений нейросетей главным активом становится не сама модель, а детерминированная инфраструктура вокруг неё»Фактически это переход от подхода «AI как инструмент» к подходу «AI как новая операционная система компании». В документе есть несколько сильных идей: 🔺 Намерение становится важнее кода. Человек формулирует цель и проверяет результат, а реализацию всё чаще выполняют агенты. 🔺 Компании, которые просто внедрят Copilot, получат локальное улучшение производительности. Компании, которые перестроят весь жизненный цикл разработки вокруг ИИ, смогут получить кратный эффект. 🔺 Основным активом становится не модель, а корпоративный контекст: данные, правила, накопленные решения и механизмы их доставки агентам (Context Engineering). 🔺 Появляется новая роль Product Engineer — специалиста, который находится между бизнесом и разработкой и управляет намерением, а не написанием кода. Особенно понравился тезис о том, что сегодня многие пытаются автоматизировать старые процессы новыми инструментами. Но настоящий эффект возникает только тогда, когда сам процесс перепроектируется под возможности ИИ. Очень похоже на то, как когда-то компании сначала переносили бумажные формы в электронный вид, а потом полностью меняли бизнес-процессы. Похоже, что с агентным ИИ нас ждёт тот же путь. Обсуждение в чате - https://t.me/+IO8oYWP3rblkMWJi Телеграм канал Андрей Анисимов @ideasforai
Однажды я выиграл грант на образование
И начал смотреть, куда вообще можно пойти учиться.
Но чем больше смотрел на классическое бизнес-образование в России - тем меньше хотелось туда идти. Все казалось слишком правильным, слишком академичным и каким-то… предсказуемым.
В какой-то момент я даже всерьез рассматривал обучение на пилота вертолета. Просто потому что хотелось чего-то настоящего. Чего-то, от чего снова появится ощущение интереса и движения вперед.
А потом я узнал про конкурс грантов в СКОЛКОВО.
И как-то все сложилось.
В том числе и финансово - благодаря двум грантам удалось покрыть больше половины стоимости обучения.
Уже на учебе я понял, что давно не делал ничего, от чего у меня горят глаза.
Наверное, именно поэтому я пошел на MBA в СКОЛКОВО.
Не за дипломом.
Не за статусом.
А потому что мне хотелось снова оказаться среди людей, которые мыслят очень широко. Людей, после разговоров с которыми начинаешь чувствовать - мир сильно больше.
Сейчас в СКОЛКОВО открыт конкурс грантов на MBA, гранты - до 5,1 млн рублей. Их правда можно выиграть!
Иногда взрослым людям тоже нужны места, где у них снова появляется ощущение будущего. Которое может повернуться в неожиданную сторону, например, как у меня - «заразиться» от одногруппников и пробежать марафон 42 км (конечно, с подготовкой) 🔥
Узнавайте все подробности у @Baha_SKOLKOVO или по ссылке https://clck.ru/3Tsj78
И задавайте вопросы про MBA в комментариях)
🔥 Together AI — один из самых быстрорастущих AI-инфраструктурных стартапов мира
Компания строит «AWS для open-source AI»:
inference API, GPU cloud, fine-tuning, hosting моделей, distributed trainingОснована в 2022 году очень сильной командой: Ce Zhang — профессор ETH Zurich и создатель ML-систем Petuum, Vipul Ved Prakash — ранее продал стартап Topsy компании Apple, Percy Liang — основатель Stanford CRFM и один из главных исследователей foundation models. 📈 Рост компании выглядит очень агрессивно: • 2024 → оценка ~$1.25B • 2025 → $305M инвестиций при valuation $3.3B • 2026 → обсуждается новый раунд ~$1B при оценке ~$7.5B. Инвесторы: NVIDIA, Salesforce Ventures, Coatue, Kleiner Perkins и другие. Главная ставка Together AI — не обучение моделей, а inference и оптимизация AI-вычислений.
На сайте компания прямо заявляет: ⚡ 2x faster inference 💰 до 60% lower cost 🚀 до 90% faster pre-trainingПричем речь уже не просто про «хостинг моделей». Together AI активно развивает такие подходы, как: - квантизация, - спекулятивное декодирование, - работа с GPU ядрами, - снижение задержки в ответах, - распределенный запуск Поддерживаются: Llama, DeepSeek, Qwen, Mistral, Kimi и другие open-source модели. Среди клиентов уже: Cursor, Decagon, Cartesia, enterprise AI-команды и voice AI-стартапы. Очень похоже, что рынок постепенно смещается: не к «самой умной модели», а к компаниям, которые строят AI operating infrastructure для всей индустрии. Обсуждение в чате - https://t.me/+IO8oYWP3rblkMWJi Телеграм канал Андрей Анисимов @ideasforai
И ещё, ищу к себе на стажировку - нужно понимать основные ML-модели, уметь в агентский кодинг и плюсом будет, если уже есть примеры разработанных ИИ-агентов. Студенты 3-4 курса или выпускники, фул тайм
🤖 Prompt Engineering умер? Не совсем. Он просто превратился в инженерную дисциплину.
Наткнулся на очень сильный цикл Google по prompt engineering, который перевели на Habr. И это уже совсем не про «напиши промпт как эксперт»
Самое интересное — Google фактически описывает промптинг как программирование: — reusable blocks — decomposition — reasoning chains — structured promptingТо есть промпт постепенно становится не текстом, а логикой выполнения задачи. 🔥 Но главный инсайт даже не в этом. LLM лучше работают не от одного гигантского промпта, а от последовательности специализированных шагов. По сути - не “один супер-запрос”, а orchestration reasoning
И это уже очень похоже на то, как сегодня строятся AI-агенты: - planner - researcher - coder - reviewer - memory/context layerПолучается, prompt engineering становится частью более крупной системы: ➡️ context engineering ➡️ memory engineering ➡️ tool orchestration ➡️ multi-agent systems Еще один неожиданный момент из исследований — модели уже умеют писать промпты для других моделей. То есть prompt engineer постепенно начинает автоматизироваться самим AI 😅 И отдельно интересно, что Google в своих рекомендациях делает огромный акцент на few-shot и chain-of-thought. Хотя многие пользователи до сих пор используют ChatGPT как “однострочный поиск”. А ведь CoT-подход фактически заставляет модель строить внутренний reasoning pipeline Обсуждение и ссылки в чате - https://t.me/+IO8oYWP3rblkMWJi Телеграм канал Андрей Анисимов @ideasforai
💊 AI масштабирование - кто больше?
Похоже, мы очень быстро идем к миру, где подписка на LLM становится такой же базовой корпоративной инфраструктурой, как Microsoft Office или VPN.
На этой неделе стало известно, что фарм компания Bristol Myers Squibb развернет Claude от Anthropic сразу на 30 000 сотрудников. Использование — research, clinical development, regulatory reports, internal AI agents и даже AI-ускорение разработки ПО.
И это уже не “поиграться с чатиком”.
Фарм-компании — один из самых сложных enterprise-сегментов: — огромный объем данных — жесткая регуляторика — длинные циклы разработки — дорогая ошибка Если там начинают массово внедрять AI-ассистентов — значит рынок реально дошел до стадии production.Самое интересное — Anthropic прямо говорит, что цель не “помочь написать текст”, а встроиться end-to-end во все процессы life science компании. ИИ масштабирование - это уже глобальный тренд. На днях Мальта 🇲🇹 стала первой страной, которая дает всем жителям бесплатный доступ к ChatGPT Plus на год после прохождения AI-курса. OpenAI фактически тестирует модель “AI как общественная инфраструктура”. А теперь посмотрите на компании: — PwC обучает 30 000 сотрудников работе с Claude Code и масштабирует AI по всей организации. — Accenture раскатывает Microsoft Copilot на 743 000 сотрудников — это крупнейшее enterprise-внедрение AI-ассистента на сегодня. — Moderna ранее интегрировала ChatGPT Enterprise практически во всю компанию для research и автоматизации процессов. — Банки массово переходят на внутренние LLM-контуры и AI-агентов для аналитики, комплаенса и разработки. Есть ли массовый доступ к лучшим GPT в вашей компании? Обсуждение в чате - https://t.me/+IO8oYWP3rblkMWJi Телеграм канал Андрей Анисимов @ideasforai
Google I/O — кажется, Google решил включить режим “full AGI corporation” 🚀
После презентации ощущение, что компания одновременно:
— давит скоростью моделей,
— строит инфраструктуру AI-агентов,
— и готовит экосистему, где AI работает постоянно, а не только “по запросу”.
Несколько вещей, которые зацепили 👇
1️⃣ Gemini 3.5 Flash
Похоже, это одна из самых важных моделей года.
Google заявляет, что 3.5 Flash:
— обходит Gemini 3.1 Pro по ряду coding/agentic benchmark’ов,
— быстрее конкурентов примерно в 4 раза,
— и при этом стоит заметно дешевле топовых моделей
На сцене показывали почти 300 токенов/сек, а в отдельных демо — до ~1500 токенов/сек 🤯
Кажется, мы всё ближе к генерации/персонификации сайтов «на лету»Очень важный сигнал: frontier-модели постепенно становятся “commodity layer”. Конкуренция теперь идет не только за IQ модели, а за: — latency, — стоимость inference, — качество оркестрации, — экосистемность 2️⃣ Gemini Omni Google прямо пишет: “generate anything from anything”. Текст / картинки / голос / видео → видео (и в обратную сторону) Причем Omni — это уже не просто “video diffusion”. Они отдельно анализируют: — физику, — гравитацию, — динамику, — real-world understanding По сути Google двигается в сторону world models. И это очень похоже на следующий большой этап AI: не генерация кадров, а моделирование мира. Особенно интересно, что Omni Flash сразу интегрируют: — в Gemini, — YouTube Shorts, — YouTube Create Google снова использует главное оружие: дистрибуцию. 3️⃣ Antigravity 2.0 Все обсуждают модели. Но Google параллельно строит инфраструктуру AI-разработки нового поколения.
Antigravity 2.0: — multi-agent orchestration, — subagents, — hooks, — async tasks, — voice control, — SDK, — CLI, — desktop app под agent workflowsНа сцене показали, как система: — за <12 часов, — с помощью 96 агентов, — и бюджета < $1000 собрала рабочую ОС с Doom 😳 И это очень хорошо бьется с тем, что мы видим последние месяцы: рынок постепенно переходит от “vibe coding” → к “agent coding”. 4️⃣ Gemini Spark А вот это может оказаться самым важным consumer-анонсом. Google фактически делает always-on AI agent: агент работает даже когда ноутбук закрыт. Spark: — читает Gmail, — смотрит Calendar, — работает с задачами, — взаимодействует с внешними сервисами, — и сам выполняет действия То есть AI постепенно превращается: не в “чат”, а в постоянный execution слой. 5️⃣ Еще несколько важных сигналов — Gemini уже ~900 млн MAU по данным Google — поиск получил “самое большое AI-обновление за 25 лет” (и окошко стало больше) — Gemini App теперь больше похож на mini-app platform, чем на чат;
И Google сейчас выглядит одним из самых агрессивных игроковОбсуждение в чате - https://t.me/+IO8oYWP3rblkMWJi Телеграм канал Андрей Анисимов @ideasforai
Кто реально зарабатывает на AI-чипах
Полупроводниковая индустрия — это уже не просто «производство чипов». Это огромная вертикально интегрированная цепочка создания стоимости, где каждая компания контролирует свой критически важный участок. И самое интересное — маржинальность и влияние распределены крайне неравномерно.
На вершине — дизайн и архитектура чипов. Именно здесь сосредоточена большая часть интеллектуальной собственности и прибыли. NVIDIA сегодня контролирует рынок AI-ускорителей, AMD усиливает позиции в CPU и GPU, Qualcomm доминирует в мобильных SoC, Broadcom — в сетевых и инфраструктурных решениях. Marvell активно растет в датацентрах и AI networking, а Apple вообще построила собственную вертикаль, разрабатывая чипы под свои устройства.
Дальше начинается фабрикация — одна из самых капиталоемких отраслей в мире. Построить современную фабрику стоит десятки миллиардов долларов. Intel пытается вернуть себе лидерство в производстве, а TSMC фактически стала «невидимым фундаментом» мировой IT-индустрии. Без TSMC сегодня не существовало бы половины современных AI-компаний и устройств.
Но фабрики сами по себе бесполезны без производителей оборудования. Именно поэтому Applied Materials, Lam Research, KLA и Teradyne — это тихие гиганты индустрии. Applied Materials поставляет оборудование для нанесения материалов, Lam Research — для травления, KLA отвечает за контроль качества и метрологию, а Teradyne — за тестирование. Без этих компаний невозможно выпускать современные техпроцессы 3 нм и ниже.
Еще глубже — химия и материалы. Dow и DuPont обеспечивают индустрию специализированной химией и фоторезистами. Entegris поставляет сверхчистые материалы и газы, а Corning производит высокоточные стеклянные и кремниевые компоненты. На этом уровне любая микроскопическая ошибка уничтожает выход годных чипов.
После этого идет advanced packaging — новый центр борьбы в AI. Раньше упаковка считалась «неинтересным» этапом, а теперь именно она определяет возможность собирать гигантские AI-чипы и HBM-память в единый вычислительный модуль. Здесь критически важны Amkor и сам Intel, который активно инвестирует в передовые методы упаковки.
Отдельный слой — тестирование и контроль. Teradyne и Keysight Technologies делают системы, которые проверяют чипы на работоспособность, стабильность и соответствие характеристикам. Чем сложнее AI-чип, тем дороже и важнее становится тестирование.
И наконец память. Micron остается одним из ключевых производителей DRAM и NAND, а Intel продолжает играть роль в экосистеме памяти и серверных решений. В эпоху AI именно память становится одним из главных ограничений для масштабирования моделей.
Самое интересное — деньги в этой цепочке текут не так, как думают многие. Наибольшая ценность часто создается не на заводах, а в архитектуре, IP, оборудовании и software ecosystem вокруг чипов. Именно поэтому NVIDIA сегодня стоит дороже большинства традиционных производителей полупроводников вместе взятых.
AI сделал полупроводники новой нефтью XXI века. И сейчас идет глобальная гонка не только за моделями, но и за контролем над всей цепочкой: от химии и литографии до упаковки и памяти.
Обсуждение в чате -
https://t.me/+IO8oYWP3rblkMWJi
Телеграм канал
Андрей Анисимов
@ideasforai
🤯 Дайджест задач, которые раньше считались «нерешаемыми», а теперь их начал закрывать AI
Еще 3–5 лет назад многие говорили: «LLM - это просто болталка».
Но сейчас AI постепенно заходит в области, где десятилетиями буксовали лучшие ученые мира.
Что уже произошло:
🧬 AlphaFold решил проблему предсказания структуры белков — одну из главных задач биологии последних 50 лет.
Раньше на определение структуры одного белка могли уходить годы лабораторной работы. Теперь AI предсказывает миллионы структур за часы.
📐 DeepMind AlphaGeometry начал решать олимпиадные геометрические задачи на уровне золотых медалистов IMO.
⚛️ DeepMind GNoME сгенерировал сотни тысяч потенциально стабильных новых материалов — для батарей, энергетики и новых типов электроники.
🏭 AlphaEvolve начал находить новые алгоритмы лучше человеческих — включая оптимизацию scheduling в дата-центрах Google.
А теперь самое интересное — математика Эрдёша.
В 2025–2026 AI начал закрывать открытые задачи из списка Paul Erdős — легендарного математика, оставившего более 1000 нерешённых проблем.
Два свежих примера:
🧮 Erdős Problem #728
AI-система на базе GPT-5.2 + Aristotle смогла полностью автономно доказать задачу про факториальную делимость и логарифмические разрывы.
Решение было формально проверено через Lean, а Терренс Тао подтвердил корректность результата. Это называют первым «полностью AI-решенным» Erdős problem. (arXiv)
🧠 Erdős Problem #397
GPT-5.2 смог найти оригинальное опровержение старой гипотезы про биномиальные коэффициенты — не через поиск статьи, а через новый вывод.
После формальной проверки доказательство также подтвердил Терренс Тао. (Delante)
И отдельно впечатляет история с Erdős primitive set problem — задачей, открытой с 1960-х.
ChatGPT-5.4 помог найти новое применение старой математической идеи, которое десятилетиями никто не замечал. (Forbes)
Самое важное — не только то, что AI получил правильный ответ, а как именно он это сделал. С 1935 года все математики атаковали задачу одинаковым способом: переводили проблему из мира целых чисел в мир непрерывного анализа. Этот подход считался настолько естественным, что никто даже не пытался искать альтернативу. GPT-5.4 пошел другим путем. Вместо перехода к анализу модель осталась внутри арифметики и неожиданно использовала функцию фон Мангольдта — классический инструмент теории чисел, связанный с простыми числами и дзета-функцией Римана. Именно это позволило обойти аналитические сложности, которые десятилетиями блокировали исследователей. Математик Джаред Лихтман сравнил это с шахматами: «AI нашел дебют, который люди просто игнорировали». Он также сослался на идею Paul Erdős о «Proofs from The Book» — идеальных красивых доказательствах, которые будто записаны в некой божественной книге математики. По его словам, доказательство GPT-5.4 выглядело именно такПричем главный сдвиг даже не в том, что AI «умеет считать». Он начинает: — генерировать гипотезы — искать неожиданные связи — предлагать конструкции — автоматизировать доказательства — проектировать алгоритмы — создавать материалы — строить world models для физического мира Фактически появляются первые «машины научного открытия». И кажется, это только начало. Обсуждение в чате - https://t.me/+IO8oYWP3rblkMWJi Телеграм канал Андрей Анисимов @ideasforai
+1
🚀 Векторные базы данных стали одной из ключевых технологий эпохи LLM и RAG-систем
Пока одни обсуждают модели, настоящая битва часто происходит на уровне инфраструктуры: где хранить эмбеддинги, как быстро искать похожие документы и как масштабировать поиск на миллиарды векторов.
Появилось большое количество зрелых решений со своей философией, архитектурой и сильными сторонами. И что интересно — универсального победителя здесь нет. Выбор зависит от того, строите ли вы быстрый MVP, enterprise-платформу, AI search или полностью self-hosted инфраструктуру.
Pinecone долгое время был практически стандартом для старта. Главная идея — developer experience. Ты просто подключаешь SDK и через несколько минут у тебя уже работает semantic search. Без DevOps, Kubernetes и настройки индексов вручную. За это Pinecone любят стартапы и команды, которым важно быстро выйти в production. Но за удобство приходится платить: закрытая экосистема, зависимость от облака и достаточно высокая стоимость на больших объемах. Weaviate пошел другим путем. Это open source-платформа с акцентом на гибкость и AI-native архитектуру. Помимо обычного vector search, там сильный hybrid search, удобная схема данных и встроенные модули для ML-задач. По ощущениям, Weaviate — это попытка построить не просто vector DB, а полноценную платформу для AI-приложений. Особенно хорошо он смотрится в RAG-сценариях, где нужны фильтрация, метаданные и сложная работа с контекстом. Milvus — уже история про масштаб и heavy-duty workloads. Это одна из самых мощных open source vector DB для больших объемов данных и высокой нагрузки. У Milvus сильная распределенная архитектура, поддержка разных типов индексов и ориентация на enterprise-сценарии. Но вместе с мощностью приходит и сложность: это уже не «поднял за вечер». Milvus чаще выбирают компании, где AI-инфраструктура становится отдельным направлением, а не просто дополнительной функцией продукта. Qdrant очень быстро набрал популярность благодаря балансу между производительностью и простотой. Многие команды отмечают, что Qdrant ощущается «инженерно приятным»: понятный API, хорошая документация, быстрый старт и при этом достойная производительность. Плюс у них сильный акцент на payload filtering и hybrid search, что критично для реальных RAG-систем. Не случайно Qdrant часто появляется в AI-стартапах и современных agentic AI проектах. Redis Vector — отдельная интересная категория. Это не классическая vector DB, а расширение экосистемы Redis. И именно в этом его сила. Если у вас уже Redis используется как core infrastructure-компонент, добавление vector search становится почти естественным шагом. Особенно для realtime-сценариев, recommendation systems и AI-функций внутри существующих продуктов. Но как standalone vector platform Redis все же менее специализирован, чем Milvus или Weaviate.Самое важное — vector DB сегодня уже перестала быть просто «хранилищем эмбеддингов». Это фактически операционная система для AI retrieval. От нее зависит latency, качество RAG, стоимость inference и даже то, насколько хорошо агент сможет находить нужный контекст. Именно поэтому сейчас появляется новая архитектурная гонка: hybrid search, multimodal retrieval, distributed memory для AI-агентов и long-term memory systems. И в этой гонке vector DB постепенно становятся таким же базовым слоем AI-инфраструктуры, каким когда-то стали SQL-базы для веба. Картинки в качестве и обсуждение в чате - https://t.me/+IO8oYWP3rblkMWJi Телеграм канал Андрей Анисимов @ideasforai
Как устроены агенты и RAG под капотом
Большинство разработчиков собирают RAG и агентов по туториалам или вместе с агентом, не понимая, как всё работает внутри. Из-за этого сложно дебажить проект, масштабировать его или чинить, когда система начинает вести себя не так, как ожидаешь.
Чтобы разобраться в устройстве, а не просто копировать чужой пайплайн, приходите на онлайн-лекцию от Тимура Фатыхова — инженера, который руководил DL-командой в KoronaPay. Он повторит лекцию, на которой разберёт агентов и RAG изнутри и покажет, как собрать первые рабочие версии в n8n.
На лекции вы узнаете:
— как агенты принимают решения: инструменты, MCP, память
— из каких частей состоит RAG и как улучшить его работу
— как собрать агента и RAG в n8n
— как настроить личного агента на базе Claude Code
🔔 Лекция бесплатная и пройдёт онлайн в четверг, 7 мая, в 18:00 МСК
Регистрируйтесь по ссылке и приходите!
+2
👹 Откуда берутся «гоблины» в ИИ — и при чем здесь эффект бабочки
Недавно OpenAI выпустили текст “Where the goblins came from”, где разбирают странные и иногда почти абсурдные эффекты в поведении моделей. Внутри команды такие аномалии называют «гоблинами» — это не баги в привычном смысле, а поведение, которое никто явно не программировал, но которое всё равно возникает.
Ты просишь одно, а получаешь что-то странно похожее, но с искажениями. Не потому что модель «сломалась», а потому что она обобщает. Иногда слишком креативно - а именно это и закладывалось при обучении. Но почему-то все креативное стало в виде гоблинов, енотов и прочего)
И здесь идеально ложится эффект бабочки. Получается, что небольшое изменение во входе — слово, формулировка, контекст — может радикально поменять результат. Причем непропорционально. То есть система ведет себя как классическая хаотическая модель, где малое воздействие меняет всю траекторию.
Даже на уровне статистики это просачивается: появляются устойчивые, но очень слабые сигналы в языке модели. Они почти незаметны, но измеримы. Это и есть следы тех самых «гоблинов» — не багов, а свойств распределения.
И поэтому главный вывод довольно простой и одновременно неприятный: «гоблины» — это не исключение, а норма. Их нельзя полностью убрать. С ними можно только работать.
Обсуждение в чате -
https://t.me/+IO8oYWP3rblkMWJi
Телеграм канал
Андрей Анисимов
@ideasforai
+5
👋Чем заняться на майских - сделай «таро-прогноз» в AI!
🎲 Кидайте кубик в комментариях и пробуйте новое)
Либо двигайтесь от уровня к уровнюПроблемы с «магией» - пишите в личку @aaanisimovvv Обсуждение в чате - https://t.me/+IO8oYWP3rblkMWJi Телеграм канал Андрей Анисимов @ideasforai
🔬 Как на самом деле мерить AI / RAG системы (часть 2)
В RAG важно разделять, что именно ты измеряешь. Потому что «качество ответа» — это финал, а проблемы могут быть на любом этапе.
Обычно имеет смысл смотреть на три уровня:
— retrieval: нашли ли нужную информацию и не притащили ли лишнего
— generation: насколько ответ точный, опирается ли на контекст и не галлюцинирует ли
— end-to-end: решена ли задача пользователя и доволен ли он результатом
И вот здесь появляется ещё один важный слой — деньги. Потому что можно сделать идеальную систему на топовых моделях, которая будет стоить в 10 раз дороже, чем она приносит.
Если взять среднюю стоимость аренды GPU (около $1.85 в час за A100) и прогнать одинаковое количество тест-кейсов, экономика становится очень наглядной.
Например, за час работы:
— Kimi K2 — ~$41.37
— GLM 5.1 — ~$39.19
— DeepSeek-v3.2 — ~$37.23
— MiniMax M2.7 — ~$21.27
— Qwen3-30B-A3B — ~$9.31
— gpt-oss-120b — ~$7.45
Это означает, что при одинаковом количестве тестов такие модели оказываются дешевле GPT-4 Turbo (для oss версии в 24.2 раза — ~$180 за тот же объём против ~$7.45).
И чем больше у тебя объём evaluation (а в RAG это почти всегда тысячи и десятки тысяч запросов), тем сильнее проявляется эффект масштаба.
Практика показывает:
локальные или self-hosted модели часто проигрывают в качестве на сложных кейсах, но выигрывают в экономике.
👉 Поэтому правильная метрика — это не просто «насколько хорошо», а
«насколько хорошо за свои деньги»
В итоге хороший evaluation — это система, в которой есть:
— свои данные
— сравнение вариантов
— автоматическая оценка
— ручная проверка
— и учёт стоимости
Если этого нет — у тебя не AI-продукт.
У тебя просто удачно подобранный промпт, который пока работает.
⸻
А вы уже собираете свои датасеты для бенчмарков? 👀
Обсуждение в чате:
https://t.me/+IO8oYWP3rblkMWJi
Телеграм канал
Андрей Анисимов
@ideasforai
🔬 Как на самом деле мерить AI / RAG системы (часть 1)
Сегодня у многих команд появляются RAG или агентские системы. Причем многие идут в самостоятельную разработку — кто-то подключил базу знаний, кто-то прикрутил поиск, кто-то уже продаёт промпт как продукт со своим интерфейсом.
Но если задать простой вопрос — «а как вы измеряете качество?» — в ответ чаще всего тишина или что-то вроде «ну, вроде нормально отвечает».
Проблема в том, что без нормального evaluation система не управляется. Ты просто наблюдаешь за её поведением и надеешься, что она не сломается в самый неподходящий момент при обновлении модели. А RAG ломается — тихо, незаметно и часто дорого.
Есть два базовых способа, как вообще можно начать измерять такие системы.
Первый (Pointwise) — это когда ты даёшь модели вопрос, получаешь ответ и просишь другую модель (judge) поставить оценку, например от 1 до 10. Это быстро, дёшево и удобно, особенно на старте. Но проблема в том, что такие оценки очень нестабильны: сегодня 7, завтра 5, послезавтра 8. Модель-судья сама не всегда понимает, что происходит.
Второй способ (Pairwise) — более зрелый. Ты берёшь один и тот же вопрос, генерируешь два ответа (например, от разных моделей или версий пайплайна) и просишь judge выбрать, какой лучше. Это уже ближе к реальности, потому что пользователь тоже не ставит оценки — он выбирает, какой ответ ему больше подходит. Такой подход даёт гораздо более стабильные результаты.
Самое интересное начинается дальше — когда ты понимаешь, что даже judge нельзя слепо доверять. У него есть предвзятости. И вот здесь начинается очень человеческая история.
LLM-судьи ведут себя почти как люди: — они любят длинные ответы, даже если там больше воды, чем смысла (видимо научился на тестах для людей — самый длинный верный 😂) — часто выбирают первый вариант просто потому, что он первый (закон Бенфорда?) — склонны соглашаться с тем стилем и «возрастом», который им ближе (ох уж эти молодые LLM 😄) — могут «подыгрывать себе», если оценивают ответы, похожие на их собственныеПо сути, цифровая копия человеческого мышления — со всеми его багами. Отдельная ловушка — язык. Многие до сих пор меряют системы на английских бенчмарках, а потом удивляются, почему в проде на русском всё работает хуже. В итоге ты оптимизируешь систему под метрику, которая не имеет отношения к реальности. 👉 Продолжение про метрики и деньги — в следующем посте
🚀 Mirai — ИИ, который живёт прямо на устройстве
Пока все обсуждают облака и GPU-кластеры, появляется другой вектор — ИИ прямо на вашем устройстве.
И здесь интересный игрок — Mirai.
🧠 Что это такое
Mirai — платформа для запуска и дообучения LLM прямо на смартфонах и ноутбуках.
Без облака.
Без передачи данных наружу.
С минимальной задержкой.
⚡ Почему это важно
Приватность
Данные не уходят в облако → меньше рисков (особенно для банков, медицины, enterprise)
Latency
Ответы быстрее → критично для real-time сценариев (навигаторы, голосовые ассистенты, интерфейсы)
Экономика
Нет оплаты за токены → снижение cost per request почти до нуля
📊 По бенчмаркам (скрин)
На M1 Ultra:
🚀 Prompt: ~13.9k токенов/с
🚀 Generate: ~551 токен/с
⚡ First token: ~0.10 сек
→ быстрее, чем MLX (встроенный движок apple)
👨💻 Кто делает
Алексей Моисеенков (Prisma, Lensa)
Дмитрий Швец (Reface)
👉 опыт в массовых AI-продуктах, где latency и UX — всё
Почему это большой тренд Сейчас AI = облако + GPU Но стоимость инференса растёт latency — ограничение приватность — боль 👉 следующий шаг — edge / on-device AIЧерез 2–3 года мы будем платить за токены… или просто запускать модели локально? Обсуждение в чате и ссылка на Forbes - https://t.me/+IO8oYWP3rblkMWJi Телеграм канал Андрей Анисимов @ideasforai
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
