en
Feedback
Да придет ИИ: ChatGPT, Claude, Gemini, Grok

Да придет ИИ: ChatGPT, Claude, Gemini, Grok

Open in Telegram
3 750
Subscribers
-624 hours
-307 days
-16130 days
Posts Archive
Claude Fable 5 набирает 1 место в агентном рейтинге arena.ai 🏆 https://arena.ai/leaderboard/agent
Claude Fable 5 набирает 1 место в агентном рейтинге arena.ai 🏆 https://arena.ai/leaderboard/agent

Немного поменялся дизайн arena.ai Теперь на главной странице рейтинг агентов (вместо текстового рейтинга) 1. GPT-5.5 - внезап
Немного поменялся дизайн arena.ai Теперь на главной странице рейтинг агентов (вместо текстового рейтинга) 1. GPT-5.5 - внезапно 2. Opus 4.7 (Опус 4.8 еще не завезли) 7. Sonnet 4.7 8. GLM-5.1 9. Gemini 3.1 Pro 10. Gemini 3.5 Flash 11. Kimi K2.6 12. DeepSeek V4 Pro

В чем рзаница в трех официальных курсах от Антропик по Клоду Кратко: • Клод 101 - для начинающих • Клод Код курс 101 - для пр
В чем рзаница в трех официальных курсах от Антропик по Клоду Кратко: • Клод 101 - для начинающих • Клод Код курс 101 - для программистов • Клод Код в действии - для продолжащих Подробности описаны в таблице. https://claude.com/resources/courses - полный список курсов на англ. языке. И да, русского языка нет. Только инглиш.

Протестировал Ideogram 4 И это как обычно просто прекрасно Промпт: Космонавт Я даже могу прочесть нашивку "Горшков" у него на
Протестировал Ideogram 4 И это как обычно просто прекрасно Промпт: Космонавт Я даже могу прочесть нашивку "Горшков" у него на скафандре. И китайский флаг на заднем фоне вызывает умиление!

Ideogram is back 4.0 Давно уже не было новостей об Идеограм, а мне так нравилась эта модель. И вдруг в июне 2026 - бабах! Они
Ideogram is back 4.0 Давно уже не было новостей об Идеограм, а мне так нравилась эта модель. И вдруг в июне 2026 - бабах! Они выпускают OpenSource модель размером всего 9.3B. Можно скачать и использовать на своем компьютере совершенно бесплатно. Но, лицензия - только для не коммерческого использования. Вы ведь не будете нарушать лицензию из США?

Компания Nous разработавшая агента Hermes выпустили Desktop App Я сам еще не тестировал, но спешу с вами поделиться этой новостью. Для меня это повод попробовать Hermes. https://hermes-agent.nousresearch.com/desktop

Протестировал Gmail плагин в Codex В ChatGPT этот плагин уже давным-давно есть, но я им как-то не пользовался. Оказалось, что
Протестировал Gmail плагин в Codex В ChatGPT этот плагин уже давным-давно есть, но я им как-то не пользовался. Оказалось, что этот же плагин работает еще лучше в Codex! Вы просто общаетесь в чате со своим почтовым ящиком, и когда надо что-то удалить, Codex просто удаляет перености все в корзину не задавая лишних вопросов. О божечки, как же это удобно!

Корпоративный ИИ вышел из-под контроля: почему CFO в панике? А вот вам первый пост сгенерированный Фабрикой Контента (Да, в начале марта начал - к началу лета закончил) Пока все обсуждали пользу нейросетей, бизнес столкнулся с суровой реальностью: модель подписок SaaS умирает, а «оплата за токены» сжигает бюджеты с пугающей скоростью. Вот три главных кейса, которые прямо сейчас меняют правила игры: • Счет на $500 млн за месяц: Анонимный корпоративный клиент рассказал Axios об эпичном провале IT-управления. Компания дала сотрудникам безлимитный доступ к Claude ИИ без жестких лимитов. В итоге начался «токенмайнинг»: сотрудники ради фана накручивали внутренние метрики активности ИИ (вплоть до проверки погоды через тяжелые модели), а автономные агенты ушли в бесконечные циклы вызовов, раздув API-запросы в тысячи раз. Подробности на Tom Hardware. • Как Claude Code съел годовой бюджет Uber: Технический директор Uber подтвердил The Information, что годовой бюджет на ИИ сгорел уже к апрелю. Причина — невероятная эффективность инструмента. 5 000 инженеров начали относиться к Claude не как к автозаполнению, а как к коллеге: просили делать рефакторинг целых репозиториев. Нейросеть сама писала, тестировала и уходила вглубь контекста. Итог: 70% всего кода компании стало ИИ-генерируемым, а стоимость одного инженера подскочила до $2000 в месяц. Финансовые модели Uber просто не были готовы к такой скорости внедрения. • Где эти деньги? У Anthropic: Пока клиенты экстренно пересматривают ROI, создатели Claude празднуют победу. Согласно Bloomberg, годовой темп выручки Anthropic (ARR) превысил $30 млрд (хотя в конце 2025 был всего $9 млрд). Рост спроса колоссальный: уже более 1000 крупных компаний тратят на Claude более $1 млн в год каждая. Главный вывод рынка: Эра бесконтрольных экспериментов с ИИ закончилась. Компании вроде Microsoft, Uber и Meta начинают жестко квотировать доступ и переходить на более дешевые модели. Если ИИ-агент работает автономно, он должен иметь четкие стоп-триггеры, иначе он обанкротит компанию быстрее, чем напишет рабочий код.

Вышел Composer 2.5 и как и принято он намного мощнее Opus 4.7 и в 10 раз дешевле Жаль бесплатно попробовать не дают, а то сра
Вышел Composer 2.5 и как и принято он намного мощнее Opus 4.7 и в 10 раз дешевле Жаль бесплатно попробовать не дают, а то сразу бы затестил.

Вышел новый Terminal coding Harness Pi В чем разница с этими вашими OpenCode и TRAE? Pi стартовал как агент кодирования для O
Вышел новый Terminal coding Harness Pi В чем разница с этими вашими OpenCode и TRAE? Pi стартовал как агент кодирования для OpenClaw, сначала как обычный тул, потом вошел в ядро как SDK. И вот сейчас релиз standalone app, который принес с собой типичные фишки Pi: • Минималистичность • Нет режима планирования • Опенсорсность • Без MCP • Никаких дополнительных агентов • Никаких всплывающих окон с запросами разрешений (только полный доступ, только хардкор) • Нет фонового bash. Используйте tmux. • Самопрограммирование На последней функции остановлюсь подробнее: Если вам нужна команда, инструмент, поставщик, рабочий процесс или настройка пользовательского интерфейса - Pi просто создаст это с нуля. https://pi.dev - посетите вебсайт, там такой дизайн, вы его точно никогда не забудете. Создано компанией https://earendil.com и сообществом.

Вышел Grok 4.3 - контекстное окно 1М Цена новинки $2.50/1M, но при превышении 200К нужно будет доплачивать до $5\1M (что не очень дорого за 1М) Успехов Илону! Ждем оценок в elo

* Open-source модель Alibaba Quinn (Qwen) 3.6 35B A3B. Очередная языковая модель от Alibaba с открытым исходным кодом [24]. Имеет 35 миллиардов параметров, поэтому при наличии хорошей видеокарты её можно запускать локально или дообучать на собственных серверах [24]. * Модель OpenAI GPT Rosalind. Специализированная модель рассуждений, созданная исключительно для научных исследований в области биологии, химии, геномики и разработки лекарств [24, 25]. Доступ к ней не является публичным: OpenAI предоставляет его только проверенным ученым и исследователям по заявкам [25]. * Модель Microsoft MAI image 2 efficient. Новая версия генератора изображений от Microsoft [26]. По сравнению с оригинальной версией, она работает быстрее (в среднем около 13.7 секунд на генерацию картинки) и дешевле, отлично справляясь с коротким текстом на изображениях, хотя может немного уступать в детализации при сложных запросах [26, 27]. * Обновление Midjourney версии 8.1. Разработчики вернули свою фирменную узнаваемую эстетику с нативным рендерингом в 2K HD [27]. Новая версия работает в три раза быстрее и стоит в три раза дешевле предыдущей V8 [27]. * ИИ-функции в DaVinci Resolve 21. Новая версия видеоредактора получила функцию *AI IntelliSearch*, которая позволяет мгновенно искать конкретных людей, предметы или ключевые слова из диалогов во всех исходных видеоматериалах проекта [28, 29]. Также появился инструмент *AI face age transformer*, с помощью которого можно визуально "состарить" или "омолодить" лицо человека на видео (добавить или убрать морщины) [29]. * Ребрендинг обувной компании Allbirds в New Bird AI. Компания, ранее занимавшаяся продажей обуви (с убыточными показателями после IPO), объявила о полном закрытии обувного бизнеса и покупке высокопроизводительных GPU для перехода в сферу искусственного интеллекта [30]. На фоне этого неожиданного заявления её акции взлетели на 600% [30]. * Робот Boston Dynamics выполняет список домашних дел. Опубликовано видео, где робот-гуманоид подходит к обычной маркерной доске, самостоятельно читает написанный на ней список задач и идет их физически выполнять в реальном мире: убирает обувь на полку, сминает и выбрасывает алюминиевые банки и собирает одежду в корзину для белья [31, 32].

* Обновление десктопного приложения OpenAI Codeex. Приложение делает шаг к созданию единого "суперприложения" [1, 2]. Теперь оно способно управлять вашим компьютером в фоновом режиме: видеть экран, кликать и печатать [2, 3]. Codeex может работать в нескольких вкладках параллельно с вами, имеет встроенный браузер и функцию генерации изображений с помощью GPT image 1.5 [3, 4]. В видео автор с его помощью успешно создал макет сайта, а также работающую локальную десктопную игру Connect 4, в которую ИИ затем самостоятельно сыграл для проверки интерфейса [4-6]. * Обновление приложения Anthropic Claude Code. Главным нововведением стала возможность запускать сессии параллельно для одновременной работы над несколькими проектами (репозиториями) [7]. Приложение получило обновленный интерфейс, встроенный терминал, внутренний редактор файлов, ускоренный просмотр изменений кода (diff viewer) и расширенную панель предпросмотра, поддерживающую HTML, PDF и запуск локальных серверов, что позволяет программировать без использования командной строки [7, 8]. * Десктопные приложения Google Gemini. Приложение Google для ПК стало доступно пользователям Windows по всему миру, а также было выпущено отдельное приложение Gemini для Mac [9]. В них доступны все функции браузерной версии, включая создание изображений (Nano Banana) и видео (VO) [9, 10]. * ИИ-навыки (Slash Commands) в браузере Google Chrome. Функция позволяет сохранять лучшие промпты из истории чатов в качестве "навыков" и применять их в один клик к любой открытой веб-странице с помощью слеш-команд [11]. Например, можно быстро попросить ИИ выделить главные тезисы из читаемой новостной статьи [11, 12]. * Модель озвучивания Gemini 3.1 Flash TTS от Google. Новая модель преобразования текста в речь, доступная в Vertex AI и AI Studio [12]. Ее ключевая особенность — высокая управляемость с помощью тегов: ИИ может генерировать воодушевленную речь, шепот, смех, вздохи, паузы или даже имитировать панику [12, 13]. Это отлично подходит для создания подкастов с несколькими участниками в стиле NotebookLM [13, 14]. * Обновление Google Nano Banana. Инструмент для генерации изображений теперь имеет доступ к вашей личной информации из экосистемы Google (календарь, Google Диск, почта, Google Фото) [14]. Благодаря этому контексту ИИ может генерировать персонализированные картинки, например, с участием пользователя, его семьи или собаки [14, 15]. * Запуск Perplexity "Personal Computer". Это локальный ИИ-агент, который работает прямо на вашем устройстве (например, на Mac Mini) в режиме 24/7 [16]. Вычислительные процессы по-прежнему происходят на серверах Perplexity, однако агент получает доступ к вашим локальным файлам, нативным приложениям (iMessage, электронная почта) и интернету [16, 17]. Он может самостоятельно прочитать список дел и выполнить многоэтапные задачи [17]. * Анонс функций Canva AI 2.0. Грядущее масштабное обновление, которое позволит создавать практически любые элементы (графику, аудио, 3D) внутри редактора с помощью текстовых подсказок [18, 19]. Canva будет интегрироваться со Slack, Notion и Gmail, а также сможет изучать и адаптироваться к вашему уникальному стилю дизайна [20]. Дополнительно заявлены офлайн-версия и тысячи готовых обучающих материалов [19]. * Релиз модели Anthropic Claude Opus 4.7. Новая флагманская модель, показавшая огромный скачок в бенчмарках по написанию кода (SWEBench Pro) [19, 21]. Она значительно лучше следует инструкциям, обладает улучшенной памятью и лучше понимает изображения, благодаря чему пользователям больше не нужно тратить много усилий на составление сложных промптов [21, 22]. Также в видео упоминалась сверхмощная модель Mythos preview, доступ к которой пока закрыт для публики [19, 21]. * Open-source модель MiniAX M2.7. Модель с открытым исходным кодом, которая показала передовые результаты в кодинге (56.22% в бенчмарке SWEBench Pro), обойдя Gemini и предыдущую версию Opus 4.6 [23]. Веса модели находятся в открытом доступе, однако лицензия строго запрещает использовать ее в коммерческих целях [23].

Промпт: Изучи историю наших чатов и изобрази меня так, как ты меня представляешь на основании истории наших переписок.
Промпт: Изучи историю наших чатов и изобрази меня так, как ты меня представляешь на основании истории наших переписок.

Вышел DeepSeek V4 Pro и цена стала дороже в 11 раз!!! 1.6Т параметров против 671B в версии 3.2 Как видим, по бенчам идут они
Вышел DeepSeek V4 Pro и цена стала дороже в 11 раз!!! 1.6Т параметров против 671B в версии 3.2 Как видим, по бенчам идут они ноздря в ноздрю и по рейтингу arena.ai рост не впечатляющий: Текстовый рейтинг с 63 —> 23 место Кодирование с 37 —> 14 место По цене $4.4\M - ничего примечательного не вижу, я бы покупать это не стал. Но DeepSeek славится своими оптимизациями и у модели есть меньший брат DeepSeek V4 Flash - с 284B параметрами по цене $0.28\M - опять же по бенчам почти тоже самое, что и V3.2, но в этот раз снижение цены на 42% - что очень существенно. Такие модели вообще открывают новую эру для запуска на конечных устройствах типа NVIDIA DGX Spark. https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro - веса модели

Антропик - страйк сбоев уже три дня подряд 23, 24 и 25 апреля Тут надо сделать ремарку - что Claude Design не работает, не по
Антропик - страйк сбоев уже три дня подряд 23, 24 и 25 апреля Тут надо сделать ремарку - что Claude Design не работает, не потому что он плохо работает. А потом что инференс Антропик работает плохо: Apr 25, 2026 Unresolved incidents: Claude Code v2.1.120 Crashes on Startup, Elevated error rates on Claude Opus 4.7. - ну и Claude Design тоже перестал работать. Apr 24, 2026 Issues with sign-ups on platform.claude.com Elevated errors on Claude Opus 4.7 Apr 23, 2026 Elevated errors on Claude Opus 4.7 MCP apps unavailable on Claude.ai Скоро uptime 90% так станет нормой. Что еще тут сказать - для меня это повод оплатить Codex и Copilot. Желаю удачи Антропикам с таким подходом к бизнесу!

Протестировал Claude Design Как и все что делает Антропик - на старте это полное 💩 и вообще не работает. Заплатил $100 за Ма
Протестировал Claude Design Как и все что делает Антропик - на старте это полное 💩 и вообще не работает. Заплатил $100 за Мах 5х и сижу жду как лошара свой проект. Как правило, они в течении 2х недель доводят и докурчивают до ума, посмотрим, как будет на этот раз. Кроме этого недельные лимиты на Claude Design - ну настолько маленькие - что просто с гулькин носик, так дали понюхать. В целом я вангую, что с такой ситуацией на инференс, скоро цены будут поднимать и очень серьезно будут поднимать. Одна надежда на китайцев, что они смогут сохранить нам старые цены. И вот тогда, все кто ржали надо мной, когда я призывал "оптимизировать и экономить токены" взвоют и зальют эти наши интернеты реками воплей, мол доколи терпеть, денег не хватает платить за ИИ.

Вышел GPT-5.5 - и цена стала в 2 (!) раза дороже!!! А вот и бенчи. Моделька новая SOTA и разрывает всех, даже новый Opus 4.7,
Вышел GPT-5.5 - и цена стала в 2 (!) раза дороже!!! А вот и бенчи. Моделька новая SOTA и разрывает всех, даже новый Opus 4.7, особенно в версии Pro 😂 Terminal-Bench 2.0 - 82.7% vs 69.4% у Opus 4.7 SWE-Bench Pro (Public)* - 58.6% vs 64.3% у Opus 4.7 FinanceAgent v1.1 60.0% vs 64.4% у Opus 4.7 По кибер безопасности хорошо прокачали CyberGym 81.8% vs 73.1% Opus 4.7 Цена модели $30\1M - что дороже Опуса, дороже Gemini дороже всего, что есть на рынке. Это ровно в 2 раза дороже, чем было у GPT-5.4. Что ж, удачи OpenAI с такими ценами. Так что осталось дождаться доступности по апи и посмотреть тесты arena.ai.