Да придет ИИ: ChatGPT, Claude, Gemini, Grok
Ir al canal en Telegram
Mostrar más
3 750
Suscriptores
-624 horas
-307 días
-16130 días
Archivo de publicaciones
Claude Fable 5 набирает 1 место в агентном рейтинге arena.ai
🏆 https://arena.ai/leaderboard/agent
Немного поменялся дизайн arena.ai
Теперь на главной странице рейтинг агентов (вместо текстового рейтинга)
1. GPT-5.5 - внезапно
2. Opus 4.7 (Опус 4.8 еще не завезли)
7. Sonnet 4.7
8. GLM-5.1
9. Gemini 3.1 Pro
10. Gemini 3.5 Flash
11. Kimi K2.6
12. DeepSeek V4 Pro
В чем рзаница в трех официальных курсах от Антропик по Клоду
Кратко:
• Клод 101 - для начинающих
• Клод Код курс 101 - для программистов
• Клод Код в действии - для продолжащих
Подробности описаны в таблице.
https://claude.com/resources/courses - полный список курсов на англ. языке. И да, русского языка нет. Только инглиш.
Протестировал Ideogram 4
И это как обычно просто прекрасно
Промпт:
Космонавт
Я даже могу прочесть нашивку "Горшков" у него на скафандре.
И китайский флаг на заднем фоне вызывает умиление!Ideogram is back 4.0
Давно уже не было новостей об Идеограм, а мне так нравилась эта модель.
И вдруг в июне 2026 - бабах! Они выпускают OpenSource модель размером всего 9.3B.
Можно скачать и использовать на своем компьютере совершенно бесплатно.
Но, лицензия - только для не коммерческого использования. Вы ведь не будете нарушать лицензию из США?
Компания Nous разработавшая агента Hermes выпустили Desktop App
Я сам еще не тестировал, но спешу с вами поделиться этой новостью.
Для меня это повод попробовать Hermes.
https://hermes-agent.nousresearch.com/desktop
Протестировал Gmail плагин в Codex
В ChatGPT этот плагин уже давным-давно есть, но я им как-то не пользовался.
Оказалось, что этот же плагин работает еще лучше в Codex!
Вы просто общаетесь в чате со своим почтовым ящиком, и когда надо что-то удалить, Codex просто удаляет перености все в корзину не задавая лишних вопросов.
О божечки, как же это удобно!
Корпоративный ИИ вышел из-под контроля: почему CFO в панике?
А вот вам первый пост сгенерированный Фабрикой Контента
(Да, в начале марта начал - к началу лета закончил)
Пока все обсуждали пользу нейросетей, бизнес столкнулся с суровой реальностью: модель подписок SaaS умирает, а «оплата за токены» сжигает бюджеты с пугающей скоростью.
Вот три главных кейса, которые прямо сейчас меняют правила игры:
• Счет на $500 млн за месяц: Анонимный корпоративный клиент рассказал Axios об эпичном провале IT-управления. Компания дала сотрудникам безлимитный доступ к Claude ИИ без жестких лимитов. В итоге начался «токенмайнинг»: сотрудники ради фана накручивали внутренние метрики активности ИИ (вплоть до проверки погоды через тяжелые модели), а автономные агенты ушли в бесконечные циклы вызовов, раздув API-запросы в тысячи раз. Подробности на Tom Hardware.
• Как Claude Code съел годовой бюджет Uber: Технический директор Uber подтвердил The Information, что годовой бюджет на ИИ сгорел уже к апрелю. Причина — невероятная эффективность инструмента. 5 000 инженеров начали относиться к Claude не как к автозаполнению, а как к коллеге: просили делать рефакторинг целых репозиториев. Нейросеть сама писала, тестировала и уходила вглубь контекста. Итог: 70% всего кода компании стало ИИ-генерируемым, а стоимость одного инженера подскочила до $2000 в месяц. Финансовые модели Uber просто не были готовы к такой скорости внедрения.
• Где эти деньги? У Anthropic: Пока клиенты экстренно пересматривают ROI, создатели Claude празднуют победу. Согласно Bloomberg, годовой темп выручки Anthropic (ARR) превысил $30 млрд (хотя в конце 2025 был всего $9 млрд). Рост спроса колоссальный: уже более 1000 крупных компаний тратят на Claude более $1 млн в год каждая.
Главный вывод рынка: Эра бесконтрольных экспериментов с ИИ закончилась. Компании вроде Microsoft, Uber и Meta начинают жестко квотировать доступ и переходить на более дешевые модели. Если ИИ-агент работает автономно, он должен иметь четкие стоп-триггеры, иначе он обанкротит компанию быстрее, чем напишет рабочий код.
Вышел Composer 2.5 и как и принято он намного мощнее Opus 4.7 и в 10 раз дешевле
Жаль бесплатно попробовать не дают, а то сразу бы затестил.
Вышел новый Terminal coding Harness Pi
В чем разница с этими вашими OpenCode и TRAE?
Pi стартовал как агент кодирования для OpenClaw, сначала как обычный тул, потом вошел в ядро как SDK.
И вот сейчас релиз standalone app, который принес с собой типичные фишки Pi:
• Минималистичность
• Нет режима планирования
• Опенсорсность
• Без MCP
• Никаких дополнительных агентов
• Никаких всплывающих окон с запросами разрешений (только полный доступ, только хардкор)
• Нет фонового bash. Используйте tmux.
• Самопрограммирование
На последней функции остановлюсь подробнее:
Если вам нужна команда, инструмент, поставщик, рабочий процесс или настройка пользовательского интерфейса - Pi просто создаст это с нуля.
https://pi.dev - посетите вебсайт, там такой дизайн, вы его точно никогда не забудете.
Создано компанией https://earendil.com и сообществом.
Вышел Grok 4.3 - контекстное окно 1М
Цена новинки $2.50/1M, но при превышении 200К нужно будет доплачивать до $5\1M (что не очень дорого за 1М)
Успехов Илону! Ждем оценок в elo
* Open-source модель Alibaba Quinn (Qwen) 3.6 35B A3B. Очередная языковая модель от Alibaba с открытым исходным кодом [24]. Имеет 35 миллиардов параметров, поэтому при наличии хорошей видеокарты её можно запускать локально или дообучать на собственных серверах [24].
* Модель OpenAI GPT Rosalind. Специализированная модель рассуждений, созданная исключительно для научных исследований в области биологии, химии, геномики и разработки лекарств [24, 25]. Доступ к ней не является публичным: OpenAI предоставляет его только проверенным ученым и исследователям по заявкам [25].
* Модель Microsoft MAI image 2 efficient. Новая версия генератора изображений от Microsoft [26]. По сравнению с оригинальной версией, она работает быстрее (в среднем около 13.7 секунд на генерацию картинки) и дешевле, отлично справляясь с коротким текстом на изображениях, хотя может немного уступать в детализации при сложных запросах [26, 27].
* Обновление Midjourney версии 8.1. Разработчики вернули свою фирменную узнаваемую эстетику с нативным рендерингом в 2K HD [27]. Новая версия работает в три раза быстрее и стоит в три раза дешевле предыдущей V8 [27].
* ИИ-функции в DaVinci Resolve 21. Новая версия видеоредактора получила функцию *AI IntelliSearch*, которая позволяет мгновенно искать конкретных людей, предметы или ключевые слова из диалогов во всех исходных видеоматериалах проекта [28, 29]. Также появился инструмент *AI face age transformer*, с помощью которого можно визуально "состарить" или "омолодить" лицо человека на видео (добавить или убрать морщины) [29].
* Ребрендинг обувной компании Allbirds в New Bird AI. Компания, ранее занимавшаяся продажей обуви (с убыточными показателями после IPO), объявила о полном закрытии обувного бизнеса и покупке высокопроизводительных GPU для перехода в сферу искусственного интеллекта [30]. На фоне этого неожиданного заявления её акции взлетели на 600% [30].
* Робот Boston Dynamics выполняет список домашних дел. Опубликовано видео, где робот-гуманоид подходит к обычной маркерной доске, самостоятельно читает написанный на ней список задач и идет их физически выполнять в реальном мире: убирает обувь на полку, сминает и выбрасывает алюминиевые банки и собирает одежду в корзину для белья [31, 32].
* Обновление десктопного приложения OpenAI Codeex. Приложение делает шаг к созданию единого "суперприложения" [1, 2]. Теперь оно способно управлять вашим компьютером в фоновом режиме: видеть экран, кликать и печатать [2, 3]. Codeex может работать в нескольких вкладках параллельно с вами, имеет встроенный браузер и функцию генерации изображений с помощью GPT image 1.5 [3, 4]. В видео автор с его помощью успешно создал макет сайта, а также работающую локальную десктопную игру Connect 4, в которую ИИ затем самостоятельно сыграл для проверки интерфейса [4-6].
* Обновление приложения Anthropic Claude Code. Главным нововведением стала возможность запускать сессии параллельно для одновременной работы над несколькими проектами (репозиториями) [7]. Приложение получило обновленный интерфейс, встроенный терминал, внутренний редактор файлов, ускоренный просмотр изменений кода (diff viewer) и расширенную панель предпросмотра, поддерживающую HTML, PDF и запуск локальных серверов, что позволяет программировать без использования командной строки [7, 8].
* Десктопные приложения Google Gemini. Приложение Google для ПК стало доступно пользователям Windows по всему миру, а также было выпущено отдельное приложение Gemini для Mac [9]. В них доступны все функции браузерной версии, включая создание изображений (Nano Banana) и видео (VO) [9, 10].
* ИИ-навыки (Slash Commands) в браузере Google Chrome. Функция позволяет сохранять лучшие промпты из истории чатов в качестве "навыков" и применять их в один клик к любой открытой веб-странице с помощью слеш-команд [11]. Например, можно быстро попросить ИИ выделить главные тезисы из читаемой новостной статьи [11, 12].
* Модель озвучивания Gemini 3.1 Flash TTS от Google. Новая модель преобразования текста в речь, доступная в Vertex AI и AI Studio [12]. Ее ключевая особенность — высокая управляемость с помощью тегов: ИИ может генерировать воодушевленную речь, шепот, смех, вздохи, паузы или даже имитировать панику [12, 13]. Это отлично подходит для создания подкастов с несколькими участниками в стиле NotebookLM [13, 14].
* Обновление Google Nano Banana. Инструмент для генерации изображений теперь имеет доступ к вашей личной информации из экосистемы Google (календарь, Google Диск, почта, Google Фото) [14]. Благодаря этому контексту ИИ может генерировать персонализированные картинки, например, с участием пользователя, его семьи или собаки [14, 15].
* Запуск Perplexity "Personal Computer". Это локальный ИИ-агент, который работает прямо на вашем устройстве (например, на Mac Mini) в режиме 24/7 [16]. Вычислительные процессы по-прежнему происходят на серверах Perplexity, однако агент получает доступ к вашим локальным файлам, нативным приложениям (iMessage, электронная почта) и интернету [16, 17]. Он может самостоятельно прочитать список дел и выполнить многоэтапные задачи [17].
* Анонс функций Canva AI 2.0. Грядущее масштабное обновление, которое позволит создавать практически любые элементы (графику, аудио, 3D) внутри редактора с помощью текстовых подсказок [18, 19]. Canva будет интегрироваться со Slack, Notion и Gmail, а также сможет изучать и адаптироваться к вашему уникальному стилю дизайна [20]. Дополнительно заявлены офлайн-версия и тысячи готовых обучающих материалов [19].
* Релиз модели Anthropic Claude Opus 4.7. Новая флагманская модель, показавшая огромный скачок в бенчмарках по написанию кода (SWEBench Pro) [19, 21]. Она значительно лучше следует инструкциям, обладает улучшенной памятью и лучше понимает изображения, благодаря чему пользователям больше не нужно тратить много усилий на составление сложных промптов [21, 22]. Также в видео упоминалась сверхмощная модель Mythos preview, доступ к которой пока закрыт для публики [19, 21].
* Open-source модель MiniAX M2.7. Модель с открытым исходным кодом, которая показала передовые результаты в кодинге (56.22% в бенчмарке SWEBench Pro), обойдя Gemini и предыдущую версию Opus 4.6 [23]. Веса модели находятся в открытом доступе, однако лицензия строго запрещает использовать ее в коммерческих целях [23].
Промпт:
Изучи историю наших чатов и изобрази меня так, как ты меня представляешь на основании истории наших переписок.Вышел DeepSeek V4 Pro и цена стала дороже в 11 раз!!!
1.6Т параметров против 671B в версии 3.2
Как видим, по бенчам идут они ноздря в ноздрю и по рейтингу arena.ai рост не впечатляющий:
Текстовый рейтинг с 63 —> 23 место
Кодирование с 37 —> 14 место
По цене $4.4\M - ничего примечательного не вижу, я бы покупать это не стал.
Но DeepSeek славится своими оптимизациями и у модели есть меньший брат
DeepSeek V4 Flash - с 284B параметрами по цене $0.28\M - опять же по бенчам почти тоже самое, что и V3.2, но в этот раз снижение цены на 42% - что очень существенно.
Такие модели вообще открывают новую эру для запуска на конечных устройствах типа NVIDIA DGX Spark.
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro - веса модели
Антропик - страйк сбоев уже три дня подряд 23, 24 и 25 апреля
Тут надо сделать ремарку - что Claude Design не работает, не потому что он плохо работает.
А потом что инференс Антропик работает плохо:
Apr 25, 2026
Unresolved incidents: Claude Code v2.1.120 Crashes on Startup, Elevated error rates on Claude Opus 4.7. - ну и Claude Design тоже перестал работать.
Apr 24, 2026
Issues with sign-ups on platform.claude.com
Elevated errors on Claude Opus 4.7
Apr 23, 2026
Elevated errors on Claude Opus 4.7
MCP apps unavailable on Claude.ai
Скоро uptime 90% так станет нормой.
Что еще тут сказать - для меня это повод оплатить Codex и Copilot.
Желаю удачи Антропикам с таким подходом к бизнесу!
Протестировал Claude Design
Как и все что делает Антропик - на старте это полное 💩 и вообще не работает.
Заплатил $100 за Мах 5х и сижу жду как лошара свой проект.
Как правило, они в течении 2х недель доводят и докурчивают до ума, посмотрим, как будет на этот раз.
Кроме этого недельные лимиты на Claude Design - ну настолько маленькие - что просто с гулькин носик, так дали понюхать.
В целом я вангую, что с такой ситуацией на инференс, скоро цены будут поднимать и очень серьезно будут поднимать.
Одна надежда на китайцев, что они смогут сохранить нам старые цены. И вот тогда, все кто ржали надо мной, когда я призывал "оптимизировать и экономить токены" взвоют и зальют эти наши интернеты реками воплей, мол доколи терпеть, денег не хватает платить за ИИ.
Вышел GPT-5.5 - и цена стала в 2 (!) раза дороже!!!
А вот и бенчи.
Моделька новая SOTA и разрывает всех, даже новый Opus 4.7, особенно в версии Pro 😂
Terminal-Bench 2.0 - 82.7% vs 69.4% у Opus 4.7
SWE-Bench Pro (Public)* - 58.6% vs 64.3% у Opus 4.7
FinanceAgent v1.1 60.0% vs 64.4% у Opus 4.7
По кибер безопасности хорошо прокачали
CyberGym 81.8% vs 73.1% Opus 4.7
Цена модели $30\1M - что дороже Опуса, дороже Gemini дороже всего, что есть на рынке. Это ровно в 2 раза дороже, чем было у GPT-5.4. Что ж, удачи OpenAI с такими ценами.
Так что осталось дождаться доступности по апи и посмотреть тесты arena.ai.
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
