AI для каждого | AISferaic

Open in Telegram

Откройте для себя возможности нейронных сетей. Узнайте, как вы можете использовать эти технологии для улучшения своей жизни и работы. От теории до практики. Каталог промптов и новости ИИ - https://aisferaic.ru/chat Чат с AI - https://aisferaic.ru/chat

The country is not specifiedThe category is not specified

241

Subscribers

-124 hours

No data7 days

+1730 days

142

Post views

~ 12824 hours

~ 14648 hours

58.92%

Engagement rate

~ 4

Posts per day

Ads index

beta

Posts Archive

241

Яндекс представил программу 75/75/75 новые KPI для разработчиков, которые сделают ИИ обязательным стандартом внутри компании. К концу 2026 года 75% сотрудников должны регулярно писать код с нейросетями, используя их в 75% задач и генерируя таким образом не менее 75% всего объема кода. Сейчас ИИ уже применяют 73% разработчиков Яндекса, но цель программы полноценный переход к AI-native культуре. Первые результаты впечатляют: в «Еде» разработку ИИ-хостес ускорили вдвое, в «Браузере» нейросеть написала 80% кода для новой архитектуры перевода видео за два дня вместо недель, а в «Лавке» скорость работы в отдельных спринтах выросла более чем в три раза. Внутренние процессы обеспечивают агенты: GENA ведет задачи от тикета до релиза, а «Стефания» помогает с аналитикой и ревью кода тысячам сотрудников еженедельно. Для внешнего рынка Яндекс развивает платформу SourceCraft с агентским режимом и Yandex AI Studio для создания собственных приложений.

241

OpenAI наносит ответный удар по дешевому интеллекту из Китая, радикально снижая стоимость своих моделей. Цена на GPT-5.6 Luna упала на 80% и теперь составляет всего 0,20 за миллион входных и 1,20 за миллион выходных токенов. Модель Terra также подешевела на 20% до уровня 2/2/2/12 соответственно. В итоге Luna стала в 25 раз доступнее, чем флагманская Sol. Изменения уже вступили в силу для API и лимитов в платных подписках. Для самой мощной GPT-5.6 Sol в API добавили режим Fast. Он дает ускорение до 2,5 раза при двукратном увеличении цены, что обеспечивает на 25% лучшее соотношение скорости и стоимости при сохранении эталонного уровня интеллекта.

241

Новый CLI позволяет вытащить полную дизайн-систему с любого сайта буквально в одну команду. Просто передаете URL, а инструмент сам собирает цвета, типографику, отступы, компоненты и даже логику анимаций, формируя на выходе готовый файл DESIGN.md. Нейросеть детально анализирует границы, тени и брейкпоинты, избавляя от необходимости вручную копировать стили. Фронтендеры, вайбкодеры и дизайнеры теперь могут смело закрывать DevTools и переходить в терминал.

241

Google готовит для Gemini Notebook крупное обновление интерактивные HTML-артефакты, которые будут создаваться на основе ваших загруженных документов. Нейросеть сможет мгновенно превращать скучные источники в динамические дашборды, полноценные приложения и даже игры. Любой результат можно будет дорабатывать обычными промптами прямо в интерфейсе. Теперь появится легальный способ загрузить учебник, попросить ИИ сделать по нему квиз или игру и в итоге с чистой совестью так и не открывать сам текст. Кроме того, Google продолжает развивать сервис AI Notes и планирует добавить переключатель для управления водяными знаками на сгенерированном контенте.

241

Claude Opus 5 с режимом Max reasoning захватил лидерство сразу в двух рейтингах Arena Frontend Code Arena и Text Arena с проверкой на фактическую точность. Версия с уровнем High reasoning также показывает отличные результаты, удерживая второе место в текстовом поиске и третье в веб-разработке, сразу за Kimi K3. Эти данные подтверждают, что новая модель Anthropic максимально эффективна в создании интерфейсов, работе с документами и обычном общении. Стоит учитывать, что результат версии Max пока предварительный оценки будут уточняться по мере сбора новых данных от пользователей. Важным обновлением стал режим Factuality в Text Arena и Search Arena. Теперь рейтинг учитывает не только субъективные предпочтения людей, но и фактическую точность ответов: система проверяет утверждения модели на корректность и выставляет баллы за достоверность. Подробности методологии

241

OpenAI неожиданно выкатила в опенсорс CLI и TypeScript SDK для поиска уязвимостей в коде. Релиз оказался настолько тихим, что на Hacker News его обнаружили раньше официального анонса от самой компании. Новый инструмент позволяет сканировать репозитории на наличие дыр в безопасности, отслеживать историю найденных багов и проверять качество их исправления. Главная ценность возможность бесшовной интеграции этих security-проверок прямо в пайплайны CI/CD. На данный момент это ранняя версия, и OpenAI активно собирает фидбек от разработчиков для дальнейшей доработки функционала.

241

Протокол MCP получил крупнейшее обновление с момента запуска, которое радикально меняет архитектуру взаимодействия с ИИ-агентами. Главное нововведение переход на stateless-модель: теперь удаленным серверам не нужно хранить состояние сессий, что позволяет легко запускать их в serverless-среде и масштабировать за балансировщиками нагрузки. Расширения стали полноценной частью протокола, открывая доступ к новым сценариям использования. В релиз вошли MCP Apps для запуска интерфейсов внутри песочницы, поддержка длительных асинхронных задач и система Enterprise Managed Auth для централизованного управления доступом через корпоративных провайдеров. Помимо этого, разработчики значительно усилили механизмы авторизации и внедрили формальную политику депрекации устаревших функций. Масштабируемость и безопасность выходят на новый уровень.

241

Год назад это казалось фантастикой, но сегодня 1 132 сотрудника топовых лабораторий (OpenAI, Anthropic, Google, Meta) бьют тревогу. Они предупреждают: автоматизация ИИ-исследований может разогнать прогресс до скоростей, неподвластных человеку. Эксперты призывают правительство США создать механизмы для коллективной остановки гонки. Проблема в том, что ни одна компания не нажмет на тормоз первой, пока конкуренты летят вперед. Мы входим в фазу, где масштаб и сложность технологий выходят за рамки человеческого понимания. Конкуренты вынуждены объединяться, чтобы выжить, но без участия Китая этот глобальный «предохранитель» рискует не сработать.

241

Moonshot сдержали слово и открыли веса своей флагманской модели Kimi K3. Теперь самый мощный инструмент лаборатории с 2,8 трлн параметров, MoE-архитектурой и нативной поддержкой мультимодальности официально доступен на Hugging Face. Помимо самих весов и контекстного окна в 1 млн токенов, компания выложила в открытый доступ важные части технического стека. В пакет вошли высокопроизводительные attention-ядра, специализированная библиотека для обмена данными между экспертами MoE и вся необходимая инфраструктура для запуска масштабных агентных сред. Максимально открытый жест, который явно задает новый стандарт для индустрии.

241

ChatGPT Work agent теперь умеет взаимодействовать с сайтами, требующими авторизации. Пользователю достаточно один раз взять управление облачным браузером на себя и войти в аккаунт, после чего агент сможет самостоятельно выполнять задачи внутри защищенной сессии. Данные авторизации сохраняются между запусками, так что при повторном обращении к ресурсу входить заново не придется. Это значительно расширяет возможности агента в работе с закрытыми корпоративными системами и личными кабинетами.

241

Сэм Альтман в своем новом интервью сделал громкое заявление: «Мы уже находимся в сингулярности». Глядя на плотность ежедневных прорывов и скорость прогресса, в это утверждение легко поверить. Мы вошли в фазу, когда последствия текущих технологических сдвигов практически невозможно предсказать даже на короткой дистанции. При этом самое удивительное, что около 99% людей за пределами индустрии до сих пор даже не осознают масштаб и скорость происходящих перемен.

241

Основатель Kimi Ян Чжилинь считался выдающимся талантом задолго до триумфа K3. Еще в 2014 году, во время учебы в Университете Цинхуа, наставники называли его одним из самых способных студентов десятилетия. К моменту получения стипендии он уже был лучшим на потоке с почти максимальным баллом, опубликовал три серьезные научные работы, а его алгоритмы внедрили такие гиганты, как Tencent, Sina и Huawei. Более того, Ян Чжилинь смог обойти команды Стэнфорда и Колумбийского университета в международном соревновании по прогнозированию рака. Несмотря на колоссальную нагрузку, он находил время играть на барабанах и писать музыку для своей студенческой рок-группы. Нынешний успех Kimi - это не случайное везение, а результат как минимум 12 лет непрерывной и интенсивной работы.

241

Представлена интересная работа MemoHarness, посвященная оптимизации всей «обвязки» ИИ-агентов на основе их собственного опыта. Система настраивает не только промпты, но и контекст, набор инструментов, память и процессы оркестрации. Механизм прост: после выполнения задач система запоминает успешные решения, а при получении нового запроса находит похожие кейсы и автоматически подстраивает параметры под текущую ситуацию. При этом подход не требует сложной разметки данных, градиентного обучения или дорогостоящего перебора вариантов. На тестах для shell-агентов MemoHarness показал результат 0,806, заметно обойдя лучшие системы с фиксированными настройками (0,722). Примечательно, что стоимость выполнения задач оказалась даже ниже, чем у мощных коммерческих аналогов. Статья

241

Anthropic полностью обновила свой официальный бесплатный курс по Claude Code. Программа стала значительно объемнее и теперь включает 10 подробных уроков, актуальные видеоматериалы и итоговый экзамен для проверки знаний. Курс ориентирован на практическое применение инструмента и доступен для всех желающих по ссылке

241

Эффективность агентных систем часто определяется не только мощностью модели, но и качеством программной «обвязки» вокруг неё. Именно этот каркас (harness) диктует, как именно агент будет использовать доступные инструменты и справляться с поставленными задачами. Компания Visa открыла исходный код своей специализированной платформы для агентного сканирования уязвимостей. Платформа универсальна: к ней можно подключить практически любую нейросеть от закрытых облачных решений до открытых моделей, работающих через API или развернутых локально.

241

Тарик из Anthropic представил обновленные правила контекст-инжиниринга для моделей Claude 5. Применение этих принципов позволило сократить системный промпт самого Claude Code на 80% без потери качества в задачах по кодингу. Основные рекомендации сводятся к максимальной лаконичности. Файл CLAUDE.md стоит использовать только для описания неочевидных «подводных камней», удаляя всё, что модель способна понять сама при анализе репозитория. Вместо жестких запретов лучше использовать описание стиля: например, просить ИИ соответствовать плотности комментариев в текущем коде вместо полного их запрета. Разработчик советует не дублировать правила в системном промпте и описании инструментов, а также разбивать сложные навыки на несколько мелких файлов, подгружая их по необходимости. При этом спецификацией может служить не только Markdown, но и тестовые наборы или HTML-макеты. Эти советы помогут значительно сэкономить токены и повысить точность работы.

241

Тандем Kimi K3 и платформы Tinker позволяет практически полностью автоматизировать цикл научных исследований. Вся сложная инфраструктура обучения скрыта «под капотом», поэтому ИИ фокусируется исключительно на проведении экспериментов, что заметно упрощает отслеживание правок и планирование новых запусков. В ходе теста по воспроизведению работы Self-Distilled RLVR модель с первой попытки собрала базовую версию, самостоятельно провела 19 экспериментов с разными конфигурациями и подготовила детальный отчет, включая версию на китайском языке. Весь процесс прошел с минимальным участием человека. Протестировать возможности авторесёрча с Kimi можно на сайте openresearch.sh. Для тех, кто хочет детально разобрать этот эксперимент, доступен пример в репозитории.

241

Anthropic выпустила новый флагман Claude Opus 5. Главная новинкиа в том, что она вплотную приближается к интеллекту Fable 5, но стоит в два раза дешевле. На текущий момент это новый SOTA в кодинге и офисных задачах согласно бенчмаркам Frontier-Bench и GDPval-AA. Важное отличие от Fable 5 - более лояльные фильтры безопасности. Там, где Fable наотрез отказывается помогать даже с пробросом портов на роутере, классификаторы Opus 5 срабатывают на 85% реже. Тесты в Claude Code подтверждают: проекты по сетевой инфраструктуре теперь работают без ложных блокировок. По результатам тестов модель показывает невероятный отрыв: в Frontier-Bench v0.1 она более чем вдвое превосходит Opus 4.8, а в OSWorld 2.0 обходит даже Fable 5, выполняя задачи в три раза дешевле.Модель уже доступна в чате и Claude Code для подписчиков. На официальном API цена осталась на уровне версии 4.8 — 5 за миллион входных и 25 за миллион выходных токенов. Попробовать новинку можно у нас

241

Anthropic выпустила новый флагман Claude Opus 5.

241

Локальный ИИ стал доступнее благодаря ODS инструменту, который максимально упрощает запуск нейросетей на своем железе. Система сама определяет характеристики компьютера, подбирает оптимальную модель, скачивает её и разворачивает вместе с удобным интерфейсом Open WebUI. Через единую панель можно подключать голосовое управление, агентов семейства Hermes, RAG, поиск и генерацию изображений. При этом пользователю не нужны облачные сервисы или платные подписки все вычисления происходят прямо на устройстве. Главный плюс такого подхода в приватности: ваши запросы и данные никогда не покидают компьютер, если вы не решите иначе. Проект доступен здесь