Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Show more📈 Analytical overview of Telegram channel Machinelearning
Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 296 853 subscribers, ranking 327 in the Technologies & Applications category and 1 263 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 296 853 subscribers.
According to the latest data from 17 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -6 411 over the last 30 days and by -226 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 8.11%. Within the first 24 hours after publication, content typically collects 5.61% reactions from the total number of subscribers.
- Post reach: On average, each post receives 24 075 views. Within the first day, a publication typically gains 16 662 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 196.
- Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
Thanks to the high frequency of updates (latest data received on 18 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
По данным независимого исследования К2 Кибербезопасности и «Лаборатории Касперского» только 22% компаний выделили на отдельный бюджет на безопасность ИИ, при этом 61% компаний стремятся контролировать использование сотрудниками сторонних ИИ-сервисов, но испытывают технологические и организационные сложности.StarGuard AI работает как reverse proxy-шлюз между пользователями, корпоративными системами и языковыми моделями. Платформа анализирует запросы и ответы, выявляет чувствительные данные, jailbreak-атаки, prompt-инъекции и нецелевой контент, а также ведет аудит взаимодействия с ИИ. Решение поддерживает интеграцию с OpenWebUI, IDE, AI-агентами и корпоративными платформами и ориентировано на крупный бизнес, промышленность, финансовый сектор и государственные организации.
Быстрее всего ИИ будет работать на iPhone Air, iPhone 17 Pro и 17 Pro Max, iPad с чипом M4 и Mac с M3 при объёме оперативной памяти не менее 12 ГБ.Релиз Siri AI запланирован на осень 2026 года и поначалу только на английском языке. В странах ЕС ассистент на iPhone и iPad на старте доступен не будет. В Китае Siri AI также не появится сразу.
Конференция стала последней для Тима Кука в роли генерального директора. 1 сентября он передаёт пост старшему вице-президенту по аппаратной инженерии Джону Тернусу.@ai_machinelearning_big_data #news #ai #ml
Инструмент позиционируется как решение типичной проблемы, когда агент выполняет задачу почти целиком, но упускает формат, тесты или обязательные разделы. Механизм наиболее полезен для задач с чёткими и проверяемыми критериями приёмки.🟡 Принцип работы Разработчик задаёт список требований (рубрику) к выполненной задаче: например, код должен проходить тесты, а отчёт содержать определённые разделы. Перед тем как агент завершит работу, отдельный проверяющий агент (грэйдер) оценивает результат по каждому пункту. Если что-то не выполнено, его замечания возвращаются основному агенту, и тот делает новую попытку. Цикл останавливается, когда все критерии выполнены либо когда достигнут заданный лимит итераций. По словам LangChain, проверяющий агент может не только рассуждать о качестве ответа, но и вызывать внешние инструменты, чтобы опираться на фактические данные, а не только на текст. LangChain сравнивают подход с функцией
/goal в Claude Code и Codex, но утверждают, что их реализация пластичнее за счёт выделенного агента-оценщика, который видит весь ход выполнения задачи.
RubricMiddleware пока в бете, но к нему есть документация, а посмотреть пример трейса можно тут.
@ai_machinelearning_big_data
#news #ai #mlДоказательство на естественном языке трудно проверить автоматически - оно почти всегда содержит логические пробелы. Формальное доказательство записывается на машинном языке и проверяется компилятором, что даёт гарантию корректности, но писать его значительно сложнее.В этой области лидируют специализированные модели, заточенные в обучении именно под Lean. LEAP, работая как агентный фреймворк, использует общие модели, разбивая задачу на части и исправляя ошибки рекурсивно по подсказкам компилятора. Главная исследовательская победа проекта - олимпиада Putnam 2025, ежегодное соревнование по математике для студентов в США. LEAP формально решила все 12 задач, тогда как ни Gemini 3.1 Pro сама по себе, ни открытый специализированный прувер Goedel-Prover-V2 не решили ни одной.
Закрытую систему Aristotle, получившую на математической олимпиаде IMO 2025 результат уровня золотой медали, авторы в собственных тестах оценили в 9 решённых задач из 12.В рамках работы также представлен набор IMO-LeanProofBench из 60 формализованных в Lean задач олимпиадного уровня, требующих весьма нестандартных выводов и структурно сложных доказательств.
На нём LEAP, что неудивительно, достигает в среднем по basic и advanced сэтам около 70% против примерно 48% у Aristotle.Попутное достижение - LEAP формально проверила вспомогательную часть одной из комбинаторных задач, восходящих к математику Дональду Кнуту, сгенерировав более 5000 строк кода на Lean 4. 🟡Стоит отметить иронию В статье авторы критикуют закрытые системы-конкуренты (Axiom3, Numina, Aristotle) за то, что те недоступны для научной проверки. При этом код самого LEAN тоже не опубликован. Открытие итоговых доказательств это частично смягчает (их можно перепроверить компилятором Lean), но полная воспроизводимость гугловского проекта пока невозможна. @ai_machinelearning_big_data #AI #ML #LLM #LEAP #Research #Google
Рейтинг учитывает соотношение числа новых сотрудников к изначальному размеру команды.Около 85% списка заняли проекты в сфере ИИ и автономных систем. Основной рост пришелся на 2 направления: 🟢ИИ-безопасность: Jazz, Tenzai, Straiker, Gray Swan и Native. 🟠Embodied AI и робототехника: разработчик моделей Skild AI, провайдер датасетов для машинного зрения Mecka AI и создатель систем управления Allen Control Systems. Также в список вошли сам Cursor, платформа предиктивных рынков Polymarket и разработчик RL-сред Fleet. По данным Бена, последний сейчас привлекает инвестиции при оценке в $750 млн. @ai_machinelearning_big_data #news #ai #ml
Свой довод Саттон построил вокруг известной шутки об отзыве на научную работу: она "и новая, и хорошая, но хорошие части не новы, а новые - не хороши".Это описание точно подходит к генеративному ИИ: его вывод бывает либо новым (за счёт случайности при генерации), либо качественным (за счёт обучающих данных), но не тем и другим сразу. Для большинства задач это несущественно: имитация и есть назначение обучения с учителем, а генеративный ИИ остаётся полезной технологией, если он быстрее, дешевле или удобнее воспроизводимого образца. Проблема возникает там, где требуются открытие и творчество, то есть в науке и математике. Научное открытие складывается из 3 шагов: вариативности, оценки и избирательного сохранения удачного. Этой способности нет в чистом предсказании и обучении с учителем, но она есть в RL, планировании и комбинаторном поиске. Саттон привёл в пример системы, которые, по его оценке, нашли одновременно новые и качественные решения: AlphaGo, AlphaZero, AlphaFold и AlphaProof.
Сам трёхчастный принцип, кстати, не нов. На близкие идеи указывали ещё Дональд Кэмпбелл и Дэниел Деннет.🟡 Генеративным моделям недостаёт шага оценки Из-за предобучения, они не имеют способа оценивать собственный вывод в момент работы, а без оценки нет и отбора лучшего. Оценку может давать человек, выбирающий результат, но важнее кейс, когда критерий задан явной целью (например, ходом, ведущим к мату, или шагом, ведущим к доказательству). Ограничение Саттон распространил и на сам метод обучения. Алгоритм обратного распространения ошибки лишён случайности, она вносится лишь однажды при инициализации весов, из-за чего сеть со временем теряет пластичность. В качестве решения он напомнил о предложенном его группой алгоритме Continual Backprop, который периодически заново инициализирует редко используемые нейроны, поддерживая способность сети меняться. 🟡Вывод Чтобы добиться полностью автономного ИИ-учёного, инженерам следует делиться с моделями измеримыми целями, по которым те могли бы самостоятельно проходить весь цикл: порождать варианты, оценивать их и сохранять лучшие, не полагаясь на человека в роли арбитра.
Тезисы Саттона перекликаются с его эссе "Горький урок", где он отстаивал ставку на поиск и обучение, масштабируемые вместе с вычислительными мощностями, в противовес встраиванию готовых человеческих знаний.🔜 Послушать лекцию на Youtube @ai_machinelearning_big_data
Проблема в том, что термином "модель мира" пользуются CV, робототехника, RL и генеративный ИИ, каждый вкладывая в него своё.Чтобы развести значения, Ли предлагает опираться на классическую схему из учебников по RL: цикл "агент-действие-состояние-наблюдение".
Формально - частично наблюдаемый марковский процесс принятия решений.Разные системы, которые сегодня называют моделями мира, авторы предлагают рассматривать как разные проекции этого одного цикла. 🟡 Разделение на функции Рендерер выдаёт наблюдения в виде пикселей, и главное для него - визуальная достоверность (3D структуры он по-настоящему не понимает). Симулятор выдаёт состояние (геометрически и физически корректное описание мира, на котором могут работать и люди, и алгоритмы). Планировщик по наблюдению и цели выдаёт действие, замыкая петлю "восприятие -действие". 🟡Доводы Из 3-х категорий именно симулятор привлекает меньше всего внимания публики, но он самый значимый. Рендереры коммерчески наиболее развиты (Google Nano Banana и другие генераторы), но оптимизированы под правдоподобную картинку, а не под физику - красивый кадр нельзя использовать, чтобы спроектировать здание или обучить робота. Планировщики, наоборот, самые перспективные и самые сырые. Робототехнические демо последних лет почти всегда ограничены лабораторными условиями и далеки от реалий в реальном мире. Симулятор описан как мост между ними и структурный каркас, из которого выводятся и внешний вид (для рендерера), и последствия действий (для планировщика). Логическим итогом Ли называет одну базовую модель, которая в зависимости от запроса переключается между режимами: рендерит, симулирует или планирует.
В качестве первого шага в эту сторону Ли считает платформу Marble (разработка World Labs), которая генерирует 3D-сцены и выдает в рамках одной модели и гауссовы сплаты для визуального осмотра, и коллизионные сетки, с которыми может работать физический движок.#AI #ML #WorldModels #WorldLabs
Материал подготовлен исследовательским подразделением Anthropic Institute. Его авторы - Марина Фаваро и сооснователь компании, глава отдела политики Джек Кларк.Отрасль приближается к рекурсивному самоулучшению
Это состояние, когда ИИ способен самостоятельно проектировать и совершенствовать собственного преемника быстрее, чем к этому будут готовы правительства и институты.При этом Anthropic оговаривается, что до полностью автономной разработки ещё далеко и что такой сценарий не является неизбежным, люди по-прежнему нужны. Они ставят цели, оценивают результаты и решают, какие направления важны. 🟡Внутренние данные На май 2026 года Claude написал более 80% кода, добавляемого в кодовую базу Anthropic.
До запуска Claude Code этот показатель измерялся единицами процентов.Во втором квартале 2026 года типичный инженер вносил в проекты примерно в 8 раз больше кода в день, чем в 2024-м. 🟡Публичные тесты Время выполнения задач, которые модели способны надёжно решать без участия человека, удваивается примерно каждые 4 месяца.
В начале 2024 года Opus 3 справлялся с задачами длиной в несколько минут, годом позже Sonnet 3.7 примерно за полтора часа, а Opus 4.6 - до 12 часов.На SWE-bench, проверяющем исправление реальных ошибок в коде, передовые модели за два года прошли путь от низких результатов до почти предельных. Джек Кларк говорит, что компания хочет, чтобы законодатели и институты понимали, что может произойти дальше.
По его словам, цель Anthropic - "заранее обозначить концепцию и дать людям представление о том, что приближается".Прогресс ИИ, по его оценке, скорее ускоряется, чем замедляется, и может принести значительные результаты в медицине и науке, но требует инструментов для проверки и подтверждения работы, выполненной ИИ. Anthropic выступает за то, чтобы у мира оставалась возможность при необходимости замедлить или временно приостановить разработку передовых моделей, но понимает, что это потребует согласованных всех игроков индустрии в разных странах и механизмов взаимной проверки. В ближайшие месяцы компания обсудит эти вопросы с законодателями, исследователями и другими участниками отрасли. @ai_machinelearning_big_data #news #ai #ml
Available now! Telegram Research 2025 — the year's key insights 
