Machinelearning

Ir al canal en Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Red:Machinelearning Rusia1 261 Tecnologías y Aplicaciones324...

📈 Análisis del canal de Telegram Machinelearning

El canal Machinelearning (@ai_machinelearning_big_data) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 297 383 suscriptores, ocupando la posición 324 en la categoría Tecnologías y Aplicaciones y el puesto 1 261 en la región Rusia.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 297 383 suscriptores.

Según los últimos datos del 14 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -6 744, y en las últimas 24 horas de -170, conservando un alto alcance.

Estado de verificación: No verificado
Tasa de interacción (ER): El promedio de interacción de la audiencia es 8.03%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 5.69% de reacciones respecto al total de suscriptores.
Alcance de las publicaciones: Cada publicación recibe en promedio 23 912 visualizaciones. En el primer día suele acumular 16 939 visualizaciones.
Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 186.
Intereses temáticos: El contenido se centra en temas clave como openai, claude, api, gemini, контекст.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 15 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

297 383

Suscriptores

-17024 horas

-1 4767 días

-6 74430 días

23 912

Visitas de la publicación

~ 16 93924 horas

~ 18 95348 horas

8.03%

Tasa de compromiso

~ 5

Mensajes por día

Ads index

beta

Archivo de publicaciones

297 373

📘 Learning Deep Representations of Data Distributions — новая бесплатная книга от исследователей UC Berkeley (Sam Buchanan, Druv Pai, Peng Wang, Yi Ma). Главная идея книги - показать, почему и как глубокие нейросети учатся извлекать сжатые, информативные представления сложных данных, и что у них внутри: 💡В книге вы найдите: 🟠простое объяснение фундаментальных принципов архитектур нейросетей через оптимизацию и теорию информации. 🟠как модели формируют инвариантные и устойчивые представления 🟠связь с PCA, автоэнкодерами и дифференцируемыми отображениями — то есть, как нейросети по сути обобщают классические методы сжатия данных и учатся находить их оптимальное представление 🟠взгляд на обучение через энергию, энтропию и структуру данных 🟠свежие идеи для понимания LLM и генеративных моделей 📖 Читать онлайн: ma-lab-berkeley.github.io/deep-representation-learning-book 🖥 Github: https://github.com/Ma-Lab-Berkeley/deep-representation-learning-book @ai_machinelearning_big_data #book #deeplearning #representationlearning #ucberkeley #machinelearning

297 373

✔️ GenAI прямо на устройстве: Chrome, Chromebook Plus и Pixel Watch с LiteRT-LM Google выпустили LiteRT-LM - фреймворк для запуска LLM прямо на устройстве (offline), с минимальной задержкой и без API-вызовов. Если вы пилите приложения, это полезная штука, потому что: - Работает на устройстве: нет задержек от удалённых серверов - Нет расходов на API - Дает доступ к Локальному GenAI 🔍 Основное - LiteRT-LM уже используется внутри Gemini Nano / Gemma в Chrome, Chromebook Plus и Pixel Watch. - Открытый C++ интерфейс (preview) для интеграции в кастомные решения. - Архитектура: Engine + Session • Engine хранит базовую модель, ресурсы - общий для всех функций • Session - контекст для отдельных задач, с возможностью клонирования, копирования “по записи” (Copy-on-Write) и лёгких переключений - Поддержка аппаратного ускорения (CPU / GPU / NPU) и кроссплатформенность (Android, Linux, macOS, Windows и др.) - Для Pixel Watch используется минимальный “pipeline” - только необходимые компоненты - чтобы уложиться в ограничения памяти и размера бинарей Google опенсорснули целый стек для запуска GenAI на устройствах: - LiteRT быстрый «движок», который запускает отдельные AI-модели на устройстве. - LiteRT-LM - интерфейс C++ для работы с LLM. Он объединяет сразу несколько инстурментов : кэширование промптов, хранение контекста, клонирование сессий и т.д. - LLM Inference API - готовые интерфейсы для разработчиков (Kotlin, Swift, JS). Работают поверх LiteRT-LM, чтобы можно было легко встраивать GenAI в приложения. 🟠Подробнее: https://developers.googleblog.com/en/on-device-genai-in-chrome-chromebook-plus-and-pixel-watch-with-litert-lm/ @ai_machinelearning_big_data #AI #Google #LiteRT #LiteRTLM #GenAI #EdgeAI #OnDeviceAI #LLM

297 373

✔️ GenAI прямо на устройстве: Chrome, Chromebook Plus и Pixel Watch с LiteRT-LM* Google выпустили LiteRT-LM - фреймворк для запуска LLM прямо на устройстве (offline), с минимальной задержкой и без API-вызовов. Если вы пилите приложения, это полезная штука, потому что: - Работает на устройстве: нет задержек от удалённых серверов - Нет расходов на API - Дает доступ к Локальному GenAI 🔍 Основное - LiteRT-LM уже используется внутри Gemini Nano / Gemma в Chrome, Chromebook Plus и Pixel Watch. - Открытый C++ интерфейс (preview) для интеграции в кастомные решения. - Архитектура: Engine + Session • Engine хранит базовую модель, ресурсы - общий для всех функций • Session - контекст для отдельных задач, с возможностью клонирования, копирования “по записи” (Copy-on-Write) и лёгких переключений - Поддержка аппаратного ускорения (CPU / GPU / NPU) и кроссплатформенность (Android, Linux, macOS, Windows и др.) - Для Pixel Watch используется минимальный “pipeline” - только необходимые компоненты - чтобы уложиться в ограничения памяти и размера бинарей Google опенсорснули целый стек для запуска GenAI на устройствах: - LiteRT быстрый «движок», который запускает отдельные AI-модели на устройстве. - LiteRT-LM - интерфейс C++ для работы с LLM. Он объединяет сразу несколько инстурментов : кэширование промптов, хранение контекста, клонирование сессий и т.д. - LLM Inference API - готовые интерфейсы для разработчиков (Kotlin, Swift, JS). Работают поверх LiteRT-LM, чтобы можно было легко встраивать GenAI в приложения. 🟠Подробнее: https://developers.googleblog.com/en/on-device-genai-in-chrome-chromebook-plus-and-pixel-watch-with-litert-lm/ @ai_machinelearning_big_data #AI #Google #LiteRT #LiteRTLM #GenAI #EdgeAI #OnDeviceAI #LLM

297 373

✔️ Ming-UniAudio - универсальный инструмент для работы с речью. Модель объединяет понимание, генерацию и редактирование аудио без привязки к таймстампам. Основой стал новый токенайзер MingTok-Audio, на котором построен единый Speech LLM. Одновременно выпущен бенчмарк для свободного редактирования речи. GitHub / Tokenizer / Model / Benchmark ✔️ Свежий бесплатный курс по нейросетям от Эндрю Ына и Стэнфорда Основатель Coursera Эндрю Ын выпустил бесплатный курс по нейросетям. В курсе: базовые основы Deep Learning, практические задания и советы по построению карьеры в AI. Первая лекция уже доступна, все материалы и расписание — открыты. Отличный шанс провести выходные с пользой и глубже разобраться в мире нейросетей. Первая лекция / Расписание ✔️ AI-инфраструктура тянет экономику США: 40% роста ВВП и триллионы инвестиций впереди Почти 40% роста ВВП США за последний квартал обеспечили капитальные вложения в технологии, главным образом связанные с AI. UBS прогнозирует, что расходы компаний на AI-инфраструктуру достигнут $375 млрд в 2025 году и вырастут до $500 млрд в 2026-м. Но основной рост идёт не от самого AI, а от строительства «фабрик мощности» - дата-центров и инфраструктуры. По оценке Brookfield Asset Management, за ближайшие 10 лет в эту сферу уйдёт $7 трлн. По данным Минторга США, инвестиции в софт и компьютерное оборудование (без учёта зданий дата-центров) дали четверть всего экономического роста за квартал. Этот всплеск трат меняет и фондовый рынок: как отмечает Deutsche Bank, индекс S&P 500 вырос на 13.81% с начала года, тогда как равновзвешенный вариант прибавил лишь 7.65%. То есть рост обеспечивают в основном «Великолепная семёрка» технологических гигантов. X ✔️ Alpha School: в Техасе открылась школа, где учителей заменил ИИ Дети 4–5 классов учатся два часа утром по индивидуальным программам в науке, математике и чтении, а после обеда занимаются проектами и жизненными навыками. Учителей здесь называют «гидами» - они мотивируют, а не преподают, получая шестизначные зарплаты. Школа утверждает, что её ученики входят в топ-1% по тестам, хотя педагоги скептически относятся к роли ИИ. Обучение стоит от $40 000 в год, но основатели считают модель примером будущего образования. cbsnews ✔️ ИИ помог Теренсу Тао найти контрпример в математике Один из величайших математиков современности, Теренс Тао, использовал искусственный интеллект, чтобы решить задачу на MathOverflow о последовательности наименьших общих кратных. У него было теоретическое подозрение, что ответ отрицательный, но требовались конкретные числовые параметры для построения контрпримера. Сначала Тао просил ИИ сгенерировать Python-код для поиска, но из-за неверных параметров и долгого времени выполнения этот путь оказался неэффективным. Затем он перешёл к пошаговому алгоритму: ИИ выполнял эвристические расчёты, помогая сузить диапазон параметров. В итоге удалось получить рабочие значения, которые Тао проверил самостоятельно с помощью короткого Python-скрипта, также созданного ИИ. Такая стратегия позволила сэкономить часы ручного кодирования и отладки: ИИ не только ускорил поиск, но и выявил несколько ошибок в начальных рассуждениях. Этот случай показывает, как современные системы могут становиться реальными ассистентами даже в фундаментальной математике. mathstodon @ai_machinelearning_big_data #news #ai #ml

297 373

⚡️ Релиз Agent S3 - продвинутый агент для работы с компьютером, который приближается к человеческому уровню. Вместо того, чтобы усложнять одну модель, авторы запускают несколько агентов параллельно и затем выбирают лучший результат. Метод назвили **Behavior Best-of-N (bBoN)**. Как работает: - Каждый агент пробует решить задачу. - Его действия переводятся в поведенческий нарратив - короткое описание, что реально изменилось на экране. - Специальный судья сравнивает эти нарративы и выбирает лучший. Результаты: - GPT-5 с 10 параллельными агентами → 69.9% успеха - Для примера у GPT-5 Mini → 60.2% - Agent S3* набирает на +10% выше предыдущей SOTA @ai_machinelearning_big_data #AI #Agents #AgentS3 #OSWorld #SimularAI #LLM

297 373

✔️ Прорыв в квантовых вычислениях Физики Гарварда создали первый в мире квантовый компьютер, который работает непрерывно без перезапуска. Ранее квантовые машины держались миллисекунды, максимум - около 13 секунд. Новая установка работает более 2 часов и может функционировать бесконечно. Ключевое новшество - решение проблемы потери атомов: система в реальном времени пополняет кубиты, впрыскивая 300 000 атомов в секунду с помощью оптических инструментов. Учёные считают, что практические, постоянно работающие квантовые компьютеры могут появиться уже в течение 2 лет - с огромным влиянием на медицину, финансы и научные исследования. thecrimson ✔️ Anthropic делает ставку на AI-приложения для бизнеса По данным The Information, Anthropic продвигает свою модель Claude как основу для создания enterprise-замен привычных приложений вроде Slack. Компания делает ставку на обучение с подкреплением, чтобы улучшить способности модели к программированию. Похожую стратегию развивает и xAI Илона Маска, но эксперты сомневаются, что крупные корпорации откажутся от укоренившихся систем вроде SAP или ServiceNow. Более вероятно, что первыми такие AI-first инструменты начнут использовать небольшие стартапы. Тем временем JPMorgan и другие банки активно заявляют об интеграции решений OpenAI, Anthropic и Google, хотя реальные масштабы затрат пока не соответствуют публичному энтузиазму. theinformation ✔️ Perplexity объявила, что её AI-браузер Comet, ранее доступный только по подписке $200/месяц, теперь стал бесплатным для всех (с ограничениями по запросам). Comet, запущенный в июле 2025 года, работает как встроенный ассистент: он умеет анализировать страницы, вытаскивать ключевые детали и сердить по ссылкам, проводя многошаговые исследования. Perplexity также представила Comet Plus за $5 — партнёрскую подписку, которая открывает доступ к контенту от CNN, The Washington Post, Fortune, Los Angeles Times и Condé Nast (The New Yorker, Wired и др.). Однако запуск совпал с продолжающимися исками от крупных издателей, включая Dow Jones (The Wall Street Journal) и New York Post, обвиняющих стартап в использовании их материалов для обучения ИИ. Скачать Comet ✔️ OpenAI раскалывает запуск Sora: ИИ-видео как TikTok, но сотрудники бьют тревогу TechCrunch пишет, что запуск нового соцприложения Sora 2 вызвал тревогу внутри самой OpenAI. Это TikTok-подобная лента, наполненная видео, созданными ИИ, включая дипфейки самого Сэма Альтмана. Часть исследователей OpenAI считает, что компания уходит от своей миссии ради хайпового контента. Один из сотрудников прямо заявил: «AI-ленты - пугающие. Я был шокирован, узнав, что мы выпускаем Sora 2…» Сторонники проекта объясняют, что такие продукты нужны, чтобы финансировать фундаментальные исследования и дать пользователям почувствовать силу технологий. В OpenAI утверждают, что хотят «показать людям что-то классное, чтобы они улыбнулись». Но вместе с ростом Sora OpenAI рискует повторить судьбу классических соцсетей: зависимость, манипуляции c информацией, проблемы с дипфейками и давлением на метрики вовлечённости. techcrunch ✔️ США продолжают контролировать большинство мировых мощностей для обучения ИИ, строя самые большие и энергоемкие кластеры Китай в 2025 году вложит до 98 млрд долларов, но экспортные ограничения на топовые чипы Nvidia и AMD тормозят прогресс. Huawei продвигает Ascend 910C, однако по памяти, пропускной способности и софту он уступает решениям Nvidia. США разрешили ограниченные продажи H20 и MI308 в Китай с 15% налогом, но топовые GPU недоступны китацы, и разрыв в производительности всё ещё в пользу американцев. X @ai_machinelearning_big_data #news #ai #ml

297 373

✔️ IBM представила Granite 4.0 — новое семейство open-weights языковых моделей от 3B до 32B параметров. Четыре новые модели: - Granite 4.0 H Small - 32B/9B активных параметров - Granite 4.0 H Tiny - 7B/1B - Granite 4.0 H Micro - 3B/3B - Granite 4.0 Micro - 3B/3B Benchmarking (Artificial Analysis Index): - Granite 4.0 H Small: 23 балла (на 8 выше Granite 3.3 8B), обходит Gemma 3 27B (22), но уступает Mistral Small 3.2 (29) и Qwen3 30B A3B (37). - Granite 4.0 Micro: 16 баллов, выше Gemma 3 4B (15) и LFM 2 2.6B (12). ⚡ Token efficiency: - Granite 4.0 Small — 5.2M токенов - Granite 4.0 Micro — 6.7M токенов Обе модели заметно эффективнее Granite 3.3 8B и большинства non-reasoning моделей <40B. Детали: - Контекст: до 128K токенов - Лицензия: Apache 2.0 - Granite 4.0 H Small доступна на Replicate по $0.06 / $0.25 за 1M input/output токенов - Все модели доступны на Hugging Face 🔗 Hugging Face: https://huggingface.co/collections/unsloth/granite-40-68ddf64b4a8717dc22a9322d 🔗 Unsloth: https://docs.unsloth.ai/new/ibm-granite-4.0 @ai_machinelearning_big_data #AI #IBM #Granite4 #LLM #OpenWeights

297 373

🔦 Генерация изображений на свете, а не на GPU Исследователи из UCLA представили оптическую генеративную модель (Optical Generative Model). Она использует свет и линзы вместо вычислительных блоков - то есть картинки рождаются не на чипах, а в физике. 🔬 Как это работает: 1. Лёгкий цифровой энкодер превращает случайный шум в фазовый узор. 2. Этот узор загружается на оптический модулятор света. 3. Свет проходит через дифракционный декодер и прямо на сенсоре формируется изображение. ✔️ Авторами проведены реальные эксперименты: с помощью видимого света и SLM показаны результаты генерации: - Созданы цифры, лица, бабочки и даже картины в стиле Ван Гога. - Качество сравнимо с современными диффузионными моделями. - Есть две версии: мгновенная (один проход) и итеративная (несколько шагов, как у диффузии). ⚡ Чем интересен такой подход - Подход не требует никакой вычислительной нагрузки. - Супербыстрая генерация: физика света выполняет то, что GPU делает миллиардами операций. - Это открывает путь к энергоэффективному ИИ для edge-устройств: AR/VR, мобильные камеры, компактные сенсоры. ⚠️ Ограничения: - Сложно выравнивать оптические системы. - Ограничения по точности фазовых масок. - Зависимость от качества оборудования (шум, битовая глубина). Но даже с этими проблемами, это первый шаг к новому классу ИИ, где вычисления заменяются чистой оптикой. Nature: https://www.nature.com/articles/s41586-025-09446-5 @ai_machinelearning_big_data #AI #OpticalComputing #Photonics #GenerativeA

297 373

✔️ Илон Маск стал первым человеком в истории, чьё состояние превысило $500 млрд Для сравнения: это больше, чем суммарное богатство Джеффа Безоса ($233,5 млрд) и Марка Цукерберга ($245,7 млрд). Только за последний год Маск увеличил своё состояние на $245 млрд. ✔️ Стартап Миры Мурати Thinking Machines представил свой первый продукт - Tinker. Но это не новая модель, а гораздо более практичный инструмент: API для файнтюнинга. Идея проста: вы пишете код для дообучения, а все заботы о железе берут на себя Thinking Machines - от распределения ресурсов до восстановления после сбоев. Tinker поддерживает широкий спектр моделей - от небольших до очень крупных. В API доступны базовые примитивы (forward_backward, optim_step, sample), из которых можно собрать кастомные пайплайны. А для тех, кто хочет сразу сложные сценарии, есть Tinker Cookbook - библиотека с готовыми реализациями популярных алгоритмов: RLHF, Multi-Agent, Tool Use, Math Reasoning и других. Пока продукт доступен только в приватной бете, но уже можно записаться в вейтлист. ✔️ Nvidia представила Reinforcement Learning Pretraining (RLP) - новый способ обучения ИИ, при котором модель учится рассуждать ещё на этапе претренинга. В эксперименте на 12B модели RLP повысил точность на 35%, используя всего 0,125% данных. Главное отличие: вместо обычного предсказания следующего токена модель сначала генерирует «мысль», а затем проверяет, улучшает ли она прогноз. За полезные мысли модель получает вознаграждение, что формирует навык пошагового мышления с самого начала обучения. На математических и бенчмарках тестах RLP превзошёл стандартные подходы и сохранил преимущество даже после классического дообучения. nvidia ✔️ Вышла версия Cursor 1.7. Теперь пользоваться инструментом стало удобнее за счёт ряда новых функций. Подсказки появляются прямо во время ввода промпта и принимаются нажатием Tab. Появились кастомные hooks, которые позволяют управлять жизненным циклом агентов, а также deeplinks для быстрого обмена промптами. Правила можно назначать сразу для всей команды, включая Bugbot для автоматического кодревью. Кроме того, теперь статус агентов доступен прямо из панели, без необходимости открывать само приложение. cursor ✔️ Мира Мурати привлекла рекордные $2 млрд при оценке $10–12 млрд - крупнейший посевной раунд в истории США. Она сохранила полный контроль над стартапом, а среди инвесторов - a16z, Accel, Nvidia, AMD и Cisco. В команду вошёл сооснователь OpenAI Джон Шульман и группа экс-исследователей. Компания зарегистрирована как public benefit corporation, обещает open-source и первый продукт в ближайшие месяцы. Information ✔️ OpenAI стала самой дорогой частной компанией в мире - её оценка достигла $500 млрд, обогнав SpaceX и ByteDance. За последние полгода стоимость выросла на $200 млрд. При этом стартап продолжает наращивать убытки, но инвесторы пока закрывают на это глаза. Сэм Альтман фактически переигрывает весь рынок, превращая OpenAI в главного игрока индустрии. Bloomberg @ai_machinelearning_big_data #news #ai #ml

297 373

🧠 Google/DeepMind представили AlphaEvolve: ИИ, который помогает математикам и компьютерным теоретикам искать новые результаты. 💡 Как он работает Обычно LLM стараются писать доказательства целиком, но это слишком сложно и ненадёжно. AlphaEvolve идёт другим путём: он не пишет доказательства сам, а генерирует новые маленькие элементы *конструкции (gadgets)*. Эти кусочки можно быстро проверить автоматикой, и если они работают, их можно собрать в более крупные теоремы. 📈 Что удалось найти - Новый результат для задачи MAX-4-CUT (Это задача из теории алгоритмов и комбинаторной оптимизации, разновидность классической задачи MAX-CUT), с конструкцией, которую раньше никто не придумывал. - Сильные новые нижние границы для задач на случайных графах, включая работу с Ramanujan graphs. - Проверка теорем стала в 10 000 раз быстрее, чем в обычных методах. 🧩 Зачем это нужно - Математика требует 100% точности - и тут AI помогает именно как генератор идей, а проверка остаётся строгой и надёжной. - Такой подход экономит годы человеческой работы и открывает дорогу к новым теоремам и алгоритмам. 📄 Подробнее: research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/ @ai_machinelearning_big_data #AI #Math #DeepMind #Research

297 373

GigaChat Vision Team — ваша будущая команда! 😉 Если вы зарегистрируетесь на One Day Offer для NLP- и CV-инженеров и пройдёте все этапы отбора, то уже совсем скоро будете: ✔️ Обучать Vision, 3D/CAD и омни-модальные модели на тысячах A100/H100. ✔️ Создавать live-ассистента на edge-устройствах, а также базовые модели VLA для промышленных проектов: автоматизированных фабрик, автопилотов и роботов. ✔️ Работать с документами: Document Intelligence и разработка VLM OCR. ✔️ Развивать мультимодальную инфраструктуру: от инференса генеративных моделей до создания и авторазметки синтетических данных Дублируем ссылку на регистрацию — до встречи 4 октября!

297 373

🧠 Google/DeepMind представили AlphaEvolve: ИИ, который помогает математикам и компьютерным теоретикам искать новые результаты. 💡 Как он работает Обычно LLM стараются писать доказательства целиком, но это слишком сложно и ненадёжно. AlphaEvolve идёт другим путём: он не пишет доказательства сам, а генерирует новые маленькие элементы *конструкции (gadgets)*. Эти кусочки можно быстро проверить автоматикой, и если они работают, их можно собрать в более крупные теоремы. 📈 Что удалось найти - Новый результат для задачи **MAX-4-CUT** (Это задача из теории алгоритмов и комбинаторной оптимизации, разновидность классической задачи MAX-CUT), с конструкцией, которую раньше никто не придумывал. - Сильные новые нижние границы для задач на случайных графах, включая работу с **Ramanujan graphs**. - Проверка теорем стала в 10 000 раз быстрее, чем в обычных методах. 🧩 Зачем это нужно - Математика требует 100% точности - и тут AI помогает именно как генератор идей, а проверка остаётся строгой и надёжной. - Такой подход экономит годы человеческой работы и открывает дорогу к новым теоремам и алгоритмам. 📄 Подробнее: research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/ @ai_machinelearning_big_data #AI #Math #DeepMind #Research

297 373

🔥 Интересный кейс про ML в картографии В статье рассказано про развитие детектора Яндекс Карт для распознавания дорожных знаков на панорамах — от бинарного классификатора до нейросетей. Сейчас детектор умеет находить почти все знаки в России. Первая же версия создавалась в 2016 году с помощью небольшого датасета и модели на классических подходах компьютерного зрения. Использовали ACFFeatures + WaldBoost с бинарными решающими деревьями. Классические методы страдали «близорукостью» — детектили знаки только «в лоб», повороты пропускали, поэтому перешли к новой версии на свёрточных нейросетях и натренировали Faster R-CNN. Нетривиальные архитектурные решения: ▪️Объединили все знаки ограничения скорости в один класс + дополнительная сеть для распознавания чисел на вырезанном знаке ▪️ То же с направлениями по полосам — детектор находит знак, дополнительная модель выдаёт бинарный вектор направлений ▪️ Создали отдельную модель для обработки найденных знаков многополосности. Полная техническая реализация описана в статье. 🟢 Главная проблема — сбор датасета Как обычно, всё упёрлось в данные для обучения. Терабайты фотографий улиц прогонять через асессоров — дорого и неэффективно. Выстроили такой процесс: сначала автоматически находить фотографии, где есть дорожные знаки, и только потом отправлять их на разметку асессорам. 🟢 Финальные цифры: ▪️ 300 тысяч фотографий в датасете ▪️ 1,5 миллиона размеченных знаков ▪️200+ поддерживаемых классов знаков Любопытный факт: самый частый знак в датасете — пешеходный переход. Практический результат: всё это помогает автоматически обновлять данные в Картах, по которым сервис строит маршруты, выдаёт голосовые подсказки о том, с какой скоростью ехать и тд. В год так вносится более 200 тысяч автообновлений ⚡️ Статья: https://habr.com/ru/companies/yandex/articles/946338/ @ai_machinelearning_big_data #ai #ml

297 373

✔️ Zai представили GLM-4.6 Новая флагманская модель получила заметные улучшения: поддержка длинного контекста до 200K токенов, более сильные возможности в рассужденияъ, генерации кода, поиска, и агентных задачах. Hf | Api | Попробовать ✔️ NVIDIA анонсировала новые возможности для робототехники и симуляции. Newton - это открытый физический движок с GPU-ускорением, созданный на базе NVIDIA Warp и OpenUSD и выпущенный под лицензией Apache 2.0. Он показывает огромный прирост скорости: в задачах движения до 152× быстрее, а при манипуляции объектами — до 313× быстрее по сравнению с MJX на RTX 4090. Isaac Lab позволяет запускать тысячи параллельных симуляций для ускоренного обучения с подкреплением. Среди демонстраций — робот ANYmal, осваивающий ходьбу, и симуляция складывания одежды с реалистичной мультифизикой. NVIDIA Blog ✔️ Anthropic опубликовала статью о том, как правильно работать с контекстом при создании LLM-агентов. Главная идея - контекст не равен простому prompt’у: это весь набор информации (инструкции, история сообщений, память, внешние данные), который агент использует для принятия решений. Контекст - ограниченный ресурс, длинные цепочки приводят к «context rot» - постепенной потере качества. Нужно уметь структурировать и минимизировать инструкции, оставляя только важное. Важно грамотно управлять вызовами инструментов: они должны возвращать релевантные и компактные данные. Историю лучше периодически сжимать, сохраняя факты, а не «сырые токены». Для сложных случаев полезно делить задачи между суб-агентами, а затем агрегировать их результаты. Эффективная контекстная инженерия делает агентов точнее, дешевле и устойчивее при работе с длинными Подробнее ✔️ServiceNow выпустила Apriel-v1.5-15B-Thinker Новая 15B reasoning-модель с открытыми весами набрала 52 балла в Artificial Analysis Intelligence Index - уровень моделей в сотни миллиардов параметров. Отличается сильным instruction following, многошаговыми диалогами и поддержкой 128k контекста. Доступна на Hugging Face под MIT-лицензией для свободного коммерческого использования. HF @ai_machinelearning_big_data #news #ai #ml

297 373

🎥 OpenAi показали Sora 2 Всё, что нужно знать коротко: - Реализм и физика: движение стало правдоподобнее, модель учитывает сложную динамику — гимнастика, плавучесть, сохранение предметов. - Законы физики соблюдаются: например, промах по кольцу в баскетболе отскакивает, а не “телепортируется”. - Видео со звуком: синхронная генерация речи, эффектов и фоновой атмосферы. - Управляемость: модель точно следует сложным сценариям, держит сцены цельным, умеет в реализм и аниме. - Cameos: можно загрузить своё видео/аудио и вставить лицо + голос в любой сгенерированный ролик. - Пиложение: новое iOS-приложение “Sora” с лентой наподобие TikTok, ремиксами и cameo. Запуск по инвайтам, акцент на генерацию видосов, а не погоня за просмторами. - Доступ: бесплатный, но пока только в США и Канаде, Pro-версия для платных акаунтов ChatGPT Pro, API обещают скоро. менить прогресс человечества. https://x.com/OpenAI/status/1973075422058623274 #Sora2 #OpenAI #видеогенерация #ИИ #AIvideo

297 373

⚡️ LoRA почти так же хороша, как полный fine-tuning, но в разы дешевле Thinking Machines выпустили новое исследование, которое смотрит на LoRA под другим углом. Главная идея исследования: LoRA может обучаться почти как полный fine-tuning, но при этом быть проще, дешевле и предсказуемее. Они доказали это экспериментально: взяли одинаковую модель, прогнали обучение двумя способами: полным fine-tuning и LoRA - и сравнили кривые потерь (loss vs steps). Процесс: - Дали чёткий рецепт, а не случайные гипотезы. - Показали, что процесс можно повторять с одинаковым результатом. - Выяснили, что если адаптеру не хватает памяти, модель не ломается, а просто замедляется. Результат показал, что при правильных настройках LoRA движется по той же траектории, что и FullFT. То есть качество модели и динамика обучения совпадают, пока у адаптера хватает параметров. Когда лимит достигается, у LoRA кривая не «обрывается», а просто идёт дальше медленнее. Именно за счёт этого LoRA демонстрирует предсказуемое и воспроизводимое поведение, а не случайные провалы, которые часто происходят при подборе гиперпараметров «на глаз». ✔️ Правила от команды Thinking Machines 1. Ставить LoRA на все слои, а не только на attention. 2. Использовать ~10× больший learning rate, чем обычно. 3. Не раздувать batch size - иначе падает стабильность. ✔️ Что в итоге: - Кривые обучения LoRA почти совпадают с full fine-tuning. - Даже в упоре в лимит адаптера модель ведёт себя плавно. - Вычислений требуется на треть меньше, чем у FullFT. LoRA может стать инструментом для надёжного и дешёвого пост-трейнинга. Для Thinking Machines это шаг к миссии: они уверены, что непредсказуемость моделей - это не фича, а баг, который можно исправить. Если убрать случайность и сделать выходы стабильными - ИИ станет безопасным даже для критически важных процессов. 📌 Подробнее @ai_machinelearning_big_data #LoRA #FineTuning #AI #MachineLearning #DeepLearning #LLM

297 373

✔️ Cursor запустил бесплатный мини-курс для разработчиков, которые создают софт с помощью ИИ-моделей и инструментов. Это не про обучение нейросетей с нуля, а про то, как правильно и эффективно использовать их в работе.Курс кратко объясняет, как устроены модели и как их применять, освещает практические приёмы для генерации кода, включает тесты, примеры промптов и интерактив с разными ИИ. Весь материал легко проходится за один вечер. Курс ✔️ OpenAI готовит к выпуску соцсеть на базе Sora 2 Wired сообщает, что OpenAI разрабатывает отдельное приложение в стиле TikTok, но с одним ключевым отличием - весь контент в ленте будет полностью сгенерирован ИИ. Формат привычный: вертикальные видео и свайпы для навигации, но источником роликов станет Sora 2. OpenAI делает шаг в сторону собственной соцсети, где пользователи будут не делиться контентом, а потреблять бесконечный поток видео, созданных ИИ. Wired ✔️ Lufthansa сократит 4 000 рабочих мест, так как авиакомпания делает ставку на ИИ для повышения эффективности. Авиакомпания объявила о сокращениях в рамках «широкой программы реструктуризации», где ключевой упор делается на цифровизацию, ИИ и автоматизацию. В пресс-релизе компания подчеркнула, что использование AI позволит значительно повысить эффективность процессов в разных направлениях бизнеса. Apnews ✔️ Runway запустил бесплатный курс AI for Gaming Это обучающая программа о том, как встроить генеративные ИИ-решения Runway в полный цикл разработки игр - от первых концептов до продакшн-ресурсов и рекламных роликов. Курс включает пять лекций: про анимацию концепт-арта, симуляцию диалогов персонажей, дизайн уровней, расширение библиотеки игровых ассетов и создание текстур. Runway ✔️InternLM представила CapRL-3B и CapRL-Eval-3B модели для генерации текста к изображениям, по точности сопоставимая с Qwen2.5-VL-72B. Особенно хорошо справляются с диаграммами, инфографикой и документами Обучены с помощью RL и «проверяемых наград», что делает подписи более разнообразными и осмысленными Лцензия Apache 2.0 HF ✔️Anthropic представила Claude Agent SDK Новый SDK превращает Claude в платформу для создания агентов, которые умеют работать с файлами, выполнять команды, вызывать API и решать практические задачи. В основе — цикл агента: получить контекст, действовать, проверять результат и повторять. SDK даёт готовые инструменты, субагентов и механизмы работы с памятью и контекстом. Поддерживаются сценарии от финансовых помощников и поддержки клиентов до исследовательских и аналитических агентов. Anthropic @ai_machinelearning_big_data #news #ai #ml

297 373

Claude Sonnet 4.5 — лучшая на сегодняшний день модель для программирования. Топ модель для создания сложных агентов. Claude Sonnet 4.5 демонстрирует заметный прогресс на бенчмарках на логику и математику. https://www.anthropic.com/news/claude-sonnet-4-5 @ai_machinelearning_big_data

297 373

🔬 Учёные MIT представили SCIGEN - новый инструмент, который учит генеративные модели создавать реально полезные материалы, а не только «красивые картинки». Обычно ИИ придумывает структуры, похожие на уже известные, и редко выходит за рамки. SCIGEN решает эту проблему: он накладывает строгие геометрические ограничения прямо на процесс генерации, заставляя модель искать нестандартные, но стабильные решения. В экспериментах команда сгенерировала миллионы кандидатов и отфильтровала их по устойчивости и свойствам. Итог - два ранее неизвестных соединения (**TiPdBi** и **TiPbSb**) удалось реально синтезировать в лаборатории, и они подтвердили предсказанные характеристики. Это шаг к будущему, где материалы для электроники, квантовых технологий и энергетики будут не «искать годами», а проектировать целенаправленно с помощью ИИ. https://news.mit.edu/2025/new-tool-makes-generative-ai-models-likely-create-breakthrough-materials-0922 @ai_machinelearning_big_data #AI #MIT #GenerativeAI #MaterialsScience #SCIGEN

297 373

Регистрация подходит к концу — не пропусти AIDAO, международную олимпиаду по ИИ и анализу данных от Яндекс Образования и ФКН НИУ ВШЭ Главные призы: 1 млн рублей и преимущества при поступлении в магистратуры ФКН ВШЭ. — Задачи с реальными данными — Два этапа: онлайн и финал в офлайне, в Москве. — Общение с экспертами и сотрудниками научных лабораторий, возможность стать частью международного комьюнити студентов. 🚀 Собирайте команду и регистрируйтесь по ссылке до 30 сентября