Machinelearning

Відкрити в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Сітка:Machinelearning Росія1 272 Технології та додатки329...

📈 Аналітичний огляд Telegram-каналу Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 296 342 підписників, посідаючи 329 місце в категорії Технології та додатки та 1 272 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 296 342 підписників.

За останніми даними від 20 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -6 181, а за останні 24 години на -161, загальне охоплення залишається високим.

Статус верифікації: Не верифікований
Рівень залученості (ER): Середній показник залученості аудиторії становить 8.10%. Протягом перших 24 годин після публікації контент зазвичай збирає 5.73% реакцій від загальної кількості підписників.
Охоплення публікацій: В середньому кожен допис отримує 24 014 переглядів. Протягом першої доби публікація в середньому набирає 16 967 переглядів.
Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 187.
Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як openai, claude, api, gemini, контекст.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Завдяки високій частоті оновлень (останні дані отримано 21 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

296 342

Підписники

-16124 години

-1 4287 днів

-6 18130 день

24 014

Перегляди допису

~ 16 96724 години

~ 19 11248 годин

8.10%

Коефіцієнт залучення

~ 5

Дописів на день

Ads index

beta

Архів дописів

296 347

15 бесплатных книг по Data Science (часть 1)* 1. *Veridical Data Science* 👩‍🔬 Авторы: Bin Yu & Rebecca L. Barter Описание: Фреймворк PCS для интерпретируемого анализа данных. 🔗 https://vdsbook.com/ 2. *Data Science: Theories, Models, Algorithms, and Analytics* 📘 Автор: Sanjiv Ranjan Das Описание: Учебник по DS с упором на алгоритмы и аналитику. 🔗 https://srdas.github.io/Papers/DSA_Book.pdf 3. *Think Python 3E* 🐍 Автор: Allen B. Downey Описание: Современное введение в Python с нуля. 🔗 https://greenteapress.com/wp/think-python-3rd-edition/ 4. *Python Data Science Handbook* 📊 Автор: Jake VanderPlas Описание: Практика работы с NumPy, pandas, sklearn и визуализациями. 🔗 https://jakevdp.github.io/PythonDataScienceHandbook/ 5. *R for Data Science* 📈 Авторы: Hadley Wickham и др. Описание: Современный подход к анализу данных в R. 🔗 https://r4ds.hadley.nz/ 6. *Think Stats 3E* 📐 Автор: Allen B. Downey Описание: Статистика через Python и практику. 🔗 https://allendowney.github.io/ThinkStats/ 7. *Statistics and Prediction Algorithms Through Case Studies* 📙 Автор: Rafael A. Irizarry Описание: Кейсы по статистике и прогнозированию с кодом на R. 🔗 https://rafalab.github.io/dsbook/ 8. *Bayesian Methods for Hackers* 🧠 Автор: Cameron Davidson-Pilon Описание: Визуальное введение в байесовский анализ с PyMC. 🔗 https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers 9. *Think Bayes 2E* 🔢 Автор: Allen B. Downey Описание: Пошаговый байесовский подход на Python. 🔗 https://allendowney.github.io/ThinkBayes2/ 10. *Data Science at the Command Line* 💻 Автор: Jeroen Janssens Описание: Unix-инструменты как основа для анализа данных. 🔗 https://datascienceatthecommandline.com/ Математика и теория вероятностей: 11. Теория вероятностей 👩‍🔬 Автор: Чернова Н. И. Описание: Понятное введение в теорию вероятностей, основа для изучения математической статистики. 🔗 http://www.nsu.ru/mmf/tvims/chernova/tv/tv_nsu07.pdf 12. * Математическая статистика* 👩‍🔬 Автор: Чернова Н. И. Описание: Продолжение курса по теории вероятностей (НГУ), покрывающее основы математической статистики: оценки параметров, проверка гипотез, регрессионный анализ. 🔗 http://www.nsu.ru/mmf/tvims/chernova/ms/ms_nsu07.pdf 13. * Курс дифференциального и интегрального исчисления (Том 1)* 👩‍🔬 Автор: Фихтенгольц Г. М. Описание: Фундаментальный и классический учебник по основам математического анализа. 🔗 http://math.ru/lib/book/djvu/fichtengolz/f_1.djvu 14.*Векторные исчисления для инженеров* 👩‍🔬 Автор:Jeffrey R. Chasnov 🔗 http://math.ru/lib/book/djvu/fichtengolz/f_1.djvu 15 .*Theory—Theoretical & Mathematical Foundations ; 👩‍🔬Daniel A. Roberts, Sho Yaida, Boris Hanin 🔗https://arxiv.org/abs/2106.10165 📘 Еще больше книг здесь @ai_machinelearning_big_data #books #opensource #freebooks

296 347

✔️ Tesla показала суперкомпьютер Dojo. Tesla опубликовала изображения своего суперкомпьютера Dojo - системы, созданной на заказ для обучения ИИ-моделей проекта полного автономного вождения (FSD). Фото были опубликованы 17 апреля не случайно - это совпало с недавним заявлением Илона Маска о расширении крупного вычислительного кластера в Giga Texas. Dojo полностью работает на чипах, разработанных Tesla. TeslaAI в Х (ex-Twitter) ✔️ Chatbot Arena трансформируется в отдельную компанию Arena Intelligence Inc. Популярная платформа для оценки ИИ-моделей Chatbot Arena, которую используют ведущие лаборатории ИИ, официально становится компанией Arena Intelligence Inc. Это позволит команде расширить ресурсы для развития сервиса, сохранив нейтралитет тестирования. Проект, запущенный в 2023 году исследователями из UC Berkeley, давно стал ключевым инструментом для сравнения языковых моделей — его рейтинги влияют на маркетинг и развитие ИИ. До сих пор Chatbot Arena работала на грантах и спонсорской поддержке от Kaggle, Google, Andreessen Horowitz и Together AI. bloomberg.com ✔️ Anthropic инвестирует 1 млн. долларов в Goodfire. Anthropic впервые инвестировала в стартап, поддержав Goodfire. Инвестиционный раунд, возглавляемый Menlo Ventures, собрал в общей сложности 50 миллионов долларов, а Anthropic внесла 1 миллион долларов. Goodfire специализируется на механистической интерпретации - методе, который помогает разработчикам понять, как работают системы ИИ, причем методы Goodfire считается более продвинутым, чем существующие инструменты, используемые Anthropic. theinformation.com ✔️ Википедия выпустила датасет для обучения ИИ. Википедия представила структурированный датасет на платформе Kaggle, чтобы облегчить разработчикам ИИ доступ к данным и снизить нагрузку на свою инфраструктуру. Вместо парсинга сырого текста ботамы, теперь доступны JSON-файлы на английском и французском языках с разделами статей, краткими описаниями, инфобоксами и ссылками на изображения. Датасет оптимизирован для ML-задач: файнтюна моделей, анализа и тестирования. Это часть стратегии Викимедии, которая не только экономит ресурсы Википедии, но и упрощает работу с контентом — вместо борьбы с ботами разработчики получают готовый инструмент. enterprise.wikimedia.com ✔️ Количество полностью сгенерированной ИИ-музыки выросло в 2 раза на платформе Deezer. Deezer, французский музыкальный стриминговый сервис, сообщил, что около 18 % песен, загружаемых на его платформу, создаются ИИ. Этот показатель непрерывно растет: ежедневно на платформу загружается около 20 000 композиций, созданных искусственным интеллектом, что почти вдвое больше, чем 4 месяца назад. Deezer внедрил инструмент обнаружения ИИ для выявления музыки, созданной с помощью Suno и Udio в январе 2025 года, когда ежедневное количество загружаемых песен, созданных ИИ, составляло около 10 000. billboard.com @ai_machinelearning_big_data #news #ai #ml

296 347

🔥 Google только что выпустил Gemini 2.5 Flash Ключевые особенности: В 25 раз дешевле, чем Claude Sonnet 3.7 и Grok-3 и в 5–10 раз дешевле, чем Gemini‑2.5‑Pro Новая функция динамического «размышления» над сложными задачами. Настраиваемый «бюджет мышления» (вы сами решаете, сколько токенов выделить на этап «размышлений») Занимает #2, место на Арене, сравнявшись с GPT 4.5 Preview и Grok‑3. 🏆 Разделил первое место в задачах Hard Prompts, Coding и Longer Query 💠 Вошёл в топ‑4 по всем категориям @ai_machinelearning_big_data #Gemini

296 347

🔥 Wan2.1‑FLF2V 14B — это первая в серии модель, которая работает генерации видео по принципу «First‑Last‑Frame»: достаточно задать начальный и конечный кадры, чтобы сгенерировать полноценный плавный плавный ролик. ✔️ Главное 🟢 Открытые код и веса. 🟢Полный контроль над сюжетом и композицией видео. 🟢 Точное следование инструкциям: модель умеет очень чётко. «понимать» промпты и визуальные референсы. 🟢Плавные переходы с учётом физики: кадры переходят друг в друга без рывков, с реалистичной трактовкой законов движения и освещения. 🟢 Качество 720 p: готовый не требует дополнительной пост‑обработки. 🔜GitHub: https://github.com/Wan-Video/Wan2.1 🔜Hugging Face: https://huggingface.co/Wan-AI/Wan2.1-FLF2V-14B-720P 🔜Modelscope: https://modelscope.cn/models/Wan-AI/Wan2.1-FLF2V-14B-720P @ai_machinelearning_big_data #wan #AIGC #alart

296 347

Cloud․ru представил первый в России управляемый сервис для инференса больших языковых моделей в облаке с разделением GPU Главные преимущества:

1️⃣ Shared GPU — вы можете разделять GPU-ресурсы и потреблять то количество vRAM (видеопамяти), которое необходимо для эффективной работы самой модели без задержек. Можно динамически перераспределять ресурсы в зависимости от текущих потребностей. 2️⃣ Простота и гибкость управления сервисом дают возможность, как запускать модели как напрямую из Hugging Face, так и запускать собственные образы со своим окружением. 3️⃣ Высокая степень адаптации и рациональное использование доступных ресурсов: на одной видеокарте можно одновременно запускать несколько моделей. 4️⃣ Режим скайлирования — тарификация за использование модели начинается только в момент обращения к ней.

Evolution ML Inference подойдет для тех, кто разрабатывает AI- и ML-решения и хочет быстро и с минимальными затратами запустить собственную ML-модель. Это полностью управляемый сервис — пользователь только настраивает конфигурацию, модель и тип масштабирования. Cloud․ru предоставляет доступ к мощным графическим процессорам, а также выполняет полное администрирование и обслуживание инфраструктуры.

296 347

🌟 FramePack — этоFramePack — это надстройка над любым «next‑frame prediction» видеодиффузором, которая превращает работу с длинными роликами в задачу постоянной, а не растущей стоимости Модель поэтапно предсказывает следующий кадр или блок кадров, обеспечивая плавную и контролируемую генерацию. FramePack позволяет создавать видео длиной 60 секунд+ Вместо того чтобы хранить полный контекст, он выделяет каждому кадру разное число патч‑токенов и держит их общее количество фиксированным. Благодаря этому вычислительная нагрузка остаётся O(1) по длине ролика, а значит даже 13‑B модель может генерировать тысячи кадров на обычной GPU. Выбор, каким кадрам сколько «места» выделять, задаётся расписанием (FramePack Scheduling): линейное, экспоненциальное, равномерное или кастомное. Меняя его, можно, например, сделать первый кадр самым детальным для задач image‑to‑video или отдавать приоритет последним. Дополнительно двусторонняя sampling‑схема (способ генерации кадров, при котором модель смотрит не только «в прошлое», но и в будущее, чередуя прямой и обратный проходы по временной оси.) уменьшает накопление ошибок, поэтому качество не падает даже на минутных видео. 🔥Особенности: 🟢Заявленный минимальный объём GPU: всего 6 GB для генерации 1‑минутного видео @30 fps (1800 кадров) на 13 B модели, что позволяет запускать её даже на ноутбучных GPU .🟢Скорость генерации (RTX 4090): ~2.5 с/кадр без оптимизаций ~1.5 с/кадр с TeaCache 🟢Контекст фиксированной длины: накладные расходы (память и время) не растут при увеличении числа кадров — сложность остаётся O(1) по длине видео. Эти метрики делают FramePack одним из самых практичных решений для генерации видео даже на слабом железе. 🔜Project Page：https://lllyasviel.github.io/frame_pack_gitpage/ 🔜Paper：https://lllyasviel.github.io/frame_pack_gitpage/pack.pdf 🔜Code：https://github.com/lllyasviel/FramePack @ai_machinelearning_big_data

296 347

🌟 FramePack — генерация видео по кадрам с моментальной визуализацией FramePack — это свежая реализация next-frame prediction, позволяющая создавать длинные видео (до 60 секунд и больше) с мгновенной обратной связью. Модель поэтапно предсказывает следующий кадр или блок кадров, обеспечивая плавную и контролируемую генерацию. 🧠 Особенности: • Видео как картинки — результат видно сразу • Большие модели работают даже на 6 GB GPU • Контекст фиксированной длины, скорость не падает • Поддержка Flash/xFormers/SageAttention 🚀 Поддержка GUI на Gradio. Можно быстро протестировать свои промпты или использовать встроенные пресеты. 🔜Project Page：https://lllyasviel.github.io/frame_pack_gitpage/ 🔜Paper：https://lllyasviel.github.io/frame_pack_gitpage/pack.pdf 🔜Code：https://github.com/lllyasviel/FramePack @ai_machinelearning_big_data

296 347

🔥 ArXiv MCP Server arxiv‑mcp‑server — это MCP‑сервер (открытый протокол Anthropic для обмена сообщениями и инструментами между LLM‑клиентом и сервером.), который «оборачивает» arXiv.org в набор инструментов, доступных ИИ‑ассистентам (Claude Desktop, ChatGPT‑плагины, собственные агентовые фреймворки). Благодаря этому ассистент может искать, скачивать и читать научные статьи, а также запускать готовые промпты для глубокого анализа работы, все в одном чате. Ключевые возможности - Поиск статей search_papers — фильтры по запросу, диапазону дат, категориям. 🟢 Загрузка статьи download_paper — хранит PDF/метаданные локально, чтобы не дергать arXiv повторно. 🟢Список локальных статей list_papers. 🟢Чтение содержимого read_paper — отдаёт текст постранично. 🟢Готовые исследовательские промпты — например, deep-paper-analysis, который строит полное ревью (summary, методология, импликации, дальнейшая работа и т.д.). 🌟 Установка: Для установки и запуска сервера можно использовать следующие команды:


git clone https://github.com/blazickjp/arxiv-mcp-server.git
cd arxiv-mcp-server
uv venv
source .venv/bin/activate
uv pip install -e ".[test]"
python -m arxiv_mcp_server

🔜 Github #arXiv #llm #mcp

296 347

🤖 Ты Дата инженер? Мечтаешь, чтобы твоя работа по-настоящему влияла на будущее? 😎 В Navio мы делаем это возможным. В команде BigData мы разрабатываем уникальную технологию автономного вождения. Наши данные имеют реальный физический смысл — это километры пути и секунды времени. Наши задачи – вызов: как обработать 10⁹ строк за 15 минут, как оценить качество траектории и предотвратить возможную аварию? Каждый оптимизированный датасет – это шаг к будущему без ДТП. Хочешь к нам? Приходи на One Day Offer 26 апреля! На онлайн-мероприятии ты пройдёшь все этапы отбора, познакомишься с командой и, если всё сложится, получишь предложение о работе уже вечером. 📈 Оставляй заявку и резюме на сайте, и наш рекрутер свяжется с тобой. Построим будущее вместе!

296 347

✔️ OpenAI ведет переговоры о приобретении Windsurf. OpenAI ведет переговоры о приобретении компании Windsurf, ИИ-инструмента для программирования, ранее известного как Codeium, за 3 млрд. долларов. Если сделка будет завершена, это станет крупнейшей покупкой для OpenAI на сегодняшний день и укрепит ее позиции на конкурентном рынке ИИ-кодинга. bloomberg.com ✔️ Microsoft опубликовала веса крупнейшей 1-битной модели. Microsoft представила BitNet b1.58 2B4T — модель с квантованием весов до трех значений (-1, 0, 1). Она может работать на CPU и доступна на HuggingFace под MIT-лицензией. Это первая модель такого типа с 2 млрд. параметров, обученная на 4 трлн. токенов (примерно 33 млн книг). По заявлению разработчиков, BitNet превосходит модели Lllama, Google и Alibaba в тестах на решение математических задач (GSM8K) и проверку логики (PIQA). При этом скорость инференса вдвое выше, а память расходуется экономнее. Но есть нюанс: для работы требуется фреймворк bitnet.cpp, который пока не поддерживает GPU. techcrunch.com ✔️ Huawei презентовала серверную ИИ-систему CloudMatrix. Huawei представила новую стоечную систему AI CloudMatrix 384, которая должна конкурировать с GB200 NVL72 от Nvidia. Хотя CloudMatrix 384 менее энергоэффективна, а ее производительность в 2,6 раза ниже в показателе FLOP на ватт, это не считается ограничивающим фактором в Китае, поскольку страна располагает достаточными энергетическими ресурсами. Система использует ускоритель Huawei Ascend 910C AI и позиционируется как мощное внутреннее решение в китайском технологическом ландшафте. Появление CloudMatrix 384 - результат продолжающейся технологической войны между США и Китаем. scmp.com ✔️ Дрон, управляемый ИИ впервые победил чемпионов-людей в гоночных соревнованиях. Автономный дрон от Делфтского университета выиграл чемпионат A2RL, а затем в напряжённом турнире одолел 3 экс-чемпионов DCL, развив скорость до 95,8 км/ч на сложной трассе. Ключевым аспектом победы стала нейросеть, которая управляла моторами напрямую, минуя традиционные контроллеры. Технология, которая была разработана ESA для космических аппаратов, позволила дрону работать с ограниченными ресурсами — всего одна камера и минимум вычислений. Как и люди, ИИ учился методом проб и ошибок, что помогло приблизиться к физическим пределам системы. techxplore.com ✔️ MIT разработал метод машинного обучения для решения сложных логистических задач. Исследователи MIT разработали метод L-RHO, объединяющий машинное обучение с традиционными методами оптимизации в задачах планирования. Система учится «замораживать» повторяющиеся переменные в подзадачах, сокращая время решения на 54% и повышая качество результатов до 21%. Технология анализирует данные предыдущих решений, выделяя элементы, которые не требуют пересчёта. Оставшиеся переменные обрабатываются стандартным решателем, ускоряя процесс без потери точности. Метод уже проверен на реальных сценариях, включая сбои оборудования и перегрузки, показав стабильную эффективность. L-RHO адаптивен к изменяющимся условиям: от расписания поездов до планирования медперсонала. В планах — интеграция метода в задачи управления запасами и маршрутизацией транспорта. news.mit.edu @ai_machinelearning_big_data #news #ai #ml

296 347

🔥 Mistral только что представили Classifier Factory Classifier Factory — это интуитивно понятный конвейер для создания и обучения собственных моделей классификации на базе компактных LLM от Mistral AI. С его помощью — как через веб‑интерфейс La Plateforme, так и через API — можно быстро разворачивать решения для модерации контента, детекции намерений, анализа тональности, кластеризации данных, обнаружения мошенничества, фильтрации спама, рекомендательных систем и других задач Таким образом, Classifier Factory упрощает весь цикл работы с custom‑классификаторами: от подготовки данных до развёртывания готовой модели в продакшене. Еще они обнвоили доку. 🔜 Docs 🔜Colab @ai_machinelearning_big_data #Mistral #api

296 347

🚀 Codex CLI "Модели o3 и o4-mini настолько сильны в программировании, что мы решили упростить их использование и выпустить новый продукт"" — Codex CLI - написал в своем аккаунт Альтман 💻 Codex CLI — это мощный программирующий агент, который работает локально на вашем компьютере. 🌟 Полностью open source и уже доступен для скачивания! https://github.com/openai/codex @ai_machinelearning_big_data #AI #OpenSource #CodexCLI #Coding #LLM #DevTools

296 347

🖥 OpenAi представлют новые модели o3 и o3 mini Трансляция: https://www.youtube.com/watch?v=sq8GBPUb3rk @ai_machinelearning_big_data #openai

296 347

🔥 ReZero — маленькая модель, которая никогда не сдаётся 🧠 ReZero — это LLM на базе Llama 3.2B, обученная не просто находить ответы, а упорно искать лучший. 🔁 Вместо того чтобы оптимизировать на скорость или recall, ReZero обучается пробовать снова и снова, пока не найдёт правильный ответ. Модель намеренно поощряется за настойчивость — если она делает retry и улучшает результат, это считается успехом. Использует синтетические поисковые движки, которые заставляют модель перезапрашивать и улучшать свои ответы. Обучается с помощью усиленного обучения (RL) — формируя привычку "не сдаваться". 🔜Github 🔜 Модель @ai_machinelearning_big_data #LLM #Search #RL #AI #Meta #ReZero #NeverGiveUp #Llama3

296 347

🌟Демис Хассабис попал на обложку Times и вошел в TIME100 самых влиятельных людей 2025 года TIME включил Демиса Хассабиса, генерального директора Google DeepMind, в список 100 самых влиятельных людей мира в 2025 году. Это признание его выдающегося вклада в развитие искусственного интеллекта и науки. В 2024 году Хассабис был удостоен Нобелевской премии по химии за создание AlphaFold — ИИ-системы, способной предсказывать структуру белков, что значительно ускорило научные исследования в области медицины и биологии. Однако Хассабис не останавливается на достигнутом. Он активно работает над созданием AGI, который сможет решать сложнейшие задачи, такие как борьба с болезнями, изменение климата и дефицит ресурсов. Хассабис считает, что AGI может быть разработан в течение ближайших 5–10 лет. Time Тем не менее, он осознаёт риски, связанные с развитием AGI, включая возможные угрозы демократии и потенциальное использование технологий в военных целях. Хассабис призывает к международному сотрудничеству и созданию надёжных механизмов безопасности для обеспечения того, чтобы AGI служил на благо человечества. Time 🔜 Подробнее об этом можно прочитать в статье TIME: Demis Hassabis Is Preparing for AI's Endgame @ai_machinelearning_big_data #AI #AGI #DeepMind #DemisHassabis #TIME100 #Наука #Технологии

296 347

🔥 FireEdit — новая методика редактирования изображений по инструкции 🌟 В основе FireEdit — усовершенствованная Vision Language Model (VLM), способная выполнять тонкое и точное редактирование изображений на основе текстовых промптов. 🌟 Что внутри: 🟢Region Tokens Позволяют VLM точно определять редактируемые объекты даже в сложных сценах, не затрагивая остальное изображение. 🟢Time-Aware Target Injection Динамически регулирует степень редактирования на разных этапах шумоподавления, интегрируя информацию о времени с текстовыми эмбеддингами. 🟢Hybrid Visual Cross-Attention Позволяет сохранить высокочастотные визуальные детали и семантическую согласованность изображения. ✔️Результаты FireEdit превосходит другие SOTA-методы на датасете Emu Edit — как по точности локализации, так и по качеству результата. ✔️ Визуальные сравнения показывают, что FireEdit: 🟢Лучше локализует редактируемые области 🟢Меньше искажает фон и окружающие детали 🟢Сохраняет высокую семантическую точность 🔜 Статья 🔜Проект @ai_machinelearning_big_data #AI #VLM #Diffusion #ImageEditing #FireEdit #ML

296 347

VK Видео Meetup: заглянем под капот видеосервиса №1 в стране! VK приглашает обсудить стриминг, видеотехнологии и хайлоад на митапе для разработчиков. Топ-менеджеры поделятся инсайдами о развитии продукта сегодня и завтра. А техлиды VK Видео расскажут, как устроена единая видеоплатформа, лежащая в основе сервиса, и что за лаборатория замеряет эффективность адаптивного стриминга. Будет интересно бэкендерам, мобильным разработчикам и ML-инженерам. 📍 Москва, Ленинградский проспект, 39, БЦ Skylight, Б1. Для всех, кто не сможет прийти, будет онлайн-трансляция. Регистрация на сайте митапа.

296 347

✔️ OpenAI разрабатывает собственную соцсеть По данным нескольких источников, OpenAI работает над собственной социальной платформой. Внутренний прототип уже существует — он включает социальную ленту с генерацией изображений от ChatGPT. Сэм Альтман также собирает обратную связь от внешних тестировщиков. Собственная соцсеть даст OpenAI прямой доступ к реальным пользовательским данным — как у X, которые используют их для обучения своих ИИ. Один из мотиваторов — интеграция Grok в X, с которой пользователи создают вирусный контент прямо в реальном времени. ✔️ Groq запускает ИИ-систему Compound Beta с функциями поиска в Интернете и выполнения кода. Groq объявила о предварительном запуске Compound Beta, своей первой системы искусственного интеллекта, размещенной на GroqCloud. Она позволяет пользователям осуществлять поиск в Интернете и выполнять программный код. Система предназначена для разработки агентов с расширенным функционалом и ее хвалят бета-тестеры, получившие ранний доступ. Попробовать Compound Beta можно в Groq Console. Groq в X (ex-Twitter) ✔️ Anthropic анонсировала голосовой режим для Claude и интеграцию с Google Workspace. Anthropic анонсировала 2 обновления для Claude, ориентированных на корпоративных пользователей. Первое — интеграция с Google Workspace, которая позволяет Claude работать с Gmail, Google Calendar и Google Docs. Функция доступна в бета-режиме для подписчиков планов Max, Team, Enterprise и Pro. Второе — режим «Исследование», меняющий подход к поиску информации. Вместо стандартных запросов Claude автономно проводит цепочку взаимосвязанных поисков, формируя детальные ответы. Сейчас функция тестируется в США, Японии и Бразилии для планов Max, Team и Enterprise, а вскоре станет доступна и для Pro. Также Anthropic готовит голосовой режим с 3 вариантами озвучки: Airy, Mellow и Buttery. Он появится для подписчиков премиум-плана Max. bloomberg.com ✔️ Cohere выпустила Embed 4. Cohere объявила о релизе Embed 4 — эмбединг-модели, которая упрощает поиск в сложных бизнес-документах. Технология поддерживает мультимодальность: анализирует текст, изображения, графики и рукописные заметки, избавляя компании от ручной обработки данных. Модель работает с документами до 128 тыс. токенов (это примерно 200 страниц) и понимает 100+ языков. Embed 4 также оптимизирована для регулируемых отраслей: в финансах она анализирует отчеты, в здравоохранении — медицинские карты, а в производстве — спецификации. Embed 4 уже доступна на платформах Cohere, Azure AI Foundry и Amazon SageMaker. cohere.com ✔️ OpenAI обновила Preparedness Framework и вводит трехкомпонентный режим инцидентов ИИ. OpenAI внесла существенные изменения в свою систему Preparedness Framework, предназначенную для отслеживания и подготовки к продвинутым возможностям ИИ, которые могут привести к серьезному ущербу. В результате пересмотра была исключена категория убеждения и введен новый мониторинг рисков, связанных с самовоспроизведением и "sandbagging". Обновленная структура поясняет, как OpenAI классифицирует риски ИИ на основе определенных критериев, подчеркивая, что риски должны быть правдоподобными, измеримыми, серьезными, новыми и либо мгновенными, либо неустранимыми. openai.com ✔️ Adobe инвестирует в ИИ-стартап Synthesia. Adobe Ventures сделала стратегическую инвестицию в Synthesia, британский стартап, разрабатывающий ИИ-аватары для корпоративных видео. Решение последовало после того, как компания преодолела отметку в $100 млн годовой выручки. Synthesia позволяет создавать реалистичные видео с цифровыми персонажами (готовыми или записанными с реальных людей). Платформа уже используется 60 тыс. компаний, включая 70% из Fortune 100, для обучения, маркетинга и коммуникаций. Synthesia планирует развивать новые продукты — AI-ассистент для видео, мультиязыковой дубляж, кастомизируемые аватары и готовит платформу Synthesia 2.0 для масштабируемых решений. С поддержкой Adobe и растущей клиентской базой стартап намерен перейти от экспериментов с ИИ к устойчивому бизнесу. maginative.com @ai_machinelearning_big_data #news #ai #ml

296 347

🌟 Cемейство гибридных моделей Nemotron-H от NVIDIA. NVIDIA выпустила новое семейство языковых моделей Nemotron-H, сочетающих архитектуры Mamba и Transformer. Эти гибриды обещают до 3х ускорения инференса по сравнению с чистыми Transformer-моделями аналогичного размера (Qwen или Llama). Семейство поддерживает английский, немецкий, испанский, французский, итальянский, корейский, португальский, русский, японский и китайский языки. Основной фокус Nemotron-H — баланс между эффективностью и интеллектом: даже при меньшем числе параметров (47–56 млрд.) модели демонстрируют точность, близкую к DeepSeek-V3-671B. Особенность Nemotron-H — использование FP8 для претрейна. 56B-версию обучали на 20 трлн. токенов с квантованием тензоров «на лету», а сжатую в FP4 модель c 47B можно запускать на потребительской RTX 5090 с поддержкой контекста до 1 млн. токенов. Правда, пришлось пожертвовать частью слоев самовнимания — их заменили на более легкие Mamba-блоки, чтобы ускорить генерацию. NVIDIA не стала тренировать компактные версии модели с нуля. Вместо этого использовали дистилляцию: 47B-модель получили из 56B, удалив половину «тяжелых» слоев и дообучив на 63 млрд токенов. Результат — почти та же точность, но на 1.2x быстрее. В бенчмарках Nemotron-H обходит конкурентов в математике и коде: на GSM8k 56B-версия дает 93.7% против 90.9% у Qwen-72B. А 8B-модель, хоть и уступает в MMLU, вырывается вперёд в HumanEval+ (56.1%) — ожидаемо, с учетом ее instruct-оптимизации. Пока модели доступны на HF как базовые, но NVIDIA обещает добавить инструктивные и мультимодальные версии. ▶️В опенсорсный релиз были выпушены чекпоинты с контекстом 8 тыс. токенов: 🟢Nemotron-H-56B-Base-8K 🟢Nemotron-H-47B-Base-8K 🟢Nemotron-H-8B-Base-8K 📌 Лицензирование: NVIDIA Internal Scientific Research and Development Model License. 🟡Страница проекта 🟡Коллекция на HF 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #NemotronH #NVIDIA

296 347

Мы слишком много знаем! И просто обязаны этим поделиться. За 5 лет существования школы karpovꓸcourses мы обучили более 95 000 человек, и 80% наших выпускников уже работают в VK, Яндексе, Авито и других известных компаниях. И мы решили сделать для вас Karpov.Conf — чтобы поделиться знаниями не только с нашими студентами, но и с каждым, кто интересуется аналитикой данных и другими направлениями Data Science. Будем обсуждать особенности работы с Power BI и практическое применение ML-моделей в крупных компаниях, разберем пользовательский опыт и реализацию аналитики на базе Yagpt, узнаем, как дерево метрик помогает принимать решения, и какие ошибки совершают крупные компании в контексте аналитики. Мы собрали действительно звездный состав спикеров, мы очень старались сделать это мероприятие максимально полезным — вам осталось только не пропустить его! Регистрируйтесь на KARPOV.CONF 2025 — включите Data-driven на полную!