Математика Дата саентиста

Kanalga Telegram’da o‘tish

@workakkk - админ @data_analysis_ml - ds https://gosuslugi.ru/snet/67b55bb01a1c5a6fb6ecc946

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya47 221 Texnologiyalar & Aralashmalar9 161...

📈 Telegram kanali Математика Дата саентиста analitikasi

Математика Дата саентиста (@data_math) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 14 052 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 9 161-o'rinni va Rossiya mintaqasida 47 221-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 14 052 obunachiga ega bo‘ldi.

24 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -34 ga, so‘nggi 24 soatda esa -3 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 16.43% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.48% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 2 309 marta ko‘riladi; birinchi sutkada odatda 910 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 33 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, программирование, параметр, визуализация, stepik kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“@workakkk - админ @data_analysis_ml - ds https://gosuslugi.ru/snet/67b55bb01a1c5a6fb6ecc946”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 25 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

14 052

Obunachilar

-324 soatlar

+17 kunlar

-3430 kunlar

2 309

Post ko'rishlar

~ 91024 soatlar

~ 1 11048 soatlar

16.43%

Muloqot nisbati

Ma'lumot yo'q

Kuniga postlar

Ads index

beta

Postlar arxiv

14 052

🌟 DeepMath-103K — датасет для прокачки LLM в продвинутой математике DeepMath-103K — это новый мощный набор задач для обучения больших языковых моделей (LLMs) математическому рассуждению на высоком уровне сложности с помощью reinforcement learning (RL). 📦 Что в наборе? 103 000+ задач уровня сложности 5–9 (от среднего до продвинутого уровня). Каждая задача включает: 📌 Верифицируемый ответ — важно для обучения с подкреплением. 🧪 3 решения, сгенерированных моделью R1 — для обучения с учителем или дистилляции. Полная очистка от утечек данных (decontaminated) — можно безопасно использовать на бенчмарках. 📊 Почему это важно? Модели, обученные на DeepMath-103K, показывают существенный прирост точности на сложных математических задачах и бенчмарках (MATH, GSM8K, MiniF2F и др.). 🛠 Применение: Fine-tuning моделей (например, GPT, LLaMA) для математического reasoning. RLHF (reinforcement learning with human feedback) и self-improvement. Дистилляция сильных моделей в более компактные. 🔜PAPER: https://arxiv.org/abs/2504.11456 🔜CODE: https://github.com/zwhe99/DeepMath 🔜 SET: https://huggingface.co/datasets/zwhe99/DeepMath-103K @data_math

14 052

Repost from Machinelearning

🔥 Короткое видео от Hunyuan, которое объясняет архитектуру гибридного трансформера Mamba, лежащего в основе моделей Hunyuan T1 и Turbo S. 🔜 Оригинал #mamba #Hunyuan

14 052

Присоединяйтесь к дискуссии — задавайте свои вопросы в комментариях к посту Рекламодатель БАНК ВТБ (ПАО), ИНН 7702070139, Генеральная лицензия банка России №1000. Реклама, erid: 2SDnjf11Zk8. 0+ https://t.me/Data_fusion/152

14 052

Theory—Theoretical & Mathematical Foundations 📓 Book @data_math

14 052

Repost from Machinelearning

🌟 Kimi-VL: VLM с MoE, ризонингом и контекстом 128K. Moonshot AI опубликовала веса Kimi-VL — открытой VLM, которая объединяет обработку текста, изображений и видео. Благодаря архитектуре MoE модель активирует всего 2.8 млрд. параметров в языковом декодере, обеспечивая скорость, сопоставимую с компактными аналогами, и результативность флагманских решений. Главное преимущество Kimi-VL — способность анализировать длинные контексты до 128 тыс. токенов, что делает её идеальной для работы с объемными документами, длинными видео или сложными мультимедийными задачами. Основу модели составляет визуальный энкодер MoonViT, оптимизированный для нативной обработки изображений любого разрешения без необходимости разбивать их на части. Это позволяет точно распознавать текст, графики или UI-интерфейсы даже в высокодетализированных скриншотах. Например, на бенчмарке InfoVQA модель показывает точность 83.2%, обходя даже GPT-4o. В задачах OCR Kimi-VL достигает 86.7% на OCRBench, что ставит её в ряд лучших в индустрии. Разработчики также представили Kimi-VL-Thinking — версию с расширенными возможностями CoT. Благодаря использованным RL и длительному CoT-тюнингу она демонстрирует впечатляющие результаты в математических и академических задачах: на MathVista точность составила 71.3%, а на MMMU — до 61.7%, что лучше, чем у Gemma-3-12B-IT. В тестах Kimi-VL превосходит конкурентов в работе с агентами: на OSWorld её результат 8.22% выше, чем у GPT-4o (5.03%), а на WindowsAgentArena — 10.4%. Для длинных видео модель набирает 64.5% на LongVideoBench, подтверждая способность анализировать часовые записи без потери ключевых деталей. Модели доступны на Hugging Face в двух вариантах: 🟢Kimi-VL-A3B-Instruct для стандартных задач; 🟠Kimi-VL-Thinking для сложных рассуждений. ▶️ Инференс через Transformers занимает несколько строк кода — достаточно загрузить изображение, задать запрос и получить подробный ответ. 📌Лицензирование: MIT License. 🟡Набор моделей 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI #ML #VLM #KimiAI #MoonShotAI

14 052

Data Fusion 2025 — место встречи тех, кто работает с данными, ИИ и машинным обучением ⌛️Уже 16 и 17 апреля в Москве пройдет масштабная конференция, посвященная последним трендам в мире данных и ИИ. 70+ сессий и 250+ спикеров поделятся реальными кейсами и передовыми исследованиями, которые будут двигать индустрию. В программе: 📊 Сессия о промышленных данных: как развивается инфраструктура их обмена в России, примеры сбора, обработки и вопросы безопасности. 🧠 Жаркие дебаты: Сколько данных осталось до предела? Обсудим, что мешает нам работать с данными на полную мощность. 🎬 Эксклюзивный показ фильма «Влюбленные в математику» Александра Гасникова — о том, как развивается наука прямо сейчас. 🔗Полная программа конференции Хотите узнать, какие DS-решения эффективны для бизнеса и государства? Тогда переходите прямо сейчас, регистрация закроется уже завтра — https://data-fusion.ru/. 📌16-17 апреля, Москва, технопарк «Ломоносов». Участие бесплатное. Мы заботимся о безопасности участников на мероприятии, поэтому для доступа на конференцию просим заполнить развернутую онлайн-форму. Благодарим за понимание. – *DS — Data Science — наука о данных

14 052

Repost from Machinelearning

✔️ Релиз весов HiDream-I1: 17B параметров и превосходство над GPT-4o по качеству генерации изображений. HiDream-I1 - генеративная модель text-to-imаge, разработанная китайской компанией HiDream, которая работает под брендом vivagoAI. Модель получила 17 млрд. параметров и показывает высочайшее качество генерации изображений в фотореализме, анимационном и художественном стилях. Представлено 3 версии модели: Dev, Full и Fast. Модель выпущена под лицензией MIT и уже заняла 1 место в GenAI-бенчмарках, обогнав предыдущего лидера, GPT-4o. 🟡Попробовать 🟡Github 🟡HidreamAi в X (ex-Twitter) @ai_machinelearning_big_data #news #ai #ml #HiDream #AImodel

14 052

Сейчас информация для тех, кто еще учится в вузе Мы собрали большое комьюнити умных и образованных людей, среди которых точно есть те, кому нравится обучать точным наукам и программированию. И на своём опыте знаю, чего стоит поиск учеников, особенно если нет ресурсов, какими обладают онлайн-школы. А так как я придерживаюсь стратегии win-win, с радостью готов поделиться ресурсом, который поможет вам найти учеников уже сейчас: Последний в этом году 3-х дневный концентрат от репетитора и студента факультета компьютерных наук из ВШЭ За 5 лет репетиторства он разработал систему, которой пользуются все начинающие репетиторы, а действующие с её помощью сокращают время работы и увеличивают доход. Его советам точно можно доверять. Не упустите эту возможность учиться у лучших в своем деле. УЧАСТВОВАТЬ

14 052

🧮 Модели решают математику… но не совсем Исследователи предложили новый бенчмарк — MATH-Perturb, чтобы проверить: языковые модели действительно "умеют" решать задачи по математике или просто запоминают шаблоны? 📌 Что сделали: Они взяли 279 самых сложных задач из датасета MATH (уровень 5) и создали две версии для каждой: MATH-P-Simple — простая пертурбация (вопрос формулируется иначе, но суть и метод решения не меняется). MATH-P-Hard — сложная пертурбация (незаметное изменение, которое требует другого метода решения и более глубокого понимания). 🧠 Что показали тесты: Модели легко решают оригинальные и "простые" пертурбированные задачи — даже если используют "шорткат-решения" (по сути, угадывают по шаблону). Но на сложных пертурбациях они резко проваливаются. Шорткат больше не работает, и модель теряется. 📊 Вывод: Многие языковые модели, включая самые продвинутые, не понимают математику в глубоком смысле. Они подбирают шаблон, а не рассуждают. MATH-Perturb — отличный способ отделить память от мышления. 🔗 Подробнее: https://arxiv.org/abs/2404.01649 🔗 Бенчмарк: https://math-perturb.github.io/ @data_math

14 052

Растите сильную команду. Топ-5 курсов Яндекс Практикума для IT 👾 Технологии меняются каждый день — проверено Яндексом. Мы ощущаем перемены на своих проектах. Постоянные вызовы, новые инструменты, штормы на рынках. Знаем, как важно, чтобы команда быстро развивалась и адаптировалась к изменениям. Поэтому создаём актуальное обучение, которое соответствует реальным задачам IT-сферы. Нам доверяют: 5000+ компаний уже обучили 36 000+ сотрудников в Яндекс Практикуме. 👉 Вот топ-5 курсов, которые выбирали компании для развития IT-команд в 2025 году: — SQL для работы с данными и аналитики — DevOps для эксплуатации и разработки — Python-разработчик — Архитектура программного обеспечения — Управление командой разработки — Навыки аргументации 👉Подобрать курс Реклама, АНО ДПО “Образовательные технологии Яндекса”, ИНН 7704282033, erid: 2VtzqwTEKDb

14 052

🔥 Математический анализ для решения физических задач М. А. Шубин Материал основананный на лекциях, дважды прочитанных автором в Красноярской краевой летней школе по естественным наукам школьникам В нем кратко объясняются основные понятия математического анализа (производная и интеграл) и даются простейшие приложения к физическимзадачам, основанные на составлении и решении дифференциальных уравнений. Материал рассчитанана широкий круг читателей: школьников, студентов, учителей.

14 052

Model Context Protocol – незаменимый инструмент для ML-соревнований, где нужно использовать всю мощь LLM. С помощью нового стандарта подключения AI-ассистентов к бизнес-приложениям от Anthropic ты сможешь интегрировать ИИ в свой проект – идеальное решение для хакатона, где время ограничено. В новой статье разбираемся, как устроен протокол, как поднять собственный MCP-сервер и использовать его в IT-соревнованиях. Ты узнаешь про: 🔤 Архитектуру Model Context Protocol. 🔤 Основные возможности стандарта. 🔤 Примеры реализации: от простых к сложным. Сосредоточься на создании уникального AI-ассистента. Как это сделать? Ответ в статье: https://cnrlink.com/mcpitonecupdatamath А проверить всю мощь MCP можно на IT_ONE Cup. ML Challenge. Зарегистрируйся, выбери один из трех треков и раздели призовой фонд в 1 500 000 рублей. MCP станет одним из важных инструментов для разработки ИИ-помощников в задачах соревнования: 🔤 Динамические контекстные подсказки для системного аналитика. 🔤 AI-генератор дизайн-макетов по описанию требований. 🔤 Система визуализации BPMN-диаграмм. MCP позволит использовать локальные модели, которые сделают решения более автономными и безопасными – их будет легче адаптировать под задачи соревнования. Регистрация открыта до 13 апреля включительно: https://cnrlink.com/itonecupmldatamathmcp

14 052

📚 «Линейная алгебра» Вторая лучшая книга по линейной алгебре с ~1000 практических задач. Идеально для ИИ и машинного обучения. Книга полностью бесплатна . Прекрасно подходит для новичков. 📌 Книга @data_math

14 052

Repost from Machinelearning

🔥 Hugging Face выпустила версию 0.30.0 библиотеки huggingface_hub - это самое крупное обновление за два года! Представлены значительные улучшения, особенно в области хранения и обработки больших моделей и датасетов. ✔️ Основные нововведения: Интеграция с Xet: Внедрена поддержка Xet — передового протокола для хранения крупных объектов в Git-репозиториях, призванного заменить Git LFS. В отличие от LFS, который выполняет дедупликацию на уровне файлов, Xet работает на уровне фрагментов данных, что особенно полезно для специалистов, работающих с массивными моделями и датасетами. Для интеграции с Python используется пакет xet-core, написанный на Rust, который обрабатывает все низкоуровневые детали. Чтобы начать использовать Xet, установите дополнительную зависимость: pip install -U huggingface_hub[hf_xet] После установки вы сможете загружать файлы из репозиториев, поддерживающих Xet. Доплнительно: 😶 Расширен InferenceClient: 😶 Добавлена поддержка новых провайдеров для инференса: Cerebras и Cohere. 😶 Внедрены асинхронные вызовы для задач инференса (например, text-to-video), что повышает стабильность и удобство работы. 😶 Улучшен CLI 😶 Команда huggingface-cli upload теперь поддерживает wildcards (шаблоны) прямо в пути к файлам (например, huggingface-cli upload my-model *.safetensors вместо опции --include). 😶 Команда huggingface-cli delete-cache получила опцию --sort для сортировки кэшированных репозиториев (например, по размеру: --sort=size). ✔️ Полный список обновлений ✔️Блог ✔️Документация по Xet @ai_machinelearning_big_data #huggingface #release #xet

14 052

🚀Прими участие в ML Cup 2025 от Авито и выиграй 1,2 миллиона рублей! Ты — специалист в области машинного обучения? Хочешь проверить свои силы в реальных задачах, с которыми ежедневно сталкиваются 1000+ специалистов Авито? Тогда не упусти шанс стать частью крупнейшего соревнования в этой области! Что тебя ждет: ☑️Денежный призовой фонд ☑️Автоматизированная оценка решений ☑️2 практические задачи: 1️⃣Персональные рекомендации — предскажи, какие товары вызовут интерес у миллионов пользователей → ссылка на регистрацию. 2️⃣Поиск дублей — как с помощью CV находить похожие объявления даже при разных текстах и ракурсах фото → ссылка на регистрацию. Выбирай одну или обе задачи, показывай лучшие результаты и получай шанс на победу! Участвовать можно как индивидуально, так и в команде до 4 человек. Загружай до 5 решений в день. Регистрация уже открыта! Подробности и анкета по ссылкам выше.

14 052

Mathematics for Computer Science Бесплатный учебник от CRC Press объемом 547 страниц. 📚 Книга @data_math

14 052

⚡️ Это увлекательный интерактивный гайд, объясняющий интуицию, лежащую в основе гауссовых процессов. Гауссовские процессы позволяют построить распределение функций с непрерывной областью определения. 🔗 Гайд @data_math

14 052

Как ИИ помогает компаниям принимать умные решения и развивать разные индустрии? 15-16 апреля пройдет Весенний онлайн-лекторий, посвященный влиянию ИИ на индустрии. Разберемся в технологиях вместе с ФКН НИУ ВШЭ, Яндекс, Сбер, Авито, МТС и другими лидерами рынка. Программа Лектория обширна: — Вебинары про ИИ и ML в банках, бигтехе и e-com — Мастер-классы и кейсы по Data Science, Data Analytics и Data Engineering — Круглый стол по разработке и применению ИИ-агентов — Прожарка резюме и карьерная лекция Вы сможете разобраться в ключевых трендах и возможностях в IT, а также погрузиться в Data Science, Data Analytics и Data Engineering, изучение инструментов и реальных задач каждого направления. Лекторий организуют эксперты факультета компьютерных наук НИУ ВШЭ, онлайн-магистратур ФКН и Центра непрерывного образования, а также ведущие компании индустрии. Поэтому вас ждут глубокие инсайты из мира IT. Когда: 15-16 апреля в 16:00 Где:онлайн 🔗 Зарегистрироваться Реклама: НИУ ВШЭ ИНН: 7714030726 Erid: 2SDnjcrGUXe

14 052

@data_math

14 052

Repost from Machinelearning

🤖 Modern Robotics Course: Открытый курс по современной робототехнике. Курс сочетает теорию (математика, физика) и практику (код, симуляторы), помогая разработчикам научиться создавать и программировать роботов. 🌟 Что внутри? ▪ Лекции: От основ робототехники, математики и физики до пространственных преобразований, обратной кинематике и более продвинутым концепциям . ▪ Практика: Примеры кода на Python и C++ для управления роботами. ▪Симуляторы: Интеграция с стимуляторами Gazebo и ROS ( операционная система для робото) для тестирования алгоритмов. ▪Задания: Реальные практические задачи (например, управление манипулятором робота). 🌟 Для кого? ▪ Начинающие робототехники: Освоить кинематику, динамику, управление. ▪ Программисты: Интегрировать алгоритмы в ROS, Gazebo, Python/C++. ▪ Инженеры: Возможность Научиться разрабатывать автономные системы и манипуляторы. ▪Технологические энтузиасты С курсом можно пройти путь от нуля до создания рабочего прототипа. С курсом у вас будет возможность проектировать роботов, не имея железа под рукой (через симуляторы). ✔️ Готовые решения: Внутри вы найдете библиотеки для работы с преобразованиями, датчиками, движением. ✔️Карьера в робототехнике: Курс даст возможность получить базовые навыки, востребованные в Bosch, Boston Dynamics, Tesla. ⭐️ Преимущества перед другими открытыми курсами 🟠 Акцент на практике: Минимум абстракций — максимум кода. 🟠Совместимость с ROS: Стандарт для промышленной робототехники. 🟠 Современные алгоритмы: Не только классика, но и нейросетевые подходы. ➡️ Cовет: Для погружения в курс, вам поможет книга Robotics, Vision and Control: Fundamental Algorithms in Python, Peter Corke, вот ее репозиторий с примерами кода. P.S. Для тех, кто любит формат «сделай сам»: Курс научит вас собирать робота виртуально, а потом переносить решения на реальные устройства. 🤖💡 ✔️ Github ✔️ Введение в курс #course #ai #ml #robots #education #курс #робототехника