en
Feedback
Математика Дата саентиста

Математика Дата саентиста

Open in Telegram

📈 Analytical overview of Telegram channel Математика Дата саентиста

Channel Математика Дата саентиста (@data_math) in the Russian language segment is an active participant. Currently, the community unites 14 051 subscribers, ranking 9 176 in the Technologies & Applications category and 47 233 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 14 051 subscribers.

According to the latest data from 23 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -43 over the last 30 days and by -3 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 15.43%. Within the first 24 hours after publication, content typically collects 6.54% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 2 168 views. Within the first day, a publication typically gains 919 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 32.
  • Thematic interests: Content is focused on key topics such as llm, программирование, параметр, визуализация, stepik.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
@workakkk - админ @data_analysis_ml - ds https://gosuslugi.ru/snet/67b55bb01a1c5a6fb6ecc946

Thanks to the high frequency of updates (latest data received on 24 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

14 051
Subscribers
-324 hours
+67 days
-4330 days
Posts Archive
Repost from Machinelearning
🔍 Baidu выпустила Unlimited OCR - модель для распознавания длинных документов за один проход. У модели 3B параметров, но акт
🔍 Baidu выпустила Unlimited OCR - модель для распознавания длинных документов за один проход. У модели 3B параметров, но активируются только 500M. При этом она показывает новые SOTA-результаты на OmniDocBench v1.5 и v1.6. Главная фишка - Reference Sliding Window Attention. Модель держит в фокусе: • исходный документ • недавний контекст • следующие слова А всё лишнее постепенно «забывает», чтобы не раздувать вычисления. За счёт постоянного размера KV Cache и более дешёвого attention Unlimited OCR может распознавать 40+ страниц за один forward pass, не теряя контекст и не замедляясь. GitHub: https://github.com/baidu/Unlimited-OCR Hugging Face: https://huggingface.co/baidu/Unlimited-OCR #ocr #baidu

Выбираем железо для обучения и инференса моделей 🔝 Простая формула: чем больше у модели параметров, тем более мощное железо
Выбираем железо для обучения и инференса моделей 🔝 Простая формула: чем больше у модели параметров, тем более мощное железо нужно для ее инференса. Найти решение для нейросетей разного масштаба можно в Selectel. Более 15 моделей видеокарт — от RTX 4090 до B300 — доступны к аренде в облаке и на выделенных серверах. Облачные серверы подойдут для тех, кому нужна гибкость и быстрая масштабируемость, а выделенные — когда необходима физическая изоляция инфраструктуры, а нагрузки стабильные. Видеокарты в облаке можно арендовать даже на час, цена стартует от 5 рублей. Выбирайте оптимальный сервер с GPU и арендуйте его от 5 рублей в час: https://slc.tl/2x1uz Реклама. АО "Селектел". erid:2W5zFK69ZWZ

Один из лучших вводных материалов по прикладной линейной алгебре, который мне попадался. Этот курс объясняет векторы, матрицы
Один из лучших вводных материалов по прикладной линейной алгебре, который мне попадался. Этот курс объясняет векторы, матрицы и метод наименьших квадратов с самых основ, а затем связывает их с реальными задачами: • подгонка данных • машинное обучение • оптимизация • обработка изображений • системы управления Это материал, который можно рекомендовать студентам, инженерам и всем, кто хочет понять математический фундамент современной data science. PDF: http://web.stanford.edu/~boyd/vmls/vmls.pdf

Сможете решить ?
Сможете решить ?

Шахматы выглядят простой игрой, пока не считаешь варианты. В начале партии у тебя всего 20 возможных ходов. После одного полн
Шахматы выглядят простой игрой, пока не считаешь варианты. В начале партии у тебя всего 20 возможных ходов. После одного полного хода уже больше 400 позиций. К третьему ходу около 8 900. К четвёртому почти 200 000. А дальше начинается безумие. К 40-му ходу число возможных партий превращается в астрономическую величину. Именно поэтому шахматы до сих пор не «решены» полностью, а один неточный ход может сломать позицию, которую ты строил полчаса. Вот почему шахматы это не просто игра фигур. Это математика, память, психология и хаос на 64 клетках.

В Оксфордском университете написали эссе, объясняющее, как работает «Бесконечность» Годзё Сатору. Математика, которую мы засл
+2
В Оксфордском университете написали эссе, объясняющее, как работает «Бесконечность» Годзё Сатору. Математика, которую мы заслужили ) https://tomrocksmaths.com/wp-content/uploads/2026/06/achmad-roykhan-sabiq_essay_competition_2026-achmad-roykhan-sabiq.pdf @data_analysis_ml

Матрицы Дирака, чаще называемые гамма-матрицами, — это набор матриц, которые Поль Дирак ввёл при формулировке уравнения Дирак
Матрицы Дирака, чаще называемые гамма-матрицами, — это набор матриц, которые Поль Дирак ввёл при формулировке уравнения Дирака. Они играют фундаментальную роль в квантовой механике и квантовой теории поля, особенно при описании частиц со спином 1/2, например электрона. Поль Адриен Морис Дирак (1902–1984) был одним из величайших физиков-теоретиков XX века. Он внёс выдающийся вклад в квантовую механику и квантовую электродинамику и считается одним из основателей современной физики.

Альберт Эйнштейн однажды сказал: «Знаешь, Анри, я начинал с математики, но в итоге ушёл в физику». Анри Пуанкаре спросил: «По
Альберт Эйнштейн однажды сказал:
«Знаешь, Анри, я начинал с математики, но в итоге ушёл в физику».
Анри Пуанкаре спросил:
«Почему?»
Эйнштейн ответил:
«Потому что я мог отличать истинные утверждения от ложных, но не мог понять, какие из них действительно важны».
Пуанкаре улыбнулся и сказал:
«Забавно, Альберт. А я начинал с физики, но в итоге выбрал математику».
Эйнштейн заинтересовался:
«И почему ты сделал такой выбор?»
Пуанкаре ответил:
«Потому что я не мог понять, какие из важных фактов на самом деле истинны».
Этот обмен остроумно показывает разницу во взглядах двух великих умов: физика ищет важное в реальности, математик — истину внутри важного.

🍺 В этот день 150 лет назад родился Уильям Сили Госсет. Всю карьеру он проработал пивоваром в Guinness и занимался задачей,
🍺 В этот день 150 лет назад родился Уильям Сили Госсет. Всю карьеру он проработал пивоваром в Guinness и занимался задачей, которую учебники почти не трогали: как делать выводы по крошечным выборкам — например, по четырём участкам ячменя или небольшой партии хмеля. Статистика того времени в основном исходила из больших выборок, поэтому Госсет фактически изобрёл статистику для малых. Guinness запрещала сотрудникам публиковаться после того, как один из них слил коммерческие секреты. Компания также не хотела, чтобы конкуренты знали: пиво там варят с помощью науки. Поэтому, когда Госсет в 1908 году опубликовал свой метод, он подписался псевдонимом: Student. Каждое клиническое испытание, лабораторный эксперимент и A/B-тест, где сегодня используют t-test, опирается на работу Student. Одна из самых известных фамилий в статистике - ненастоящая.

Repost from Machinelearning
✔️ OpenAI добавила ручной сброс лимитов для Codex Компания изменила механизм управления rate limits для своего ИИ-агента. На тарифах Go, Plus, Pro и Business теперь можно накапливать сбросы лимитов и активировать их вручную при пиковых нагрузках. Ранее таймеры обнулялись автоматически. На старте все подписчики получают 1 бесплатный сброс. Дополнительно запущена двухнедельная реферальная программа: клиенты на Plus и Pro могут пригласить до 3 коллег. После первого запроса от нового пользователя обе стороны получают по дополнительному сбросу в резерв. По неофициальным данным, обновление связано с конкуренцией с Anthropic и подготовкой к снижению цен на токены для корпоративных клиентов. OpenAI в сети Х ✔️ Nvidia открыла предзаказ на процессоры Vera в Китае Серверные ARM-процессоры Vera, спроектированные для инференса автономных ИИ-агентов, стали доступны для китайских компаний. Первые поставки ожидаются в августе. Один из локальных облачных провайдеров уже заказал более 300 серверов на базе Vera для пилотного запуска в зарубежных дата-центрах. По предварительным оценкам, стоимость одного чипа превысит $20 000, а стойка на 256 процессоров обойдется в $10 млн. Ставка на CPU стала ответом на заморозку поставок H200. В отличие от GPU, процессоры несут меньше санкционных рисков. Массовый переход китайских компаний на новые чипы теперь зависит от адаптации программных экосистем под ARM-архитектуру. reuters.com ✔️ Xiaomi выпустила открытого ИИ-агента MiMo Code Китайский техногигант представил терминального агента MiMo Code на базе OpenCode. Инструмент под лицензией MIT решает проблему потери контекста в задачах из сотен последовательных шагов. В слепом A/B-тестировании на 474 репозиториях агента сравнили со связкой Claude Code и Sonnet. На коротких дистанциях зафиксирован паритет, но в задачах длиннее 200 шагов решение Xiaomi обошло конкурента в 65% случаев. Архитектура MiMo Code опирается на бесконечные логические сессии. Субагент регулярно сохраняет промежуточные состояния на диск, а при исчерпании лимита токенов сессия перезапускается, загружая накопленные данные в новое окно. Память разделена на 4 уровня: от коротких локальных заметок до постоянных фактов проекта. Установка доступна через менеджер пакетов NPM или Bash-скрипты. xiaomi.com ✔️ Google подала иск против китайской кибергруппировки за автоматизацию фишинга Согласно иску, группа Outsider Enterprise разработала 131 инструмент для потоковой генерации копий сайтов Google, YouTube и госструктур США. За две недели Android-пользователи получили 2,5 млн сообщений, содержащих 1 млн фишинговых ссылок. Инфраструктура координировалась через Telegram. Google выступает в суде совместно с ФБР и телеком-операторами AT&T, T-Mobile и Verizon. Истцы требуют судебного запрета для создания правового механизма, который позволит оперативно блокировать домены и замораживать счета сети. Размер ущерба по делу не раскрывается. blog.google ✔️ LLM обошли клинические RAG-инструменты в медицине Nature Medicine опубликовал исследование, которое показало, что универсальные LLM превосходят профильные клинические ИИ-инструменты. В слепом тестировании (12 врачей, 1800 реальных запросов) Gemini 3.1 Pro и GPT-5.2 набрали 97,4% и 94,2% точности соответственно. Результаты спецсистем OpenEvidence и UpToDate Expert AI составили около 80%. Авторы объясняют отставание профильных решений сильной зависимостью от RAG - нерелевантная литература и ошибки интеграции снижают качество генерации. Универсальные модели выигрывают за счет масштаба, кросс-доменного обучения и механизмов логического вывода. Медицинские системы также продемонстрировали операционные проблемы. OpenEvidence выдавал хаотичные ответы, а UpToDate Expert AI отклонил 19% запросов из-за жестких фильтров безопасности. Частота галлюцинаций базовых LLM не превысила показатели профильных аналогов. Авторы рекомендуют клиникам проводить независимое тестирование ИИ-продуктов перед внедрением. nature.com @ai_machinelearning_big_data #news #ai #ml

🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ. Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект. Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике. Внутри: - Python с нуля - много практики без сухой теории - реальные задачи и проекты - автоматизация рутины - работа с файлами, данными и API - понятная логика программирования - современная разработка с ИИ - отдельный блок по вайбкодингу Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния. 48 часов скидка 60%: https://stepik.org/course/288218/

Чем раньше начнешь учиться, тем лучше
Чем раньше начнешь учиться, тем лучше

38 лет считалось, что для разреженных графов алгоритм Дейкстры почти упёрся в потолок. Логика выглядела железно: - Дейкстра у
38 лет считалось, что для разреженных графов алгоритм Дейкстры почти упёрся в потолок. Логика выглядела железно: - Дейкстра упорядочивает вершины по расстоянию - сортировка имеет нижнюю границу O(n log n) - значит, кратчайшие пути быстрее искать нельзя Но группа из 5 исследователей показала, что это ограничение можно обойти. Идея в том, чтобы не просто «ускорить очередь с приоритетами», а смешать подход Дейкстры с динамическим программированием в стиле Беллмана-Форда. Алгоритм делит множество вершин, сжимает frontier и не тратит время на полную сортировку там, где она не нужна. Результат: O(m log^(2/3) n) Это первое улучшение для направленных разреженных графов со времён Fibonacci heap в 1987 году. Tsinghua, Stanford, Max Planck. 17 страниц, которые ломают старое интуитивное объяснение про «Дейкстру быстрее нельзя».

Основатель DeepSeek перевел весь код с NVIDIA на Huawei: зачем он это сделал и что теперь будет с китайским ИИ Лян Вэньфэнг,
Основатель DeepSeek перевел весь код с NVIDIA на Huawei: зачем он это сделал и что теперь будет с китайским ИИ Лян Вэньфэнг, основатель DeepSeek, потратил месяцы на полный перенос кодовой базы DeepSeek с чипов NVIDIA на Ascend от Huawei. Не потому что нужно было что-то исправить, а потому что он решил доказать: китайский ИИ может работать без американского железа. DeepSeek уже показал отличные результаты на чипах NVIDIA до санкций. У компании было рабочее решение, но Вэньфэнг пошел другим путем. Проект занял месяцы, потребовал огромных ресурсов и задержал выпуск новой версии модели. Но результат стоил того. Что получилось на выходе: - DeepSeek полностью работает на чипах Huawei Ascend без потери качества - Доказано, что чипы Huawei способны тянуть полноценные ИИ-нагрузки - Другие китайские ИИ-компании теперь имеют реальный повод перейти с NVIDIA на Huawei - Большая часть зависимости от американских поставщиков чипов убрана Вэньфэнг нес огромное давление, сроки сдвинулись, команда работала без гарантий что выйдет рабочее решение. Но он довел дело до конца и доказал: китайская ИИ-индустрия может строить свой собственный стек, не завися от того, дадут ли следующую партию поставок через Тихий океан.

📖 Бессистемное погружение в машинное обучение превращается в набор разрозненных знаний — непонятно, с чего начать и как выйт
📖 Бессистемное погружение в машинное обучение превращается в набор разрозненных знаний — непонятно, с чего начать и как выйти на профессиональный уровень. 🚀 Курс «Машинное обучение. Специализация» выстраивает понятный путь: от основ до уверенной работы с моделями. Вы начнёте с Python, разберёте математику на практике и постепенно перейдёте к построению моделей, анализу данных и работе с нейросетями. 🧑‍🎓 Программа разделена на этапы: сначала фундамент, затем полноценная работа с задачами. Вы пройдёте весь цикл: от подготовки данных до анализа результатов и создания моделей. Обучение ведут практикующие специалисты и преподаватели с научными степенями. Программа регулярно обновляется под требования рынка. ➡️ Запишитесь сегодня: https://tglink.io/1ce37f97d7bb9e?erid=2W5zFHAjNz5 #реклама О рекламодателе

NVIDIA официально опубликовала Skills, которые они используют для своих ИИ-агентов. Прямо сейчас у них есть Skills для: → авт
NVIDIA официально опубликовала Skills, которые они используют для своих ИИ-агентов. Прямо сейчас у них есть Skills для: → автоматического анализа и суммирования видео → создания голосовых агентов в реальном времени → обучения и улучшения LLM → ускорения моделей, чтобы они работали намного быстрее → систем RAG, подключенных к документам и данным → агентов, работающих в изолированных безопасных средах → оптимизации логистики и маршрутизации с помощью GPU → программирования и вычислений на CUDA Некоторые из самых интересных: • TensorRT-LLM → экстремальное ускорение LLM • NeMo-RL → продвинутое обучение агентов • Video Search → автоматический поиск и суммирование видео Кроме того, они совместимы с: → Claude Code → OpenAI Codex → Cursor https://github.com/NVIDIA/skills

Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка отчётов занимала дни: данные собирались вручну
Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка отчётов занимала дни: данные собирались вручную, цифры перепроверялись, а бизнес слишком долго ждал ответы. Сегодня искусственный интеллект меняет сам подход к работе с данными — делает аналитику быстрее, проще и доступнее. 3 июня Visiology проведёт большой онлайн-эфир Cortex LIVE о новом поколении аналитики. На бесплатном эфире покажут: — как ускорить получение аналитики — как сократить объём ручной работы — как быстрее находить ответы для бизнеса — как компании уже меняют подход к работе с данными Без сложной теории — только реальные примеры и практические сценарии. Если вы работаете с аналитикой, отчётностью или управлением, этот эфир точно стоит посмотреть. До мероприятия осталось совсем немного времени — успейте зарегистрироваться заранее, чтобы не пропустить эфир.

Repost from Machinelearning
🔥 AlphaProof Nexus: формальные доказательства начинают превращаться в инженерный пайплайн Google DeepMind показали AlphaProo
+1
🔥 AlphaProof Nexus: формальные доказательства начинают превращаться в инженерный пайплайн Google DeepMind показали AlphaProof Nexus - систему, которая автономно закрыла 9 открытых задач Эрдёша, часть из которых висела десятилетиями. По оценке авторов, стоимость решения одной задачи составила всего несколько сотен долларов. Кроме этого, система доказала 44 открытые гипотезы из OEIS, закрыла 15-летний вопрос в алгебраической геометрии и нашла новый алгоритмический параметр в оптимизационной теории, который раньше не был описан людьми. Модель генерирует идеи и фрагменты доказательств, а Lean проверяет каждый логический шаг через компилятор. Если доказательство некорректно, оно просто не проходит проверку. Не нужен рецензент, который вручную ищет дыру в рассуждении. Базовый агент, который просто чередует генерацию LLM и обратную связь от компилятора, смог повторить все 9 успешных решений задач Эрдёша. Более сложная версия с эволюционным поиском и reinforcement learning дала заметный выигрыш только на самых тяжёлых случаях. Чем сильнее становятся foundation models, тем чаще простые циклы «сгенерировал - проверил - исправил» начинают догонять специализированные архитектуры. Отличие от неформального подхода к математическим доказательствам принципиальное. Модель часто придумывала несуществующие леммы, ссылалась на «известные результаты» и пыталась спрятать сложность задачи в вспомогательное утверждение. В обычном текстовом доказательстве такие ошибки легко пропустить. Lean отсекает их сразу. Ещё один неожиданный эффект: агент находил неточности в формализациях уже существующих математических утверждений. То есть он работал не только как решатель, но и как диагностический инструмент для самой постановки задачи. Успехи пока сосредоточены там, где библиотека Lean уже достаточно зрелая: комбинаторика, теория чисел, оптимизация. Задачи, где нужно строить большой пласт новой теории, всё ещё далеко не закрыты. И большинство задач Эрдёша система не решила. Та же схема подходит для кодигша, спецификаций, верификации протоколов, компиляторов, криптографии. Формальная проверка отсекает галлюцинации. Модель может придумать лемму или сослаться на несуществующий результат, но Lean это не пропустит. https://arxiv.org/html/2605.22763v1 @ai_machinelearning_big_data