ru
Feedback
Big Data AI

Big Data AI

Открыть в Telegram

@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста РКН: clck.ru/3Fmqxe

Больше

📈 Аналитический обзор Telegram-канала Big Data AI

Канал Big Data AI (@bigdatai) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 18 605 подписчиков, занимая 7 187 место в категории Технологии и приложения и 36 345 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 18 605 подписчиков.

Согласно последним данным от 03 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -195, а за последние 24 часа — -5, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 7.47%. В первые 24 часа после публикации контент обычно набирает 3.78% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 1 391 просмотров. В течение первых суток публикация набирает 704 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 8.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как llm, openai, github, nvidia, deepseek.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста РКН: clck.ru/3Fmqxe

Благодаря высокой частоте обновлений (последние данные получены 04 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

18 605
Подписчики
-524 часа
-367 дней
-19530 день
Архив постов
🚀 Умный набор для AI-разработки Vibecode Pro Max Kit превращает AI-агентов в полноценные инженерные команды, которые могут исследовать, планировать и разрабатывать код. Он обеспечивает автоматическую генерацию документации и управление контекстом, улучшая память AI на длительный срок. 🚀 Основные моменты: - Спецификационно-ориентированная разработка для AI - Автогенерация PRD и управление задачами - Самообучающаяся база знаний - Автономная работа на больших задачах - Совместное использование планов и спецификаций 📌 GitHub: https://github.com/withkynam/vibecode-pro-max-kit #typescript

✔️ Centaur - это платформа для совместного использования AI-агентов, интегрированных в Slack. Она позволяет командам взаимодействовать с агентами, которые выполняют задачи в изолированных средах Kubernetes, обеспечивая безопасность и гибкость. 🚀 Основные моменты: - Slack-агенты для выполнения задач и получения ответов. - Изолированные среды для безопасного выполнения команд. - Поддержка пользовательских инструментов и плагинов. - Долговременные рабочие процессы с возможностью восстановления. - Хранение состояния для повторного подключения без потери данных. 📌 GitHub: https://github.com/paradigmxyz/centaur #python

Goldman Sachs: токены становятся новой болью AI-экономики AI-агенты превращают бум нейросетей в первый серьёзный тест на стои
Goldman Sachs: токены становятся новой болью AI-экономики AI-агенты превращают бум нейросетей в первый серьёзный тест на стоимость. Обычный чат-бот отвечает один раз. Агент работает иначе: - планирует задачу - вызывает инструменты - проверяет результат - исправляет ошибки - снова запускает цикл Из-за этого один запрос может съедать не просто в 2 раза больше токенов, а в 10, 50 и даже больше раз, чем обычный ответ модели. Goldman Sachs ждёт, что к 2030 году использование токенов AI-агентами может вырасти в 24 раза. В бычьем сценарии речь идёт о 120 квадриллионах токенов в месяц. Да, стоимость inference на токен может падать на 60-70% в год. Но вопрос теперь не только в цене токена. Главная битва - между продуктивностью агентов и токеновой расточительностью. Uber и Microsoft уже пересматривают дорогие сценарии использования агентов. Microsoft, например, начала отзывать у разработчиков доступ к Claude Code и переводить их на собственный Copilot CLI к 30 июня. https://www.goldmansachs.com/insights/articles/ai-agents-forecast-to-boost-tech-cash-flow-as-usage-soars

🖥 Python в 2026 - уже не просто «первый язык программирования». Это инструмент, с которым можно автоматизировать задачи, пис
🖥 Python в 2026 - уже не просто «первый язык программирования». Это инструмент, с которым можно автоматизировать задачи, писать скрипты, собирать проекты, работать с данными, делать ботов и использовать ИИ как ускоритель разработки. Но есть проблема: большинство новичков учат Python кусками. Немного синтаксиса, пару задачек, немного теории - и потом ступор: «а что с этим делать дальше?» Этот курс сделан иначе. Здесь упор на реальную практику: вы не просто смотрите уроки, а постепенно учитесь писать код, разбирать ошибки, собирать рабочие решения и понимать, как Python применяется в нормальных задачах. Что внутри: - Python с нуля понятным языком - практика вместо бесконечной сухой теории - реальные задачи и проекты - автоматизация рутины - работа с файлами, данными и API - понятная логика программирования - современный подход к разработке с ИИ - отдельный акцент на вайбкодинг Вайбкодинг -это умение правильно ставить задачу, проверять код, понимать результат и ускорять работу без слепого копирования. В 2026 году это уже не бонус, а нормальный навык разработчика. Сегодня скидка 60 процентов: https://stepik.org/course/288218/info

AI-кино вышло на новый уровень: в Каннах показали 95-минутный фильм, полностью сгенерированный нейросетями. Боевик Hell Grind
AI-кино вышло на новый уровень: в Каннах показали 95-минутный фильм, полностью сгенерированный нейросетями. Боевик Hell Grind, который собрали всего за две недели. Бюджет - около $500 000, и самое показательное, что примерно $400 000 из этой суммы ушло не на съёмки, актёров и декорации, а на AI compute.

Лукашенко заявил, что Беларусь развивает ИИ с 1960-х годов
Лукашенко заявил, что Беларусь развивает ИИ с 1960-х годов

Repost from Machinelearning
Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила Claude Opus 4.8. Три конкретных изменения по с
Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила Claude Opus 4.8. Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок. По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой. Цена не изменилась. В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике. claude.com/blog/introducing-dynamic-workflows-in-claude-code

Repost from Machinelearning
Opus 4.8 появился в выборе моделей Claude Code в десктопном приложении. Похоже, сегодня день релиза 🚀 https://x.com/Machinel
Opus 4.8 появился в выборе моделей Claude Code в десктопном приложении. Похоже, сегодня день релиза 🚀 https://x.com/Machinelearrn/status/2060014943781412903 @ai_machinelearning_big_data #claude #opus

⚡️ УЧИШЬ НЕЙРОСЕТИ ОТВЕЧАТЬ ПРАВИЛЬНО? ТЕБЕ К НАМ НА СТАЖИРОВКУ Промт-инженер — тот, кто пишет инструкции для AI-моделей и пр
⚡️ УЧИШЬ НЕЙРОСЕТИ ОТВЕЧАТЬ ПРАВИЛЬНО? ТЕБЕ К НАМ НА СТАЖИРОВКУ Промт-инженер — тот, кто пишет инструкции для AI-моделей и проектирует «мозг» AI-агентов. Одна из самых востребованных профессий в AI — и прямо сейчас мы ищем стажёров в это направление. ➡️ Учишься на 2+ курсе, знаешь Python, JSON и работаешь с LLM-стеком? Выбирай команду и присоединяйся к Сберу. Какие направления доступны: ✅AI и продуктовая аналитикаУправление бизнес-модельюAI-помощники Phygital 🟢Гибрид или офис, Москва 🟢От 20 часов в неделю 🟢Зарплата до 81 300 ₽ в месяц Заходи на сайт, выбирай направление Prompt Engineering и регистрируйся 👉 sberstudent.ru/internship

OpenBMB показали новый результат для MiniCPM5-1B и снова продвигают свою идею Densing Law: маленькие on-device модели постепе
OpenBMB показали новый результат для MiniCPM5-1B и снова продвигают свою идею Densing Law: маленькие on-device модели постепенно догоняют то, что ещё недавно требовало огромных LLM. Хронология выглядит так: - февраль 2024: MiniCPM-2B добирается до уровня GPT-3 - сентябрь 2024: MiniCPM3-4B уже сравнивают с уровнем ChatGPT - май 2026: MiniCPM5-1B получает AA 17.9 и обходит GPT-4o с 14.1 в этом тесте Главный акцент - размер. MiniCPM5-1B примерно в 200 раз меньше по числу параметров, но уже показывает результаты, которые ещё пару лет назад казались невозможными для локальных моделей. Cами авторы честно признают, что на многих задачах 1B-модель всё ещё не сильнее GPT-4o. Это не «убийца больших моделей», а скорее сигнал направления. Если Densing Law продолжит работать, следующий большой сдвиг может быть не в ещё более гигантских моделях, а в сильных локальных AI, которые запускаются прямо на телефоне, ноутбуке или edge-устройстве. https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B

✔️ MOSS-TTS v1.5: open-source озвучка стала заметно удобнее для продакшена OpenMOSS выпустили MOSS-TTS v1.5 - обновление своей открытой TTS-модели на 8B параметров. Главная фича выглядит простой, но для реальных сценариев очень важная: теперь паузы можно задавать прямо внутри текста через [pause 3.2s]. То есть моделью можно управлять не только на уровне «прочитай фразу», а точнее собирать ритм, драматургию и естественные остановки в речи. Что нового в v1.5: - поддержка 31 языка вместо 20 - добавлены Cantonese, Hindi, Thai, Vietnamese, Tagalog, Swahili и другие - более стабильное voice cloning без сильного разброса между повторными генерациями - лучше работает сценарий, когда референс длинный, а целевой текст короткий - улучшена просодия по пунктуации, особенно в длинных предложениях - сохранены возможности v1.0: zero-shot cloning, long-form speech, Pinyin/IPA control и code-switching GitHub: https://github.com/OpenMOSS/MOSS-TTS ModelScope: https://modelscope.ai/models/OpenMOSS-Team/MOSS-TTS-v1.5

HyperParallel-MoE - Huawei пытается выжать MoE из железа Ascend по-взрослому 👀 Появилась работа про HyperParallel-MoE - сист
HyperParallel-MoE - Huawei пытается выжать MoE из железа Ascend по-взрослому 👀 Появилась работа про HyperParallel-MoE - систему планирования обучения MoE-моделей, заточенную специально под Ascend A3. Проблема в том, что у Ascend A3 есть разные блоки под разные типы работы: - AIC - матричные вычисления - AIV - векторные операции и коммуникации Но стандартный MoE-пайплайн всё равно часто гоняет Dispatch, GMM, SwiGLU и Combine как последовательные full-device kernels. В итоге часть железа простаивает: то заняты матричные блоки, то коммуникационные, но нормального tile-level overlap нет. HyperParallel-MoE решает это через статический heterogeneous taskflow для MoE-FFN: - AIC обрабатывает GMM tiles - AIV берёт на себя vector + communication tiles - зависимости контролируются через event counters - AIV-driven one-sided communication убирает host-side collective barriers - весь объединённый taskflow ведёт один kernel На DeepSeek-style MoE-моделях заявлены такие результаты: - 1.49-1.58x снижение latency на участке Dispatch-to-Combine MoE-FFN при balanced routing - 1.08-1.09x ускорение end-to-end training при sampled natural routing - интеграция в MindSpore / MindFormers - переиспользование уже оптимизированных операторов Не «пусть компилятор как-нибудь разрулит», а явное разделение работы между матричными, векторными и коммуникационными блоками. Huawei строит не только чипы, но и полный софтверный стек вокруг них. А такие штуки показывают, что гонка ИИ-железа будет всё больше решаться не только терафлопсами, но и тем, насколько глубоко фреймворк умеет использовать конкретную архитектуру. Paper: https://arxiv.org/abs/2605.23764

Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка отчётов занимала дни: данные собирались вручну
Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка отчётов занимала дни: данные собирались вручную, цифры перепроверялись, а бизнес слишком долго ждал ответы. Сегодня искусственный интеллект меняет сам подход к работе с данными — делает аналитику быстрее, проще и доступнее. 3 июня Visiology проведёт большой онлайн-эфир Cortex LIVE о новом поколении аналитики. На бесплатном эфире покажут: — как ускорить получение аналитики — как сократить объём ручной работы — как быстрее находить ответы для бизнеса — как компании уже меняют подход к работе с данными Без сложной теории — только реальные примеры и практические сценарии. Если вы работаете с аналитикой, отчётностью или управлением, этот эфир точно стоит посмотреть. До мероприятия осталось совсем немного времени — успейте зарегистрироваться заранее, чтобы не пропустить эфир.

NuExtract3 - маленькая VLM, которая вытаскивает структуру из документов 👀 На ModelScope выложили NuExtract3 - vision-languag
NuExtract3 - маленькая VLM, которая вытаскивает структуру из документов 👀 На ModelScope выложили NuExtract3 - vision-language модель на 4B параметров, заточенную не под «поговорить обо всём», а под конкретную задачу: понимание документов и структурированное извлечение данных. Что умеет: - принимает сканы, чеки, формы, инвойсы, контракты и таблицы - получает на вход JSON-шаблон - возвращает чистый структурированный JSON - конвертирует изображения документов в аккуратный Markdown - таблицы сохраняет в HTML - формулы переводит в LaTeX - сама генерирует шаблоны извлечения из обычного текстового описания - поддерживает thinking и non-thinking режимы - работает с несколькими языками - поддерживает vLLM и Transformers По заявленным бенчмаркам NuExtract3 обходит gemma-4-E4B-it, Qwen3.5-9B и GLM-4.6V-Flash на structured extraction: меньше падений, меньше лишних reasoning-токенов, выше стабильность на документах. Главный смысл тут не в «ещё одной VLM», а в специализации. Для бизнеса важнее не модель, которая красиво рассуждает, а модель, которая из кривого PDF, скана или инвойса стабильно достаёт поля в JSON. Ссылка: https://modelscope.ai/models/numind/NuExtract3

Repost from Machinelearning
✔️ Агенты Claude получили поддержку локальных песочниц и MCP-туннелей Anthropic добавила песочницы и MCP-туннели в платформу Claude Managed Agents. Корпоративные клиенты получили возможность выполнять код агентов внутри собственной инфраструктуры. Локальные песочницы нужны для обработки конфиденциальных файлов в закрытом контуре. Поддерживается интеграция сCloudflare, Daytona, Modal и Vercel. MCP-туннели обеспечивают подключение агентов к внутренним базам данных и приватным API. Соединение со сквозным шифрованием устанавливается только на выход - открывать порты или менять правила брандмауэра не требуется. Полностью on-premise развертывание не поддерживается. Оркестрация, управление контекстом и обработка ошибок остаются на серверах Anthropic. Локальные песочницы доступны в стадии открытой беты, MCP-туннели предоставляются по запросу. claude.com ✔️ Prime Intellect открыла код General-Agent General-Agent - синтетическая среда для генерации тренировочных данных ИИ-агентов без участия разметчиков. Решение заменяет датасеты на динамическую генерацию с автоматической семантической валидацией. В основе системы лежит соревновательный подход между двумя моделями. "Синтезатор" конструирует задания с базами данных и функциями проверки, а "решатель" пытается их выполнить. Эволюция задач проходит пять уровней сложности. Простые сценарии обрастают дополнительными условиями, перекрестными связями и инструкциями. Платформа сохраняет задачи, которые алгоритм решает с заданным порогом вероятности. Самые сложные кейсы используются для генерации следующего раунда. Дообучение 30-миллиардной модели на собранных в General-Agent траекториях повысило точность вызова инструментов в бенчмарке BFCL с 18,9% до 52,3%. primeintellect.ai ✔️ Mythos научилась связывать мелкие баги в эксплойты в тестах Cloudflare Mythos Preview проанализировала более 50 репозиториев Cloudflare. Основной результат - модель научилась связывать мелкие разрозненные баги в рабочие эксплойты. CISO Cloudflare рассказал, что предыдущие поколения алгоритмов выявляли единичные ошибки, но не могли собрать их в вектор атаки. Mythos снизила долю ложных срабатываний и генерирует шаги для воспроизведения уязвимостей с минимальным участием инженеров. Для поиска Cloudflare развернула архитектуру Project Glasswing из 50 параллельных агентов. Система использовала состязательный подход: один агент генерировал вектор атаки, второй его опровергал. cloudflare.com ✔️ Mistral купил стартап Emmi для выхода на рынок физических симуляций Французский разработчик ИИ приобрел австрийский стартап Emmi AI, который создает ИИ-модели для симуляции физических процессов. Сумма сделки не раскрывается. В 2025 году Emmi AI привлек €15 млн инвестиций. Модели Emmi просчитывают аэродинамику, теплообмен и сопротивление материалов. CEO Mistral заявил, что интеграция технологий нацелена на аэрокосмическую отрасль, автомобилестроение и производство полупроводников. Сделка расширяет промышленное направление Mistral. Компания уже предоставляет решения для ASML, Stellantis и Veolia: алгоритмы выявляют дефекты на сборочных линиях и управляют роботизированными манипуляторами. emmi.ai ✔️ Сооснователь Anthropic выступит на презентации первой энциклики Ватикана об ИИ 25 мая Ватикан представит энциклику об ИИ "Magnifica Humanitas". В презентации примет участие сооснователь Anthropic и исследователь интерпретируемости моделей Крис Ола. Документ затрагивает защиту человеческого достоинства, влияние алгоритмов на труд и осуждает применение ИИ в военных конфликтах. Привлечение Олы связывает теологическую повестку с технической проблемой ИИ-безопасности. Выход документа приурочен к годовщине исторической энциклики о правах рабочих эпохи Промышленной революции. Таким образом Ватикан приравнивает развитие ИИ к аналогичному по масштабам социальному сдвигу, требующему этических ограничений. reuters.com @ai_machinelearning_big_data #news #ai #ml

Приглашаем на GenAI MeetUp — hh.ru х Lamoda Tech Если вы LLM-инженер или ML-специалист, работаете с генеративным AI, приходит
Приглашаем на GenAI MeetUp — hh.ru х Lamoda Tech Если вы LLM-инженер или ML-специалист, работаете с генеративным AI, приходите обсудить разработку агентов, применение моделей и оценку их качества. 🧬 В программе разбор кейсов, интерактивы с призами, нетворкинг и угощения. Спикеры и доклады: ▪️ Коля Безносов, Руководитель направления AI Lab, hh.ru Рекрутер, который не спит: как мы автоматизировали первичный контакт с соискателями с помощью ИИ ▪️Данил Дмитриев, Senior Data Scientist, Lamoda Tech Контролируемый агент поддержки: как мы превратили обратную связь из прода в роадмап ▪️Женя Орлов, Руководитель команды разработки AI Lab, hh.ru Нейроразбор резюме: практический опыт и нюансы создания LLM-судей ▪️Дима Курганский, Teamlead MLOps, Lamoda Tech Как мы строим GenAI-платформу в Lamoda: от MVP к production-решениям 🗓 28 мая, сбор 18:30, начало 19:00 🔗 Очно и онлайн 📍 Офис hh.ru 🔥 ЗАРЕГИСТРИРОВАТЬСЯ Количество очных мест ограничено. Реклама. ООО "ЛАМОДА ТЕХ". ИНН 7734461512. erid: 2W5zFHxm27s

🖥 Создатель C++ разнёс вайбкодинг: “сеньоры не хотят разгребать этот мусор” Бьёрн Страуструп, легендарный создатель C++, в новом двухчасовом интервью резко прошёлся по вайбкодингу. Главная претензия простая: сгенерированный код пока слишком часто выглядит красиво только на демке. В реальном проекте он приносит баги, раздувает кодовую базу, плодит уязвимости и плохо поддаётся нормальной проверке. Особенно больно это бьёт по опытным разработчикам. Им потом приходится не “магически ускоряться с ИИ”, а читать, чинить и переписывать слоп, который кто-то нагенерировал за пять минут. Похожая история уже достала и Линуса Торвальдса. Его буквально завалили кривыми AI-отчётами по ядру Linux: вроде бы люди “помогают”, а на практике создают шум, который мешает настоящей разработке. И вот тут неприятный вывод для рынка: ИИ не отменяет инженерное мышление. Он просто делает слабого разработчика быстрее. А если человек не понимает архитектуру, безопасность, тесты и границы задачи, то вайбкодинг превращается не в ускорение, а в генератор технического долга. Сеньоры не боятся ИИ. Они просто не хотят провести остаток карьеры, разгребая чужой промптованный мусор. https://www.youtube.com/watch?v=U46fJ2bJ-co

🤖 Machine Learning Roadmap: от базы до гуру вайбкодинга Карта обучения машинному обучению (Machine Learning, Deep Learning,
🤖 Machine Learning Roadmap: от базы до гуру вайбкодинга Карта обучения машинному обучению (Machine Learning, Deep Learning, LLM, Generative AI, MLOps) - от первого import numpy до уровня инженера, который понимает, как ИИ работает внутри, и может писать прод‑системы, а не только дёргать API. https://github.com/justxor/MachineLearningRoadmap/tree/main

Как усилить ИБ: управление данными и ML-технологии для защиты бизнеса Когда киберриски растут, а требования к защите данных у
Как усилить ИБ: управление данными и ML-технологии для защиты бизнеса Когда киберриски растут, а требования к защите данных ужесточаются, перед компаниями стоит вопрос: как обеспечить высокий уровень ИБ без роста бюджета? Эксперты «Инфосистемы Джет», Arenadata и «Аксель Про» проведут совместный митап, где подтвердят, что ответ в сочетании проверенных решений и современных технологий. Что в программе? 🔹Реальные кейсы сбора данных в ИБ: когда выгоднее использовать готовые инструменты вместо самостоятельной разработки 🔹Тренды рынка ИБ: кто лидирует, какие технологии набирают популярность и куда двигаться дальше 🔹ML-кейсы для ИБ в реальной ИТ-среде: от анализа логов до задач с LLM 🔹Дата-контракты, карта данных и профилирование — как инструменты управления данными помогают ИБ 🔹Как управление данными и их качество повышают уровень ИБ Когда: 26 мая в 11:00 МСК Формат: онлайн Регистрация на бесплатный митап на сайте.

🖥️📊 agtop: мониторинг AI-сессий в терминале agtop — это терминальный дашборд, который отслеживает сессии Claude Code и Codex на вашем устройстве. Он предоставляет информацию о расходах, использовании токенов, нагрузке на ЦП и многом другом в реальном времени. 🚀Основные моменты: - Автоматическое обнаружение сессий Claude и Codex - Отслеживание затрат с разбивкой по времени - Панель производительности с графиками использования ЦП и памяти - История вызовов инструментов с временными метками - Поддержка мыши для удобного взаимодействия 📌 GitHub: https://github.com/ldegio/agtop #javascript