Big Data AI
@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста РКН: clck.ru/3Fmqxe
نمایش بیشتر📈 تحلیل کانال تلگرام Big Data AI
کانال Big Data AI (@bigdatai) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 18 605 مشترک است و جایگاه 7 187 را در دسته فناوری و برنامهها و رتبه 36 345 را در منطقه روسيا دارد.
📊 شاخصهای مخاطب و پویایی
از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 18 605 مشترک جذب کرده است.
بر اساس آخرین دادهها در تاریخ 03 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -195 و در ۲۴ ساعت گذشته برابر -5 بوده و همچنان دسترسی گستردهای حفظ شده است.
- وضعیت تأیید: تأیید نشده
- نرخ تعامل (ER): میانگین تعامل مخاطب 7.47% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 3.78% واکنش نسبت به کل مشترکان کسب میکند.
- دسترسی پستها: هر پست به طور میانگین 1 391 بازدید دریافت میکند. در اولین روز معمولاً 704 بازدید جمعآوری میشود.
- واکنشها و تعامل: مخاطبان بهطور فعال حمایت میکنند؛ میانگین واکنش به هر پست 8 است.
- علایق موضوعی: محتوا بر موضوعات کلیدی مانند llm, openai, github, nvidia, deepseek تمرکز دارد.
📝 توضیح و سیاست محتوایی
نویسنده این فضا را محل بیان دیدگاههای شخصی توصیف میکند:
“@haarrp - админ
Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям
@data_analysis_ml - анализ данных
@ai_machinelearning_big_data
@itchannels_telegram - важное для программиста
РКН: clck.ru/3Fmqxe”
به لطف بهروزرسانیهای پرتکرار (آخرین داده در تاریخ 04 ژوئن, 2026)، کانال همواره بهروز و دارای دسترسی بالاست. تحلیلها نشان میدهد مخاطبان بهطور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامهها تبدیل کردهاند.
در حال بارگیری داده...
| تاریخ | رشد مشترکین | اشارات | کانالها | |
| 04 ژوئن | +1 | |||
| 03 ژوئن | +2 | |||
| 02 ژوئن | +3 | |||
| 01 ژوئن | 0 |
| 2 | ✔️ Centaur - это платформа для совместного использования AI-агентов, интегрированных в Slack.
Она позволяет командам взаимодействовать с агентами, которые выполняют задачи в изолированных средах Kubernetes, обеспечивая безопасность и гибкость.
🚀 Основные моменты:
- Slack-агенты для выполнения задач и получения ответов.
- Изолированные среды для безопасного выполнения команд.
- Поддержка пользовательских инструментов и плагинов.
- Долговременные рабочие процессы с возможностью восстановления.
- Хранение состояния для повторного подключения без потери данных.
📌 GitHub: https://github.com/paradigmxyz/centaur
#python | 788 |
| 3 | Goldman Sachs: токены становятся новой болью AI-экономики
AI-агенты превращают бум нейросетей в первый серьёзный тест на стоимость.
Обычный чат-бот отвечает один раз. Агент работает иначе:
- планирует задачу
- вызывает инструменты
- проверяет результат
- исправляет ошибки
- снова запускает цикл
Из-за этого один запрос может съедать не просто в 2 раза больше токенов, а в 10, 50 и даже больше раз, чем обычный ответ модели.
Goldman Sachs ждёт, что к 2030 году использование токенов AI-агентами может вырасти в 24 раза. В бычьем сценарии речь идёт о 120 квадриллионах токенов в месяц.
Да, стоимость inference на токен может падать на 60-70% в год. Но вопрос теперь не только в цене токена.
Главная битва - между продуктивностью агентов и токеновой расточительностью.
Uber и Microsoft уже пересматривают дорогие сценарии использования агентов. Microsoft, например, начала отзывать у разработчиков доступ к Claude Code и переводить их на собственный Copilot CLI к 30 июня.
https://www.goldmansachs.com/insights/articles/ai-agents-forecast-to-boost-tech-cash-flow-as-usage-soars | 2 058 |
| 4 | 🖥 Python в 2026 - уже не просто «первый язык программирования».
Это инструмент, с которым можно автоматизировать задачи, писать скрипты, собирать проекты, работать с данными, делать ботов и использовать ИИ как ускоритель разработки.
Но есть проблема: большинство новичков учат Python кусками. Немного синтаксиса, пару задачек, немного теории - и потом ступор: «а что с этим делать дальше?»
Этот курс сделан иначе. Здесь упор на реальную практику: вы не просто смотрите уроки, а постепенно учитесь писать код, разбирать ошибки, собирать рабочие решения и понимать, как Python применяется в нормальных задачах.
Что внутри:
- Python с нуля понятным языком
- практика вместо бесконечной сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современный подход к разработке с ИИ
- отдельный акцент на вайбкодинг
Вайбкодинг -это умение правильно ставить задачу, проверять код, понимать результат и ускорять работу без слепого копирования. В 2026 году это уже не бонус, а нормальный навык разработчика.
Сегодня скидка 60 процентов: https://stepik.org/course/288218/info | 1 072 |
| 5 | AI-кино вышло на новый уровень: в Каннах показали 95-минутный фильм, полностью сгенерированный нейросетями.
Боевик Hell Grind, который собрали всего за две недели. Бюджет - около $500 000, и самое показательное, что примерно $400 000 из этой суммы ушло не на съёмки, актёров и декорации, а на AI compute. | 985 |
| 6 | Лукашенко заявил, что Беларусь развивает ИИ с 1960-х годов | 1 |
| 7 | Anthropic только что выпустила Claude Opus 4.8.
Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.
По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.
Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.
claude.com/blog/introducing-dynamic-workflows-in-claude-code | 872 |
| 8 | Opus 4.8 появился в выборе моделей Claude Code в десктопном приложении.
Похоже, сегодня день релиза 🚀
https://x.com/Machinelearrn/status/2060014943781412903
@ai_machinelearning_big_data
#claude #opus | 1 |
| 9 | ⚡️ УЧИШЬ НЕЙРОСЕТИ ОТВЕЧАТЬ ПРАВИЛЬНО? ТЕБЕ К НАМ НА СТАЖИРОВКУ
Промт-инженер — тот, кто пишет инструкции для AI-моделей и проектирует «мозг» AI-агентов. Одна из самых востребованных профессий в AI — и прямо сейчас мы ищем стажёров в это направление.
➡️ Учишься на 2+ курсе, знаешь Python, JSON и работаешь с LLM-стеком? Выбирай команду и присоединяйся к Сберу.
Какие направления доступны:
✅AI и продуктовая аналитика
✅Управление бизнес-моделью
✅AI-помощники Phygital
🟢Гибрид или офис, Москва
🟢От 20 часов в неделю
🟢Зарплата до 81 300 ₽ в месяц
Заходи на сайт, выбирай направление Prompt Engineering и регистрируйся 👉 sberstudent.ru/internship | 1 056 |
| 10 | OpenBMB показали новый результат для MiniCPM5-1B и снова продвигают свою идею Densing Law: маленькие on-device модели постепенно догоняют то, что ещё недавно требовало огромных LLM.
Хронология выглядит так:
- февраль 2024: MiniCPM-2B добирается до уровня GPT-3
- сентябрь 2024: MiniCPM3-4B уже сравнивают с уровнем ChatGPT
- май 2026: MiniCPM5-1B получает AA 17.9 и обходит GPT-4o с 14.1 в этом тесте
Главный акцент - размер.
MiniCPM5-1B примерно в 200 раз меньше по числу параметров, но уже показывает результаты, которые ещё пару лет назад казались невозможными для локальных моделей.
Cами авторы честно признают, что на многих задачах 1B-модель всё ещё не сильнее GPT-4o. Это не «убийца больших моделей», а скорее сигнал направления.
Если Densing Law продолжит работать, следующий большой сдвиг может быть не в ещё более гигантских моделях, а в сильных локальных AI, которые запускаются прямо на телефоне, ноутбуке или edge-устройстве.
https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B | 1 010 |
| 11 | ✔️ MOSS-TTS v1.5: open-source озвучка стала заметно удобнее для продакшена
OpenMOSS выпустили MOSS-TTS v1.5 - обновление своей открытой TTS-модели на 8B параметров.
Главная фича выглядит простой, но для реальных сценариев очень важная: теперь паузы можно задавать прямо внутри текста через [pause 3.2s]. То есть моделью можно управлять не только на уровне «прочитай фразу», а точнее собирать ритм, драматургию и естественные остановки в речи.
Что нового в v1.5:
- поддержка 31 языка вместо 20
- добавлены Cantonese, Hindi, Thai, Vietnamese, Tagalog, Swahili и другие
- более стабильное voice cloning без сильного разброса между повторными генерациями
- лучше работает сценарий, когда референс длинный, а целевой текст короткий
- улучшена просодия по пунктуации, особенно в длинных предложениях
- сохранены возможности v1.0: zero-shot cloning, long-form speech, Pinyin/IPA control и code-switching
GitHub:
https://github.com/OpenMOSS/MOSS-TTS
ModelScope:
https://modelscope.ai/models/OpenMOSS-Team/MOSS-TTS-v1.5 | 1 101 |
| 12 | HyperParallel-MoE - Huawei пытается выжать MoE из железа Ascend по-взрослому 👀
Появилась работа про HyperParallel-MoE - систему планирования обучения MoE-моделей, заточенную специально под Ascend A3.
Проблема в том, что у Ascend A3 есть разные блоки под разные типы работы:
- AIC - матричные вычисления
- AIV - векторные операции и коммуникации
Но стандартный MoE-пайплайн всё равно часто гоняет Dispatch, GMM, SwiGLU и Combine как последовательные full-device kernels. В итоге часть железа простаивает: то заняты матричные блоки, то коммуникационные, но нормального tile-level overlap нет.
HyperParallel-MoE решает это через статический heterogeneous taskflow для MoE-FFN:
- AIC обрабатывает GMM tiles
- AIV берёт на себя vector + communication tiles
- зависимости контролируются через event counters
- AIV-driven one-sided communication убирает host-side collective barriers
- весь объединённый taskflow ведёт один kernel
На DeepSeek-style MoE-моделях заявлены такие результаты:
- 1.49-1.58x снижение latency на участке Dispatch-to-Combine MoE-FFN при balanced routing
- 1.08-1.09x ускорение end-to-end training при sampled natural routing
- интеграция в MindSpore / MindFormers
- переиспользование уже оптимизированных операторов
Не «пусть компилятор как-нибудь разрулит», а явное разделение работы между матричными, векторными и коммуникационными блоками.
Huawei строит не только чипы, но и полный софтверный стек вокруг них. А такие штуки показывают, что гонка ИИ-железа будет всё больше решаться не только терафлопсами, но и тем, насколько глубоко фреймворк умеет использовать конкретную архитектуру.
Paper: https://arxiv.org/abs/2605.23764 | 1 256 |
| 13 | Кажется, аналитика подошла к моменту больших изменений.
Ещё недавно подготовка отчётов занимала дни: данные собирались вручную, цифры перепроверялись, а бизнес слишком долго ждал ответы. Сегодня искусственный интеллект меняет сам подход к работе с данными — делает аналитику быстрее, проще и доступнее.
3 июня Visiology проведёт большой онлайн-эфир Cortex LIVE о новом поколении аналитики.
На бесплатном эфире покажут:
— как ускорить получение аналитики
— как сократить объём ручной работы
— как быстрее находить ответы для бизнеса
— как компании уже меняют подход к работе с данными
Без сложной теории — только реальные примеры и практические сценарии.
Если вы работаете с аналитикой, отчётностью или управлением, этот эфир точно стоит посмотреть.
До мероприятия осталось совсем немного времени — успейте зарегистрироваться заранее, чтобы не пропустить эфир. | 0 |
| 14 | NuExtract3 - маленькая VLM, которая вытаскивает структуру из документов 👀
На ModelScope выложили NuExtract3 - vision-language модель на 4B параметров, заточенную не под «поговорить обо всём», а под конкретную задачу: понимание документов и структурированное извлечение данных.
Что умеет:
- принимает сканы, чеки, формы, инвойсы, контракты и таблицы
- получает на вход JSON-шаблон
- возвращает чистый структурированный JSON
- конвертирует изображения документов в аккуратный Markdown
- таблицы сохраняет в HTML
- формулы переводит в LaTeX
- сама генерирует шаблоны извлечения из обычного текстового описания
- поддерживает thinking и non-thinking режимы
- работает с несколькими языками
- поддерживает vLLM и Transformers
По заявленным бенчмаркам NuExtract3 обходит gemma-4-E4B-it, Qwen3.5-9B и GLM-4.6V-Flash на structured extraction: меньше падений, меньше лишних reasoning-токенов, выше стабильность на документах.
Главный смысл тут не в «ещё одной VLM», а в специализации. Для бизнеса важнее не модель, которая красиво рассуждает, а модель, которая из кривого PDF, скана или инвойса стабильно достаёт поля в JSON.
Ссылка: https://modelscope.ai/models/numind/NuExtract3 | 1 251 |
| 15 | ✔️ Агенты Claude получили поддержку локальных песочниц и MCP-туннелей
Anthropic добавила песочницы и MCP-туннели в платформу Claude Managed Agents. Корпоративные клиенты получили возможность выполнять код агентов внутри собственной инфраструктуры.
Локальные песочницы нужны для обработки конфиденциальных файлов в закрытом контуре. Поддерживается интеграция сCloudflare, Daytona, Modal и Vercel.
MCP-туннели обеспечивают подключение агентов к внутренним базам данных и приватным API. Соединение со сквозным шифрованием устанавливается только на выход - открывать порты или менять правила брандмауэра не требуется.
Полностью on-premise развертывание не поддерживается. Оркестрация, управление контекстом и обработка ошибок остаются на серверах Anthropic. Локальные песочницы доступны в стадии открытой беты, MCP-туннели предоставляются по запросу.
claude.com
✔️ Prime Intellect открыла код General-Agent
General-Agent - синтетическая среда для генерации тренировочных данных ИИ-агентов без участия разметчиков. Решение заменяет датасеты на динамическую генерацию с автоматической семантической валидацией.
В основе системы лежит соревновательный подход между двумя моделями. "Синтезатор" конструирует задания с базами данных и функциями проверки, а "решатель" пытается их выполнить.
Эволюция задач проходит пять уровней сложности. Простые сценарии обрастают дополнительными условиями, перекрестными связями и инструкциями. Платформа сохраняет задачи, которые алгоритм решает с заданным порогом вероятности. Самые сложные кейсы используются для генерации следующего раунда.
Дообучение 30-миллиардной модели на собранных в General-Agent траекториях повысило точность вызова инструментов в бенчмарке BFCL с 18,9% до 52,3%.
primeintellect.ai
✔️ Mythos научилась связывать мелкие баги в эксплойты в тестах Cloudflare
Mythos Preview проанализировала более 50 репозиториев Cloudflare. Основной результат - модель научилась связывать мелкие разрозненные баги в рабочие эксплойты.
CISO Cloudflare рассказал, что предыдущие поколения алгоритмов выявляли единичные ошибки, но не могли собрать их в вектор атаки. Mythos снизила долю ложных срабатываний и генерирует шаги для воспроизведения уязвимостей с минимальным участием инженеров.
Для поиска Cloudflare развернула архитектуру Project Glasswing из 50 параллельных агентов. Система использовала состязательный подход: один агент генерировал вектор атаки, второй его опровергал.
cloudflare.com
✔️ Mistral купил стартап Emmi для выхода на рынок физических симуляций
Французский разработчик ИИ приобрел австрийский стартап Emmi AI, который создает ИИ-модели для симуляции физических процессов. Сумма сделки не раскрывается. В 2025 году Emmi AI привлек €15 млн инвестиций.
Модели Emmi просчитывают аэродинамику, теплообмен и сопротивление материалов. CEO Mistral заявил, что интеграция технологий нацелена на аэрокосмическую отрасль, автомобилестроение и производство полупроводников.
Сделка расширяет промышленное направление Mistral. Компания уже предоставляет решения для ASML, Stellantis и Veolia: алгоритмы выявляют дефекты на сборочных линиях и управляют роботизированными манипуляторами.
emmi.ai
✔️ Сооснователь Anthropic выступит на презентации первой энциклики Ватикана об ИИ
25 мая Ватикан представит энциклику об ИИ "Magnifica Humanitas". В презентации примет участие сооснователь Anthropic и исследователь интерпретируемости моделей Крис Ола.
Документ затрагивает защиту человеческого достоинства, влияние алгоритмов на труд и осуждает применение ИИ в военных конфликтах. Привлечение Олы связывает теологическую повестку с технической проблемой ИИ-безопасности.
Выход документа приурочен к годовщине исторической энциклики о правах рабочих эпохи Промышленной революции. Таким образом Ватикан приравнивает развитие ИИ к аналогичному по масштабам социальному сдвигу, требующему этических ограничений.
reuters.com
@ai_machinelearning_big_data
#news #ai #ml | 1 249 |
| 16 | Приглашаем на GenAI MeetUp — hh.ru х Lamoda Tech
Если вы LLM-инженер или ML-специалист, работаете с генеративным AI, приходите обсудить разработку агентов, применение моделей и оценку их качества.
🧬 В программе разбор кейсов, интерактивы с призами, нетворкинг и угощения.
Спикеры и доклады:
▪️ Коля Безносов, Руководитель направления AI Lab, hh.ru
Рекрутер, который не спит: как мы автоматизировали первичный контакт с соискателями с помощью ИИ
▪️Данил Дмитриев, Senior Data Scientist, Lamoda Tech
Контролируемый агент поддержки: как мы превратили обратную связь из прода в роадмап
▪️Женя Орлов, Руководитель команды разработки AI Lab, hh.ru
Нейроразбор резюме: практический опыт и нюансы создания LLM-судей
▪️Дима Курганский, Teamlead MLOps, Lamoda Tech
Как мы строим GenAI-платформу в Lamoda: от MVP к production-решениям
🗓 28 мая, сбор 18:30, начало 19:00
🔗 Очно и онлайн
📍 Офис hh.ru
🔥 ЗАРЕГИСТРИРОВАТЬСЯ
Количество очных мест ограничено.
Реклама. ООО "ЛАМОДА ТЕХ". ИНН 7734461512. erid: 2W5zFHxm27s | 1 233 |
| 17 | 🖥 Создатель C++ разнёс вайбкодинг: “сеньоры не хотят разгребать этот мусор”
Бьёрн Страуструп, легендарный создатель C++, в новом двухчасовом интервью резко прошёлся по вайбкодингу.
Главная претензия простая: сгенерированный код пока слишком часто выглядит красиво только на демке. В реальном проекте он приносит баги, раздувает кодовую базу, плодит уязвимости и плохо поддаётся нормальной проверке.
Особенно больно это бьёт по опытным разработчикам. Им потом приходится не “магически ускоряться с ИИ”, а читать, чинить и переписывать слоп, который кто-то нагенерировал за пять минут.
Похожая история уже достала и Линуса Торвальдса. Его буквально завалили кривыми AI-отчётами по ядру Linux: вроде бы люди “помогают”, а на практике создают шум, который мешает настоящей разработке.
И вот тут неприятный вывод для рынка:
ИИ не отменяет инженерное мышление.
Он просто делает слабого разработчика быстрее.
А если человек не понимает архитектуру, безопасность, тесты и границы задачи, то вайбкодинг превращается не в ускорение, а в генератор технического долга.
Сеньоры не боятся ИИ.
Они просто не хотят провести остаток карьеры, разгребая чужой промптованный мусор.
https://www.youtube.com/watch?v=U46fJ2bJ-co | 1 616 |
| 18 | 🤖 Machine Learning Roadmap: от базы до гуру вайбкодинга
Карта обучения машинному обучению (Machine Learning, Deep Learning, LLM, Generative AI, MLOps) - от первого import numpy до уровня инженера, который понимает, как ИИ работает внутри, и может писать прод‑системы, а не только дёргать API.
https://github.com/justxor/MachineLearningRoadmap/tree/main | 1 624 |
| 19 | Как усилить ИБ: управление данными и ML-технологии для защиты бизнеса
Когда киберриски растут, а требования к защите данных ужесточаются, перед компаниями стоит вопрос: как обеспечить высокий уровень ИБ без роста бюджета?
Эксперты «Инфосистемы Джет», Arenadata и «Аксель Про» проведут совместный митап, где подтвердят, что ответ в сочетании проверенных решений и современных технологий.
Что в программе?
🔹Реальные кейсы сбора данных в ИБ: когда выгоднее использовать готовые инструменты вместо самостоятельной разработки
🔹Тренды рынка ИБ: кто лидирует, какие технологии набирают популярность и куда двигаться дальше
🔹ML-кейсы для ИБ в реальной ИТ-среде: от анализа логов до задач с LLM
🔹Дата-контракты, карта данных и профилирование — как инструменты управления данными помогают ИБ
🔹Как управление данными и их качество повышают уровень ИБ
Когда: 26 мая в 11:00 МСК
Формат: онлайн
Регистрация на бесплатный митап на сайте. | 1 398 |
| 20 | 🖥️📊 agtop: мониторинг AI-сессий в терминале
agtop — это терминальный дашборд, который отслеживает сессии Claude Code и Codex на вашем устройстве. Он предоставляет информацию о расходах, использовании токенов, нагрузке на ЦП и многом другом в реальном времени.
🚀Основные моменты:
- Автоматическое обнаружение сессий Claude и Codex
- Отслеживание затрат с разбивкой по времени
- Панель производительности с графиками использования ЦП и памяти
- История вызовов инструментов с временными метками
- Поддержка мыши для удобного взаимодействия
📌 GitHub: https://github.com/ldegio/agtop
#javascript | 1 537 |
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
