Анализ данных (Data analysis)

Открыть в Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Больше

Сеть:Machinelearning Россия12 568 Технологии и приложения2 674...

📈 Аналитический обзор Telegram-канала Анализ данных (Data analysis)

Канал Анализ данных (Data analysis) (@data_analysis_ml) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 50 188 подписчиков, занимая 2 674 место в категории Технологии и приложения и 12 568 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 50 188 подписчиков.

Согласно последним данным от 11 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -1 975, а за последние 24 часа — -4, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 9.28%. В первые 24 часа после публикации контент обычно набирает 5.80% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 4 656 просмотров. В течение первых суток публикация набирает 2 912 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 32.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как llm, контекст, openai, архитектура, deepseek.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Благодаря высокой частоте обновлений (последние данные получены 12 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

50 188

Подписчики

-424 часа

-227 дней

-1 97530 день

4 656

Просмотры поста

~ 2 91224 часа

~ 3 40848 часов

9.28%

Коэффициент вовлеченности

~ 5

Постов в день

Ads index

beta

Архив постов

50 159

Промышленный ИИ окончательно перестает быть теорией, и на ЦИПР-2026 это показали максимально прикладно. «Норникель» уже встроил ИИ в цепочку от измельчения руды до выпуска концентрата. Алгоритмы в реальном времени подбирают режимы и меняют параметры, а ключевой фактор, как говорят в Норникеле, скорость: решения принимаются за секунды. На масштабе это дает около 10 млрд рублей в год уже сейчас, с ориентиром 50 млрд к 2030. Важно, что это не про замену человека, оператор остается в контуре и контролирует безопасность. По сути, это модель «усиленного человека», а не автономного ИИ. Еще один сдвиг, который прозвучал на ЦИПР: импортозамещение — только первый этап. Поверх него строятся собственные системы с ИИ, от предиктивной аналитики до управления добычей. И главное: промышленный ИИ уходит от универсальных моделей к доменным. В выигрыше не самый большой LLM, а тот, кто глубже понимает конкретный процесс. Именно такие узкие, встроенные решения сейчас и становятся драйвером industrial AI.

50 159

Андрей Карпаты перешёл в Anthropic Один из самых известных людей в индустрии — сооснователь OpenAI, бывший директор по ИИ в Tesla, автор легендарных лекций по нейросетям - официально объявил о переходе в Anthropic. В твите он написал, что ближайшие несколько лет на фронтире LLM будут особенно формирующими, и он рад вернуться к R&D в команде Anthropic. Образовательные проекты, включая Eureka Labs, обещает не бросать и вернуться к ним позже. Карпаты последние пару лет фактически был «свободным агентом» - выпускал собственные туториалы, строил Eureka Labs, считался одной из самых независимых фигур в ИИ. Его выбор в пользу Anthropic, а не OpenAI, xAI или Google, многое говорит о том, где сейчас концентрируется самая интересная исследовательская работа. С учётом недавнего policy paper Anthropic про 2028 год и фронтирные модели — у компании явно идёт серьёзная фаза найма под большие задачи. https://x.com/karpathy/status/2056753169888334312

50 159

⚡️ SkyClaw-v1.0: новая модель под tool use и агентные задачи Skywork представила SkyClaw-v1.0 - агентную модель, оптимизированную под OpenClaw, Hermes и Nanobot. Фокус на сценариях, где модель должна работать с инструментами и вести задачу в несколько ходов: выбрать tool, собрать аргументы, обработать ответ, продолжить выполнение и не развалиться на длинной цепочке действий. Вместе с основной версией вышла SkyClaw-v1.0-lite - более быстрая и дешёвая версия для сценариев, где важна стоимость запуска. Модель обучали в собственном окружении OpenClaw: с качественными инструментами и синтетическими задачами, собранными из реальных пользовательских паттернов. То есть её специально подгоняли под агентную работу, а не просто добавили tool calling поверх обычной языковой модели. По заявлению Skywork, на PinchBench, Claw-Eval и Skywork-Claw-Bench обе версии обходят: - Minimax 2.7 - DeepSeek V4 Flash - Qwen 3.6 35B A3B - Qwen 3.6 27B https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api

50 159

⚡Когда аналитика разнесена по отдельным системам, бизнес долго ждет данные и платит за лишние кластеры, ETL и серверы. 🐘Postgres Pro AXE — аналитическая СУБД от Postgres Professional на знакомом PostgreSQL. Ускоряет доставку аналитики и снижает TCO на хранение и обработку данных. ✔️До 20 раз быстрее Greenplum На сложных запросах в тестах ClickBench, TPC-H и TPC-DS. ✔️До 10 раз меньше ресурсов При сопоставимой нагрузке с MPP-аналогами. ✔️Аналитика ближе к рабочим данным Postgres Pro AXE работает как отдельная аналитическая СУБД или расширяет Postgres Pro Enterprise аналитическими возможностями на существующих узлах. ✔️Быстрый старт для команды Знакомый PostgreSQL снижает порог входа для администраторов и разработчиков. ✔️Свобода хранения и BI Локальный сервер, сетевая шара или S3. Данные — в формате Parquet. 🔗Приходите 28 мая на бесплатный вебинар: покажем, как построить аналитику без зоопарка технологий.

50 159

Я, закидывающий всю кодовую базу в Claude, чтобы найти одну пропущенную точку с запятой.

50 159

AI-индустрия научилась идеально генерировать не только текст, но и бессмысленные анонсы. Каждую неделю нам продают "революцию": новый агент, новый benchmark, новый copilot, новый способ случайно слить данные в AI провайдера. Разобраться, где там реальная польза, а где очередной демо-ролик для инвесторов, становится отдельной работой. В Похек AI как раз этим и занимаются: фильтруют AI-новости, разбирают обновления OpenAI/Anthropic/других вендоров, тестируют инструменты и пишут про AI security без религиозной веры в каждый новый релиз. Иначе ИИ-новости сейчас выглядят как: OpenAI что-то выкатил, Anthropic что-то улучшил, кто-то снова "убил программистов", а через неделю выясняется, что половина инфоповода была красивым пресс-релизом. Из полезного для старта - пост Где легально ломать LLM: площадки и лабы, где можно практиковаться без сомнительных историй. Если интересен AI не как хайп, а как поверхность атаки, инструмент защиты и новая боль для безопасников и разработчиков - канал стоит добавить в подписки)

50 159

Китайские кандзи теперь стали бенчмарком для VLLM Вышел открытый Chronicles-OCR - новый визуальный бенчмарк для проверки, насколько хорошо мультимодальные модели понимают древние китайские иероглифы. Идея очень крутая: модели дают не современные аккуратные символы из шрифта, а реальные исторические формы письма за 3000 лет эволюции. В датасете: • 7 исторических стилей письма - от гадательных костей до скорописи • 2800 сбалансированных изображений • разные физические носители, где символы выглядят совсем не как “чистый OCR” • задачи на поиск символов, распознавание, разбор древнего текста и классификацию стиля письма Почему это интересно? Потому что обычный OCR проверяет, умеет ли модель читать текст. А Chronicles-OCR проверяет другое: понимает ли VLLM, как меняется визуальная форма одного и того же знака во времени, на разных материалах и в разных стилях письма. Для мультимодальных моделей это больное место. Символ может быть тем же самым по смыслу, но визуально выглядеть как совершенно другой объект. И здесь сразу видно, где модель реально “видит”, а где просто угадывает по паттернам. Paper: https://arxiv.org/abs/2605.11960 GitHub: https://github.com/VirtualLUOUCAS/Chronicles-OCR

50 159

Repost from Machinelearning

🌟 Raindrop открыла исходный код локального отладчика агентов Workshop Инструмент интегрируется с Claude Code, Cursor и другими кодинг-агентами.

Raindrop - стартап из 9 человек, основанный в 2023 году, который позиционирует себя одним из первых, кто оформил мониторинг для ИИ-агентов как отдельный продуктовый класс.

При использовании Workshop модель получает прямой доступ к трассировкам выполнения, читает их, пишет оценочные тесты и правит код, замыкая цикл самовосстановления. Если агент в проде отклоняется от ожидаемого поведения, разработчик вызывает кодинг-агента прямо в терминале. Тот читает трассу через Workshop, пишет оценку под падающий сценарий, правит код и перезапускает прогон.

Цикл повторяется автоматически, пока не пройдут все проверки.

Workshop работает локально и стримит данные в реальном времени. Каждый токен, вызов инструмента и шаг рассуждения попадает в интерфейс по мере выполнения, без поллинга. Есть режим воспроизведение, который берёт трассу из продакшена и прогоняет её через ваш экземпляр агента, запущенный локально. Заявлена поддержка TypeScript, Python, Go и Rust, а также фреймворков Vercel AI SDK, OpenAI Agents SDK, Anthropic SDK, Claude Agent SDK, LangChain, LangGraph, CrewAI, Mastra, Pydantic AI и DSPy. 📌 Лицензирование: MIT License 🟡Документация 🖥GitHub @ai_machinelearning_big_data #AI #ML #Agents #Workshop #RaindropAI

50 159

Microsoft вбухивает десятки миллиардов в ИИ, но Copilot пока не стал новым топ-продуктом Бывший вице-президент Microsoft говорит неприятную вещь: компания рискует пропустить ИИ-волну так же, как когда-то не почувствовала интернет и мобильную эпоху. На бумаге всё выглядит мощно. Microsoft тратит на ИИ гигантские суммы, встраивает Copilot в Windows, Office, Teams, GitHub и продаёт идею «ИИ в каждом рабочем процессе». Но продукт не тянет сам себя. По оценке экспертов, меньше 3,3% пользователей Microsoft 365 реально платят за Copilot. Производители ноутбуков массово добавили NPU в новые устройства, но в Windows и Office так и не появилось killer-приложения, ради которого обычный человек скажет: «Да, мне срочно нужен AI-PC». Это очень болезненный урок для компании, которая десятилетиями выигрывала за счёт дистрибуции. Раньше достаточно было встроить продукт в Windows или Office, и рынок сам подтягивался. Сейчас так не работает. ИИ нельзя просто положить в меню «Пуск» и ждать магии. Пользователь должен почувствовать пользу сразу. Бывший VP не списывает Microsoft со счетов. Наоборот, он говорит, что корпоративный ров компании почти невозможно пробить. У Microsoft есть Office, Azure, Active Directory, Teams, контракты, безопасность, доверие CIO и доступ к рабочим данным. То есть обе мысли могут быть правдой одновременно: Microsoft пока не сделала Copilot продуктом, который люди массово хотят покупать. Но Microsoft всё ещё остаётся одной из немногих компаний, которые могут протащить ИИ в корпоративный мир на уровне инфраструктуры. https://www.windowslatest.com/2026/05/17/former-microsoft-vp-says-microsoft-missed-the-ai-wave-like-the-internet-and-mobile-as-copilot-scales-back-in-windows-11/

50 159

“We locked one HUNDER new CS grads in a room until they all find a job.” takes 5 years to film.

50 159

Китай выигрывает в гонке ИИ не только опенсорс моделями. Он выигрывает скоростью внедрения FT пишет, что китайская аудитория заметно спокойнее и позитивнее относится к AI-продуктам, чем пользователи во многих других странах. Когда люди не встречают каждый новый AI-сервис вопросом «а не заменит ли он меня завтра?», продуктам проще входить в повседневную жизнь. Банки, e-commerce, образование, доставка, госуслуги, корпоративные сервисы - всё это можно быстрее обкатывать на миллионах пользователей. Параллельно меняется и центр тяжести в open source. Доля загрузок всё сильнее уходит от США и Европы в сторону Китая. В итоге у Китая складывается редкая комбинация: • пользователи готовы пробовать AI-продукты • разработчики всё активнее идут в open source • компании быстро встраивают модели в реальные сервисы • рынок даёт огромный масштаб для тестов • государство и бизнес двигают инфраструктуру в одну сторону Что будет, если страна с миллиардным рынком, дешёвым внедрением и растущим open-source-комьюнити начнёт выкатывать AI-продукты быстрее всех остальных? ft.com/content/d9af562c-1d37-41b7-9aa7-a838dce3f571

50 159

Куда катится архитектура LLM в 2026 Себастьян Рашка разобрал свежие open-weight модели - Gemma 4, Laguna XS.2, ZAYA1-8B и DeepSeek V4. Общий тренд один: теперь главная борьба идёт не только за качество, а за цену длинного контекста. У reasoning-моделей и агентов узким местом стали KV-кэш, трафик памяти и FLOPs attention. Поэтому архитектуры всё активнее режут стоимость инференса. Gemma 4 шарит KV между слоями. Laguna XS.2 распределяет attention-бюджет по слоям. ZAYA1-8B считает внимание в сжатом латентном пространстве. DeepSeek V4 сжимает KV вдоль последовательности и усложняет residual stream. decoder-only трансформер жив, но всё вокруг attention быстро мутирует. Качество всё ещё тянут данные и training recipe, а архитектура всё чаще нужна, чтобы длинный контекст не сжигал железо. https://magazine.sebastianraschka.com/p/recent-developments-in-llm-architectures

50 159

⚡️ Глава NVIDIA в обращении к студентам ит специальностей: ваш главный конкурент - электрик! Дженсен Хуанг выступал перед выпускниками Carnegie Mellon и сказал довольно жёсткую вещь: в ближайшие годы огромный шанс будет не только у программистов, а у электриков, сантехников, сварщиков, техников и строителей. И звучит это уже не как ИИ нужны дата-центры, электричество, охлаждение, кабели, трубы, бетон, стойки, обслуживание и люди, которые всё это физически построят. Пока одни спорят, кого заменят нейросети, спрос на рабочие специальности летит вверх: • робототехники - плюс 107% • HVAC-инженеры - плюс 67% • специалисты по промышленной автоматизации - плюс 51% • традиционные рабочие профессии - плюс 27% за последние годы Парадокс эпохи ИИ в том, что победителем может оказаться не prompt engineer, а человек, который умеет подключить 100-мегаваттный дата-центр где-нибудь в пустыне Невады. Код можно сгенерировать. А вот кабель сам себя не протянет. https://consent.yahoo.com/v2/collectConsent?sessionId=3_cc-session_096f2d7d-f863-4ee4-8fc8-af10b78de394

50 159

Repost from Rust

👣 Я заставил LLM писать Rust полгода. Вот что они стабильно ломают Полгода я использовал Claude, GPT и Cursor как основной инструмент для написания Rust-кода в проде. Не как «помощник для бойлерплейта», а как полноценного второго разработчика на монолите примерно в 80 тысяч строк (бэкенд обработки потоковых данных, tokio, sqlx, немного unsafe в hot path). Доля сгенерированного кода в коммитах последних шести месяцев около 40%, остальное это правки, рефакторинг и места, куда модель я не пускаю. За это время накопилась коллекция ошибок, которые модели делают с пугающей регулярностью, и которые проходят cargo build, проходят cargo test, иногда даже проходят cargo clippy, и при этом являются либо UB, либо логически некорректным кодом, либо тем самым «работает на моей машине». Я не буду писать, какая модель лучше. К моменту публикации статьи рейтинг устареет. Я расскажу про категории ошибок, которые воспроизводятся у всех топовых моделей весной 2026 года, и которые упираются не в качество обучающих данных, а в фундаментальные слепые пятна архитектуры трансформеров применительно к системе типов Rust. Цифры, которые буду приводить дальше, получены так: я завёл бенчмарк из 50 типовых задач (написать функцию, отрефакторить, добавить фичу), прогонял каждую через четыре модели в течение полугода, и руками классифицировал ошибки. Это не academic-level статистика, но порядки величин показывает. 🔜 Читать дальше @rust_code

50 159

Трамп садясь в самолет отдал приказ: всё китайское - в мусорку, ничего не заносить на Air Force One Перед самой посадкой на борт американские сотрудники собрали всё, что китайская сторона раздала делегации: пресс-бейджи, burner phones и значки делегации. После этого всё выбросили в мусорку. Журналист Daily Mail, сопровождавший Белый дом, видел это лично: «Ничего китайского на борт не занесли». Китай сильнейшая держава в мире по кибершпионажу, и даже в обычный значок теоретически может быть встроено устройство для прослушки. Рукопожатия есть. Доверия - ноль. Вот реальность отношений США и Китая. https://x.com/Machinelearrn/status/2055264980925305005

50 159

Когда твой менеджер - ИИ. 😂

50 159

Как усилить ИБ: управление данными и ML-технологии для защиты бизнеса Когда киберриски растут, а требования к защите данных ужесточаются, перед компаниями стоит вопрос: как обеспечить высокий уровень ИБ без роста бюджета? Эксперты «Инфосистемы Джет», Arenadata и «Аксель Про» проведут совместный митап, где подтвердят, что ответ в сочетании проверенных решений и современных технологий. Что в программе? 🔹Реальные кейсы сбора данных в ИБ: когда выгоднее использовать готовые инструменты вместо самостоятельной разработки 🔹Тренды рынка ИБ: кто лидирует, какие технологии набирают популярность и куда двигаться дальше 🔹ML-кейсы для ИБ в реальной ИТ-среде: от анализа логов до задач с LLM 🔹Дата-контракты, карта данных и профилирование — как инструменты управления данными помогают ИБ 🔹Как управление данными и их качество повышают уровень ИБ Когда: 26 мая в 11:00 МСК Формат: онлайн Регистрация на бесплатный митап на сайте.

50 159

Узнайте, какие локальные модели потянет ваш ПК Полезный сервис для тех, кто запускает LLM локально и не хочет гадать, какая модель влезет в железо без боли. Как работает: - указываете GPU, VRAM и RAM - получаете список моделей, которые нормально запустятся на вашем ПК - видите квантование, примерную скорость и контекстное окно - поддерживается железо NVIDIA, AMD, Intel и Apple Особенно удобно, если собираете ИИ-агентов, тестируете локальные модели или выбираете железо под inference. Больше не нужно вручную считать память и перебирать модели наугад. https://whatmodelscanirun.com/

50 159

начальник в прошлом году / начальник сейчас

50 159

Пацаны, ещё есть время переучиться