Анализ данных (Data analysis)

Відкрити в Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Сітка:Machinelearning Росія12 568 Технології та додатки2 674...

📈 Аналітичний огляд Telegram-каналу Анализ данных (Data analysis)

Канал Анализ данных (Data analysis) (@data_analysis_ml) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 50 188 підписників, посідаючи 2 674 місце в категорії Технології та додатки та 12 568 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 50 188 підписників.

За останніми даними від 11 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -1 975, а за останні 24 години на -4, загальне охоплення залишається високим.

Статус верифікації: Не верифікований
Рівень залученості (ER): Середній показник залученості аудиторії становить 9.28%. Протягом перших 24 годин після публікації контент зазвичай збирає 5.80% реакцій від загальної кількості підписників.
Охоплення публікацій: В середньому кожен допис отримує 4 656 переглядів. Протягом першої доби публікація в середньому набирає 2 912 переглядів.
Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 32.
Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як llm, контекст, openai, архитектура, deepseek.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Завдяки високій частоті оновлень (останні дані отримано 12 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

50 188

Підписники

-424 години

-227 днів

-1 97530 день

4 656

Перегляди допису

~ 2 91224 години

~ 3 40848 годин

9.28%

Коефіцієнт залучення

~ 5

Дописів на день

Ads index

beta

Архів дописів

50 159

Промышленный ИИ окончательно перестает быть теорией, и на ЦИПР-2026 это показали максимально прикладно. «Норникель» уже встроил ИИ в цепочку от измельчения руды до выпуска концентрата. Алгоритмы в реальном времени подбирают режимы и меняют параметры, а ключевой фактор, как говорят в Норникеле, скорость: решения принимаются за секунды. На масштабе это дает около 10 млрд рублей в год уже сейчас, с ориентиром 50 млрд к 2030. Важно, что это не про замену человека, оператор остается в контуре и контролирует безопасность. По сути, это модель «усиленного человека», а не автономного ИИ. Еще один сдвиг, который прозвучал на ЦИПР: импортозамещение — только первый этап. Поверх него строятся собственные системы с ИИ, от предиктивной аналитики до управления добычей. И главное: промышленный ИИ уходит от универсальных моделей к доменным. В выигрыше не самый большой LLM, а тот, кто глубже понимает конкретный процесс. Именно такие узкие, встроенные решения сейчас и становятся драйвером industrial AI.

50 159

Андрей Карпаты перешёл в Anthropic Один из самых известных людей в индустрии — сооснователь OpenAI, бывший директор по ИИ в Tesla, автор легендарных лекций по нейросетям - официально объявил о переходе в Anthropic. В твите он написал, что ближайшие несколько лет на фронтире LLM будут особенно формирующими, и он рад вернуться к R&D в команде Anthropic. Образовательные проекты, включая Eureka Labs, обещает не бросать и вернуться к ним позже. Карпаты последние пару лет фактически был «свободным агентом» - выпускал собственные туториалы, строил Eureka Labs, считался одной из самых независимых фигур в ИИ. Его выбор в пользу Anthropic, а не OpenAI, xAI или Google, многое говорит о том, где сейчас концентрируется самая интересная исследовательская работа. С учётом недавнего policy paper Anthropic про 2028 год и фронтирные модели — у компании явно идёт серьёзная фаза найма под большие задачи. https://x.com/karpathy/status/2056753169888334312

50 159

⚡️ SkyClaw-v1.0: новая модель под tool use и агентные задачи Skywork представила SkyClaw-v1.0 - агентную модель, оптимизированную под OpenClaw, Hermes и Nanobot. Фокус на сценариях, где модель должна работать с инструментами и вести задачу в несколько ходов: выбрать tool, собрать аргументы, обработать ответ, продолжить выполнение и не развалиться на длинной цепочке действий. Вместе с основной версией вышла SkyClaw-v1.0-lite - более быстрая и дешёвая версия для сценариев, где важна стоимость запуска. Модель обучали в собственном окружении OpenClaw: с качественными инструментами и синтетическими задачами, собранными из реальных пользовательских паттернов. То есть её специально подгоняли под агентную работу, а не просто добавили tool calling поверх обычной языковой модели. По заявлению Skywork, на PinchBench, Claw-Eval и Skywork-Claw-Bench обе версии обходят: - Minimax 2.7 - DeepSeek V4 Flash - Qwen 3.6 35B A3B - Qwen 3.6 27B https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api

50 159

⚡Когда аналитика разнесена по отдельным системам, бизнес долго ждет данные и платит за лишние кластеры, ETL и серверы. 🐘Postgres Pro AXE — аналитическая СУБД от Postgres Professional на знакомом PostgreSQL. Ускоряет доставку аналитики и снижает TCO на хранение и обработку данных. ✔️До 20 раз быстрее Greenplum На сложных запросах в тестах ClickBench, TPC-H и TPC-DS. ✔️До 10 раз меньше ресурсов При сопоставимой нагрузке с MPP-аналогами. ✔️Аналитика ближе к рабочим данным Postgres Pro AXE работает как отдельная аналитическая СУБД или расширяет Postgres Pro Enterprise аналитическими возможностями на существующих узлах. ✔️Быстрый старт для команды Знакомый PostgreSQL снижает порог входа для администраторов и разработчиков. ✔️Свобода хранения и BI Локальный сервер, сетевая шара или S3. Данные — в формате Parquet. 🔗Приходите 28 мая на бесплатный вебинар: покажем, как построить аналитику без зоопарка технологий.

50 159

Я, закидывающий всю кодовую базу в Claude, чтобы найти одну пропущенную точку с запятой.

50 159

AI-индустрия научилась идеально генерировать не только текст, но и бессмысленные анонсы. Каждую неделю нам продают "революцию": новый агент, новый benchmark, новый copilot, новый способ случайно слить данные в AI провайдера. Разобраться, где там реальная польза, а где очередной демо-ролик для инвесторов, становится отдельной работой. В Похек AI как раз этим и занимаются: фильтруют AI-новости, разбирают обновления OpenAI/Anthropic/других вендоров, тестируют инструменты и пишут про AI security без религиозной веры в каждый новый релиз. Иначе ИИ-новости сейчас выглядят как: OpenAI что-то выкатил, Anthropic что-то улучшил, кто-то снова "убил программистов", а через неделю выясняется, что половина инфоповода была красивым пресс-релизом. Из полезного для старта - пост Где легально ломать LLM: площадки и лабы, где можно практиковаться без сомнительных историй. Если интересен AI не как хайп, а как поверхность атаки, инструмент защиты и новая боль для безопасников и разработчиков - канал стоит добавить в подписки)

50 159

Китайские кандзи теперь стали бенчмарком для VLLM Вышел открытый Chronicles-OCR - новый визуальный бенчмарк для проверки, насколько хорошо мультимодальные модели понимают древние китайские иероглифы. Идея очень крутая: модели дают не современные аккуратные символы из шрифта, а реальные исторические формы письма за 3000 лет эволюции. В датасете: • 7 исторических стилей письма - от гадательных костей до скорописи • 2800 сбалансированных изображений • разные физические носители, где символы выглядят совсем не как “чистый OCR” • задачи на поиск символов, распознавание, разбор древнего текста и классификацию стиля письма Почему это интересно? Потому что обычный OCR проверяет, умеет ли модель читать текст. А Chronicles-OCR проверяет другое: понимает ли VLLM, как меняется визуальная форма одного и того же знака во времени, на разных материалах и в разных стилях письма. Для мультимодальных моделей это больное место. Символ может быть тем же самым по смыслу, но визуально выглядеть как совершенно другой объект. И здесь сразу видно, где модель реально “видит”, а где просто угадывает по паттернам. Paper: https://arxiv.org/abs/2605.11960 GitHub: https://github.com/VirtualLUOUCAS/Chronicles-OCR

50 159

Repost from Machinelearning

🌟 Raindrop открыла исходный код локального отладчика агентов Workshop Инструмент интегрируется с Claude Code, Cursor и другими кодинг-агентами.

Raindrop - стартап из 9 человек, основанный в 2023 году, который позиционирует себя одним из первых, кто оформил мониторинг для ИИ-агентов как отдельный продуктовый класс.

При использовании Workshop модель получает прямой доступ к трассировкам выполнения, читает их, пишет оценочные тесты и правит код, замыкая цикл самовосстановления. Если агент в проде отклоняется от ожидаемого поведения, разработчик вызывает кодинг-агента прямо в терминале. Тот читает трассу через Workshop, пишет оценку под падающий сценарий, правит код и перезапускает прогон.

Цикл повторяется автоматически, пока не пройдут все проверки.

Workshop работает локально и стримит данные в реальном времени. Каждый токен, вызов инструмента и шаг рассуждения попадает в интерфейс по мере выполнения, без поллинга. Есть режим воспроизведение, который берёт трассу из продакшена и прогоняет её через ваш экземпляр агента, запущенный локально. Заявлена поддержка TypeScript, Python, Go и Rust, а также фреймворков Vercel AI SDK, OpenAI Agents SDK, Anthropic SDK, Claude Agent SDK, LangChain, LangGraph, CrewAI, Mastra, Pydantic AI и DSPy. 📌 Лицензирование: MIT License 🟡Документация 🖥GitHub @ai_machinelearning_big_data #AI #ML #Agents #Workshop #RaindropAI

50 159

Microsoft вбухивает десятки миллиардов в ИИ, но Copilot пока не стал новым топ-продуктом Бывший вице-президент Microsoft говорит неприятную вещь: компания рискует пропустить ИИ-волну так же, как когда-то не почувствовала интернет и мобильную эпоху. На бумаге всё выглядит мощно. Microsoft тратит на ИИ гигантские суммы, встраивает Copilot в Windows, Office, Teams, GitHub и продаёт идею «ИИ в каждом рабочем процессе». Но продукт не тянет сам себя. По оценке экспертов, меньше 3,3% пользователей Microsoft 365 реально платят за Copilot. Производители ноутбуков массово добавили NPU в новые устройства, но в Windows и Office так и не появилось killer-приложения, ради которого обычный человек скажет: «Да, мне срочно нужен AI-PC». Это очень болезненный урок для компании, которая десятилетиями выигрывала за счёт дистрибуции. Раньше достаточно было встроить продукт в Windows или Office, и рынок сам подтягивался. Сейчас так не работает. ИИ нельзя просто положить в меню «Пуск» и ждать магии. Пользователь должен почувствовать пользу сразу. Бывший VP не списывает Microsoft со счетов. Наоборот, он говорит, что корпоративный ров компании почти невозможно пробить. У Microsoft есть Office, Azure, Active Directory, Teams, контракты, безопасность, доверие CIO и доступ к рабочим данным. То есть обе мысли могут быть правдой одновременно: Microsoft пока не сделала Copilot продуктом, который люди массово хотят покупать. Но Microsoft всё ещё остаётся одной из немногих компаний, которые могут протащить ИИ в корпоративный мир на уровне инфраструктуры. https://www.windowslatest.com/2026/05/17/former-microsoft-vp-says-microsoft-missed-the-ai-wave-like-the-internet-and-mobile-as-copilot-scales-back-in-windows-11/

50 159

“We locked one HUNDER new CS grads in a room until they all find a job.” takes 5 years to film.

50 159

Китай выигрывает в гонке ИИ не только опенсорс моделями. Он выигрывает скоростью внедрения FT пишет, что китайская аудитория заметно спокойнее и позитивнее относится к AI-продуктам, чем пользователи во многих других странах. Когда люди не встречают каждый новый AI-сервис вопросом «а не заменит ли он меня завтра?», продуктам проще входить в повседневную жизнь. Банки, e-commerce, образование, доставка, госуслуги, корпоративные сервисы - всё это можно быстрее обкатывать на миллионах пользователей. Параллельно меняется и центр тяжести в open source. Доля загрузок всё сильнее уходит от США и Европы в сторону Китая. В итоге у Китая складывается редкая комбинация: • пользователи готовы пробовать AI-продукты • разработчики всё активнее идут в open source • компании быстро встраивают модели в реальные сервисы • рынок даёт огромный масштаб для тестов • государство и бизнес двигают инфраструктуру в одну сторону Что будет, если страна с миллиардным рынком, дешёвым внедрением и растущим open-source-комьюнити начнёт выкатывать AI-продукты быстрее всех остальных? ft.com/content/d9af562c-1d37-41b7-9aa7-a838dce3f571

50 159

Куда катится архитектура LLM в 2026 Себастьян Рашка разобрал свежие open-weight модели - Gemma 4, Laguna XS.2, ZAYA1-8B и DeepSeek V4. Общий тренд один: теперь главная борьба идёт не только за качество, а за цену длинного контекста. У reasoning-моделей и агентов узким местом стали KV-кэш, трафик памяти и FLOPs attention. Поэтому архитектуры всё активнее режут стоимость инференса. Gemma 4 шарит KV между слоями. Laguna XS.2 распределяет attention-бюджет по слоям. ZAYA1-8B считает внимание в сжатом латентном пространстве. DeepSeek V4 сжимает KV вдоль последовательности и усложняет residual stream. decoder-only трансформер жив, но всё вокруг attention быстро мутирует. Качество всё ещё тянут данные и training recipe, а архитектура всё чаще нужна, чтобы длинный контекст не сжигал железо. https://magazine.sebastianraschka.com/p/recent-developments-in-llm-architectures

50 159

⚡️ Глава NVIDIA в обращении к студентам ит специальностей: ваш главный конкурент - электрик! Дженсен Хуанг выступал перед выпускниками Carnegie Mellon и сказал довольно жёсткую вещь: в ближайшие годы огромный шанс будет не только у программистов, а у электриков, сантехников, сварщиков, техников и строителей. И звучит это уже не как ИИ нужны дата-центры, электричество, охлаждение, кабели, трубы, бетон, стойки, обслуживание и люди, которые всё это физически построят. Пока одни спорят, кого заменят нейросети, спрос на рабочие специальности летит вверх: • робототехники - плюс 107% • HVAC-инженеры - плюс 67% • специалисты по промышленной автоматизации - плюс 51% • традиционные рабочие профессии - плюс 27% за последние годы Парадокс эпохи ИИ в том, что победителем может оказаться не prompt engineer, а человек, который умеет подключить 100-мегаваттный дата-центр где-нибудь в пустыне Невады. Код можно сгенерировать. А вот кабель сам себя не протянет. https://consent.yahoo.com/v2/collectConsent?sessionId=3_cc-session_096f2d7d-f863-4ee4-8fc8-af10b78de394

50 159

Repost from Rust

👣 Я заставил LLM писать Rust полгода. Вот что они стабильно ломают Полгода я использовал Claude, GPT и Cursor как основной инструмент для написания Rust-кода в проде. Не как «помощник для бойлерплейта», а как полноценного второго разработчика на монолите примерно в 80 тысяч строк (бэкенд обработки потоковых данных, tokio, sqlx, немного unsafe в hot path). Доля сгенерированного кода в коммитах последних шести месяцев около 40%, остальное это правки, рефакторинг и места, куда модель я не пускаю. За это время накопилась коллекция ошибок, которые модели делают с пугающей регулярностью, и которые проходят cargo build, проходят cargo test, иногда даже проходят cargo clippy, и при этом являются либо UB, либо логически некорректным кодом, либо тем самым «работает на моей машине». Я не буду писать, какая модель лучше. К моменту публикации статьи рейтинг устареет. Я расскажу про категории ошибок, которые воспроизводятся у всех топовых моделей весной 2026 года, и которые упираются не в качество обучающих данных, а в фундаментальные слепые пятна архитектуры трансформеров применительно к системе типов Rust. Цифры, которые буду приводить дальше, получены так: я завёл бенчмарк из 50 типовых задач (написать функцию, отрефакторить, добавить фичу), прогонял каждую через четыре модели в течение полугода, и руками классифицировал ошибки. Это не academic-level статистика, но порядки величин показывает. 🔜 Читать дальше @rust_code

50 159

Трамп садясь в самолет отдал приказ: всё китайское - в мусорку, ничего не заносить на Air Force One Перед самой посадкой на борт американские сотрудники собрали всё, что китайская сторона раздала делегации: пресс-бейджи, burner phones и значки делегации. После этого всё выбросили в мусорку. Журналист Daily Mail, сопровождавший Белый дом, видел это лично: «Ничего китайского на борт не занесли». Китай сильнейшая держава в мире по кибершпионажу, и даже в обычный значок теоретически может быть встроено устройство для прослушки. Рукопожатия есть. Доверия - ноль. Вот реальность отношений США и Китая. https://x.com/Machinelearrn/status/2055264980925305005

50 159

Когда твой менеджер - ИИ. 😂

50 159

Как усилить ИБ: управление данными и ML-технологии для защиты бизнеса Когда киберриски растут, а требования к защите данных ужесточаются, перед компаниями стоит вопрос: как обеспечить высокий уровень ИБ без роста бюджета? Эксперты «Инфосистемы Джет», Arenadata и «Аксель Про» проведут совместный митап, где подтвердят, что ответ в сочетании проверенных решений и современных технологий. Что в программе? 🔹Реальные кейсы сбора данных в ИБ: когда выгоднее использовать готовые инструменты вместо самостоятельной разработки 🔹Тренды рынка ИБ: кто лидирует, какие технологии набирают популярность и куда двигаться дальше 🔹ML-кейсы для ИБ в реальной ИТ-среде: от анализа логов до задач с LLM 🔹Дата-контракты, карта данных и профилирование — как инструменты управления данными помогают ИБ 🔹Как управление данными и их качество повышают уровень ИБ Когда: 26 мая в 11:00 МСК Формат: онлайн Регистрация на бесплатный митап на сайте.

50 159

Узнайте, какие локальные модели потянет ваш ПК Полезный сервис для тех, кто запускает LLM локально и не хочет гадать, какая модель влезет в железо без боли. Как работает: - указываете GPU, VRAM и RAM - получаете список моделей, которые нормально запустятся на вашем ПК - видите квантование, примерную скорость и контекстное окно - поддерживается железо NVIDIA, AMD, Intel и Apple Особенно удобно, если собираете ИИ-агентов, тестируете локальные модели или выбираете железо под inference. Больше не нужно вручную считать память и перебирать модели наугад. https://whatmodelscanirun.com/

50 159

начальник в прошлом году / начальник сейчас

50 159

Пацаны, ещё есть время переучиться