Анализ данных (Data analysis)
前往频道在 Telegram
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
显示更多📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览
频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 50 188 名订阅者,在 技术与应用 类别中位列第 2 674,并在 俄罗斯 地区排名第 12 568 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 50 188 名订阅者。
根据 11 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -1 975,过去 24 小时变化为 -4,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 9.28%。内容发布后 24 小时内通常能获得 5.80% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 4 656 次浏览,首日通常累积 2 912 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 32。
- 主题关注点: 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
凭借高频更新(最新数据采集于 12 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
50 188
订阅者
-424 小时
-227 天
-1 97530 天
帖子存档
The AI Scientist официально вышел в Nature - и это уже не просто эксперимент.
Речь про систему, которая способна автоматизировать весь цикл научного исследования:
- генерировать идеи
- писать код
- запускать эксперименты
- оформлять научную статью
Обновлённая версия AI Scientist-v2 уже сгенерировала первую полностью AI-сгенерированную научную работу,
которая прошла полноценное рецензирование людьми.
Теперь вышла публикация в Nature,
где подробно разобрана архитектура системы и показано, как всё это работает на практике.
В ИИ-систему добавили Automated Reviewer - AI-рецензента, который оценивает статьи
на уровне человека и даже стабильнее, чем сами люди.
Исследователями обнаружен прямой закон масштабирования науки -
чем сильнее базовая модель,
тем выше качество научных работ, которые она генерирует.
Это означает простую вещь:
По мере роста моделей и удешевления вычислений
качество AI-науки будет расти автоматически.
Фактически мы подошли к точке,
где исследования можно масштабировать так же, как сегодня масштабируют код или контент.
• Nature: https://nature.com/articles/s41586-026-10265-5
• Blog: https://sakana.ai/ai-scientist-nature
Все что выпустили Antropic за последнее время.
73 релиза за 52 дня.
⚡️ MWS Cloud выпустил сервис по работе с большими языковыми моделями.
MWS GPT Model Hub — облачный сервис, который предоставляет доступ к LLM внутри MWS Cloud Platform. Развертывание занимает секунды, модели подключаются через OpenAI‑совместимый API.
Сейчас в сервисе 10 моделей, включая DeepSeek, Google, Alibaba, Zhipu AI. До конца года добавят еще десяток — с поддержкой преобразования текста в речь и аудио в текст.
Что можно делать с помощью MWS GPT Model Hub:
• запускать AI‑ассистентов без настройки инфраструктуры;
• обрабатывать большие объемы текстовых данных;
• создавать внутренние AI‑сервисы для сотрудников;
• сокращать time‑to‑market вдвое за счет быстрого прототипирования;
• внедрять интеллектуальный поиск в продукты.
К плюшкам: встроенные инструменты биллинга и учета ресурсов отслеживают расходы на AI‑функции по проектам и командам.
В Claude Code агент теперь сам решает, какие действия можно выполнять 👇
Раньше было два режима:
- либо он постоянно спрашивает разрешение
- либо
skip permissions - делает всё без спроса
Первое раздражает.
Второе - рискованно.
Теперь появился auto mode.
В этом режиме Claude:
- сам принимает решения о доступах
- оценивает каждое действие
- безопасные - выполняет сразу
- рискованные - блокирует или ищет альтернативу
По сути:
• это тот же skip permissions, но с встроенной проверкой на потенциальный вред
🧠 Под капотом - классификатор, который анализирует каждый шаг агентаКак перейти от ИИ-экспериментов к рабочим системам
Рассказываем, где узнать реальный опыт тех, кто встроил искусственный интеллект в ключевые процессы компании и извлек из этого реальную выгоду. 22 апреля присоединяйтесь к конференции МЛечный путь от Selectel, провайдера инфраструктуры для ИИ.
Эксперты топовых ИТ-компаний расскажут:
🔺Как ускорить ML-пайплайны и снизить издержки на инференс без потери качества
🔺Как безопасно внедрить генеративные модели в ключевые процессы и управлять эффектом этого внедрения
🔺Как интегрировать модели в существующую ИТ-архитектуру
Конференция пройдет 22 апреля в Москве. Участие бесплатное, регистрируйтесь: https://slc.tl/ib77j
Реклама. АО "Селектел". erid:2W5zFHjUoay
Google представили TurboQuant - алгоритм, который сильно снижает требования к памяти при работе LLM.
KV-cache - это то, что хранит весь контекст во время генерации.
И именно он сейчас становится главным ограничением, а не сами модели.
Чем длиннее диалог или больше пользователей, тем быстрее заканчивается память на GPU.
TurboQuant решает это так:
- сжимает KV-cache минимум в 6 раз
- ускоряет инференс до 8 раз
- сохраняет качество без заметной потери
Это ключевой момент: раньше компрессия почти всегда ухудшала ответы.
Как это устроено:
- сначала данные преобразуются (rotation), чтобы их было проще сжимать
- затем применяется основной алгоритм сжатия (PolarQuant)
- после этого добавляется лёгкая коррекция (QJL), которая убирает ошибки
В итоге получается почти точное восстановление при сильно меньшем объёме.
С TurboQuant:
- модели можно запускать на меньшем количестве GPU
- один сервер может обслуживать больше запросов
- становится проще работать с длинным контекстом
- падает стоимость инференса
По сути, это не про “ускорить модель”, а про перераспределение ресурсов внутри всей системы.
Раньше оптимизировали веса моделей
теперь оптимизируют то, как они работают в проде
И KV-cache, как раз одна из самых дорогих частей.
https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/
🐍 полезные ресурсы 🚀Max
@data_analysis_ml
🚀 Похоже, в Claude Code появилась новая фича - Auto-dream
Пока официально не анонсирована, но её уже заметили в
/memory
• Что это такое
Auto-dream - это фоновый подагент Claude, который:
- анализирует последние сессии
- извлекает ключевые знания
- обновляет MEMORY.md
- очищает и переорганизует старые данные
• Как устроена память
- MEMORY.md - это индекс
- отдельные файлы - детали по темам
- /memory - управление системой
👉 по сути, как garbage collector, но для памяти
🐍 Python полезные ресурсы 🚀Max
@data_analysis_ml🚀 Cursor сделал regex-поиск мгновенным
Instant Grep ищет по миллионам файлов за миллисекунды
16.8 сек → 13 мс
И главное:
они не ускоряли regex
они убрали лишний поиск
🧠 Как это работает
- создаётся индекс: куски текста → файлы
- используются триграммы (fil, ile, le_)
- сначала ищутся кандидаты
- потом запускается regex
👉 большинство файлов вообще не открывается
🔥 Ключевая идея - sparse n-grams
- индексируются не все куски
- только самые «полезные»
- редкие символы имеют больший вес
💾 Всё локально
- индекс хранится у тебя
- привязан к Git
- быстрый доступ через memory map
Скорость даёт не regex
а умный отбор файлов до поиска.
https://x.com/cursor_ai/status/2036122609931165985
Если вы работаете с выгрузками из баз, логами сервисов или отчетами за годы — вы уже имеете дело со значениями, разделенными запятыми (CSV). Но умеете ли вы загружать CSV в Spark правильно?
На открытом уроке разберем, как из плоского файла получить распределенную коллекцию данных — DataFrame. Поймем, почему DataFrame — это не просто таблица, как настраивать разбор грязных данных, объявлять схему вручную и избегать ошибок в промышленной среде.
Вы увидите, как Spark взаимодействует с файловой системой, научитесь писать код для загрузки CSV в PySpark или Scala и разберетесь, когда достаточно pandas, а когда без Spark не обойтись.
Открытый урок проходит в преддверии старта курса «Spark-разработчик».
➡️ Подробности и регистрация: https://otus.pw/XM07/
🚀 Anthropic показали новый режим:
AI может выполнять задачи на компьютере и по расписанию без твоего участия
Главное:
- Claude управляет компьютером
- кликает, вводит текст, открывает сайты
- выполняет задачи в браузере и приложениях
+ появился режим /schedule:
- ставишь задачу → задаёшь время
- Claude сам запускает и выполняет её
- даже если твой ноут выключен
- отчёты генерируются сами
- соцсети мониторятся автоматически
- задачи выполняются без контроля
https://claude.com/product/cowork#dispatch-and-computer-use
🐍 Python полезные ресурсы 🚀Max
@data_analysis_ml
🚀 Ускоряем внедрение ИИ-агентов в реальные задачи на Agents Week
Насыщенный интенсив от Школы анализа данных Яндекса пройдет с 6 по 10 апреля. Много про инженерных подход к современным агентным системам, их мониторинг и масштабирование. За пять дней поймете, с чего начать проектирование и настройку поведения, какие есть практики построения single-agent и multi-agent-систем, как доводить агентов о продакшена.
Формат: лекции с возможностью задать вопрос экспертам и практика.
Программа и спикеры — по ссылке. Там же можно зарегистрироваться до 9 апреля включительно.
Repost from Machine learning Interview
🤖 Этот open-source репозиторий даёт твоему ClawdBot “зрение”
Это AI-ассистент в реальном времени для умных очков Meta Ray-Ban.
Он объединяет:
→ голос
→ зрение
→ действия агента
Работает через Gemini Live и OpenClaw.
Как это выглядит:
Ты надеваешь очки → нажимаешь кнопку AI → просто говоришь
Дальше:
• Gemini видит через камеру очков и описывает происходящее
• передаёт задачу в OpenClaw
• OpenClaw выполняет её через подключённые приложения
Можно:
→ отправлять сообщения в WhatsApp / Telegram / iMessage
→ искать информацию в интернете
→ получать ответы голосом
📊 Технически:
• камера очков передаёт изображение примерно 1 кадр в секунду в Gemini
• аудио работает в обе стороны в реальном времени
• OpenClaw выполняет действия как агент
По сути, это полноценный AI-ассистент, который видит мир вместе с тобой
https://github.com/Intent-Lab/VisionClaw
🐍 Python полезные ресурсы 🚀Max
Как запустить микросервисы в Managed Kubernetes
Микросервисное приложение мало просто задеплоить — нужны правила запуска, обновлений, масштабирования и изоляции. Именно они делают эксплуатацию предсказуемой, а инфраструктуру — готовой к росту нагрузки.На вебинаре 26 марта в 11:00 эксперты Cloud.ru разберут, как превратить Managed Kubernetes в удобную и надежную платформу для работы микросервисов. В программе:
1️⃣ разберете, в каких проектах микросервисы действительно нужны и как быстро запустить готовое масштабируемое решение в облаке без лишних сложностей; 2️⃣ рассмотрите базовую структуру Kubernetes для микросервисов: что потребуется сразу, а что можно отложить; 3️⃣обсудите, как организовать деплой, обновления и откаты, чтобы релизы были управляемыми; 4️⃣ настроите масштабирование с помощью нативных инструментов Kubernetes; 5️⃣ свяжете платформу с реестром артефактов; 6️⃣ узнаете, как следить за метриками и логами приложения.👉Зарегистрироваться👈
⚡️ Лучшие GitHub-репозитории для Claude Code, которые могут увеличить эффективность твоего следующего проекта
1. Superpowers
https://github.com/obra/superpowers
2. Awesome Claude Code
https://github.com/hesreallyhim/awesome-claude-code
3. GSD (Get Shit Done)
https://github.com/gsd-build/get-shit-done
4. Claude Mem
https://github.com/thedotmack/claude-mem
5. UI UX Pro Max
https://github.com/nextlevelbuilder/ui-ux-pro-max-skill
6. n8n-MCP
https://github.com/czlonkowski/n8n-mcp
7. Obsidian Skills
https://github.com/kepano/obsidian-skills
8. LightRAG
https://github.com/hkuds/lightrag
9. Everything Claude Code
https://github.com/affaan-m/everything-claude-code
🎯Полезные Мл-ресурсы 🚀 Max
@data_analysis_ml
🤖 Palantir AI + Claude использовались для обнаружения, приоритизации и ударов по более чем 1000 целям в первые 24 часа операции против Ирана
Результат оказался настолько мощным и прорывным, что Пентагон даже не стал ждать.
То, что раньше было просто пилотным проектом и тестировалось в ограниченном режиме…
в один момент стало официальным, постоянным и начало масштабироваться повсюду.
Теперь Palantir - это ключевой “AI-мозг” всей армии США.
Система уже внедряется во все роды войск.
https://www.moneycontrol.com/world/how-palantir-and-anthropic-ai-helped-the-us-hit-1-000-iran-targets-in-24-hours-article-13853331.html
🎯Полезные Мл-ресурсы 🚀 Max
@data_analysis_ml
Это уже не code review.
Это distributed system из двух LLM, которые дебажат друг друга.
🔥 Очень любопытный проект: Supermemory показал 99% на SOTA-бенчмарке памяти
• Supermemory набрал ~99% на LongMemEval_s с использованием экспериментальной техники ASMR (Agentic Search and Memory Retrieval)
• Вместо классического vector search и embeddings используется система параллельных агентов-наблюдателей, которые извлекают структурированные знания из истории взаимодействий сразу по нескольким направлениям
• Используются специализированные поисковые агенты:
→ для точных фактов
→ для связанного контекста
→ для восстановления временной последовательности
• И самое интересное, никакой векторной базы данных не требуется
🚀 Проект станет open-source уже через 11 дней, следим:
https://x.com/DhravyaShah/status/2035517012647272689
🎯Полезные Мл-ресурсы 🚀 Max
@data_analysis_ml
⚡️ Андрей Карпаты: спрос на софт взлетит, но это временно
Он отметил важный сдвиг:
Теперь код стал ephemeral (эфемерным, временным).
Его можно:
— переписать за секунды
— адаптировать под любого пользователя
— менять прямо на лету
Фактически весь digital-мир начинает пересобираться в реальном времени.
Что это значит:
• 📈 В краткосрочной перспективе
Спрос на разработку резко растёт,
потому что теперь можно сделать гораздо больше за то же время.
• 🤯 В долгосрочной перспективе
Даже те, кто создаёт AI, понимают:
они могут автоматизировать собственную работу.
Мы приходим к новой реальности: код больше не статичный продукт -
это динамический поток, который постоянно меняется.
Полное интервью: https://www.youtube.com/watch?v=kwSVtQ7dziU&t=1s
🎯Полезные Мл-ресурсы 🚀 Max
@data_analysis_ml
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
