Анализ данных (Data analysis)

Відкрити в Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Сітка:Machinelearning Росія12 559 Технології та додатки2 679...

📈 Аналітичний огляд Telegram-каналу Анализ данных (Data analysis)

Канал Анализ данных (Data analysis) (@data_analysis_ml) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 50 152 підписників, посідаючи 2 679 місце в категорії Технології та додатки та 12 559 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 50 152 підписників.

За останніми даними від 13 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -42, а за останні 24 години на -11, загальне охоплення залишається високим.

Статус верифікації: Не верифікований
Рівень залученості (ER): Середній показник залученості аудиторії становить 8.83%. Протягом перших 24 годин після публікації контент зазвичай збирає 5.66% реакцій від загальної кількості підписників.
Охоплення публікацій: В середньому кожен допис отримує 4 426 переглядів. Протягом першої доби публікація в середньому набирає 2 839 переглядів.
Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 30.
Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як llm, контекст, openai, архитектура, deepseek.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Завдяки високій частоті оновлень (останні дані отримано 14 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

50 152

Підписники

-1124 години

-597 днів

-4230 день

4 426

Перегляди допису

~ 2 83924 години

~ 3 39048 годин

8.83%

Коефіцієнт залучення

~ 5

Дописів на день

Ads index

beta

Архів дописів

50 150

Amazon планирует заменить около 600 000 сотрудников в США роботами. Это колоссальный сдвиг - не только для компании, но и для всей экономики. Да, многие рабочие места исчезнут. Но если смотреть шире, мы стоим у начала новой промышленной революции, где выигрывают те, кто инвестирует в технологии на раннем этапе. Доходы от акций и дивидендов в будущем смогут превысить сегодняшние зарплаты, благодаря эффекту сложного процента. Автоматизация будет только расти. Это неизбежно. И, вероятно, параллельно появятся формы базового дохода (UBI/UHI), чтобы сгладить переход. 2030-е будут эпохой не страха, а огромных возможностей - для тех, кто готов адаптироваться. #Robotics #Automation #Amazon #FutureOfWork #AIeconomy

50 150

Вы начали изучать Python, установили библиотеки, попробовали что-то запустить — и всё внезапно сломалось? Не переживайте, это случалось с каждым. Просто вы не изолировали окружение. На открытом уроке курса «Machine Learning. Basic» мы разберём, как грамотно настроить виртуальное окружение, чтобы работать с Python и ML-библиотеками спокойно и системно. Вы узнаете, что такое venv, conda и uv, как управлять зависимостями и подключать Jupyter Notebook к своему окружению. Настроим всё пошагово — без сложных терминов и магии. Присоединяйтесь 28 октября в 20:00 (МСК). Уверенный старт в Python и машинном обучении начинается с чистого окружения. Регистрация открыта: https://otus.pw/zyQi/?erid=2W5zFHYpC6C #реклама О рекламодателе

50 150

🚀 Примеры ChatKit для разработчиков Репозиторий содержит продвинутые примеры использования ChatKit, включая интеграцию FastAPI и Vite + React. Он демонстрирует, как создать сервер ChatKit с помощью Python SDK и использовать различные инструменты для взаимодействия с клиентом. 🚀 Основные моменты: - Полный шаблон проекта с фронтендом и бэкендом. - Интеграция с инструментами для получения погоды и переключения тем. - Легкая разработка с проксированием запросов через Vite. 📌 GitHub: https://github.com/openai/openai-chatkit-advanced-samples #python

50 150

Когда знания разбросаны по чатам и папкам, сотрудники теряют время, решения принимаются медленно, а ошибки повторяются.

Так выглядит страшный сон любой IT-компании 😳 Если вы решаете проблему внешними SaaS-решениями, такой подход ненадежен и уход Notion с рынка это доказал. Решение есть: создать свою базу знаний с AI в облаке. Как? Расскажет эксперт Cloud․ru на вебинаре 23 октября. Вы узнаете:

➡️ как развернуть и масштабировать корпоративную Wiki на базе виртуальных машин и объектного ➡️ хранилища для надежного управления данными; ➡️ как настроить единую точку входа (SSO) для централизованной аутентификации и безопасного доступа сотрудников; ➡️ как интегрировать AI-помощника, создав Telegram-бота с прямым подключением к базе знаний через MCP-сервер для мгновенных ответов на вопросы.

В практической части вам покажут процесс настройки и интеграции всех компонентов. Регистрируйтесь 🖱

50 150

🌌 Google Gemini научили распознавать взрывающиеся звёзды по 15 примерам Google Research показали, что мультимодальная модель Gemini способна находить *вспышки сверхновых и другие астрономические события* — буквально по нескольким обучающим примерам. 🚀 Главное - Использован few-shot learning — всего ~15 примеров для каждой обсерватории *(Pan-STARRS, MeerLICHT, ATLAS)* - Модель видит три изображения: новое, эталонное и разницу между ними - Gemini не просто ставит метку, но объясняет, *почему* считает событие настоящим - Средняя точность — 93 %, после итераций до 96,7 % - Умеет оценивать свою неуверенность и просить помощи человека - Объяснения модели признаны экспертами-астрономами достоверными 🔭 Почему это важно - Будущие телескопы вроде Vera Rubin Observatory будут генерировать *миллионы сигналов каждую ночь* — без ИИ это невозможно обработать - Подход few-shot позволяет быстро адаптировать модель к новым данным без переобучения - Gemini превращается в научного помощника, а не просто классификатор ⚠️ Ограничения - 93 % ≠ 100 % — человек-в-петле всё ещё необходим - Модель чувствительна к качеству примеров и может ошибаться на редких артефактах Вывод: Gemini теперь не просто анализирует изображения, а *учится думать как учёный* — объясняя, сомневаясь и адаптируясь к новым задачам. 📖 Источник: https://research.google/blog/teaching-gemini-to-spot-exploding-stars-with-just-a-few-examples/

50 150

🚀 AI Journey Contest 2025 в самом разгаре! Уже 30 октября закончится международное онлайн-соревнование по ИИ AI Journey Contest 2025 с призовым фондом 6,5 млн рублей. ✨ У тебя еще есть возможность присоединиться к лучшим разработчикам со всего мира. Выбери один или несколько треков:

🤖 Agent-as-Judge: Создай универсального «судью» для оценки текстов, сгенерированных ИИ. 🧠 Human-centered AI Assistant: Разработай персонализированного ассистента на основе GigaChat. Бонус: Участникам предоставляются токены для API + возможность получить дополнительно 1 млн токенов! 💾 GigaMemory: Придумай механизм долговременной памяти для LLM.

Твой шанс выиграть денежный приз и заявить о себе на AI Journey - главной международной конференции по ИИ в России! Спешите зарегистрироваться по ссылке.

50 150

Не говорите создателю Markdown, что целая индустрия AI-агентов теперь зависит от каких-то .md-файлов, которые он когда-то написал просто ради удобства.

50 150

Когда твоя AI-девушка жила на AWS us-east-1 💔* Все было прекрасно, пока датацентр AWS us-east-1 не упал.

50 150

🌍 NVIDIA лидирует в опенсорсе в области ИИ, а китайские лаборатории только догоняют. Всего пару лет назад большинство моделей - особенно крупные языковые - были закрыты . Теперь всё иначе: экосистема открытого ИИ растёт взрывными темпами. Только за последние 90 дней на Hugging Face появилось более миллиона новых репозиториев. NVIDIA вышла в лидеры по количеству открытых проектов в 2025 году: серии Nemotron, BioNeMo, Cosmos, Gr00t и Canary. Китайские компании (Alibaba Cloud с Qwen, Baidu, Tencent и другие) активно догоняют и уже способны конкурировать с западными лабораториями. Открытый ИИ стал не только про гигантов - тысячи независимых разработчиков публикуют модели, датасеты и адаптации (например, LoRA). Это превращается в целое движение. Меняется глобальная карта ИИ: Китай и США усиливают позиции, а Европа и другие страны всё больше уходит в тень. ⚠️ Но есть нюансы: Открытость ≠ качество: важно следить за достоверностью данных, этикой и устойчивостью моделей. Рост числа репозиториев требует фильтрации — не всё из нового имеет практическую ценность. Лицензии и совместимость становятся критически важными: ошибки здесь могут стоить дорого. 📎 Подробнее: https://aiworld.eu/story/nvidia-leads-open-source-ai-momentum-as-chinese-labs-close-in #OpenSourceAI #NVIDIA #China #Innovation #AI #Ecosystem

50 150

🖼️✨ Удаление водяных знаков из видео Sora 2 с помощью ИИ Этот проект позволяет эффективно удалять водяные знаки из видео, созданных с помощью Sora 2, используя технологии искусственного интеллекта. Пользователь загружает видео, система анализирует каждый кадр и удаляет водяной знак с помощью инпейнтинга. 🚀Основные моменты: - Использует ИИ для точного удаления водяных знаков - Поддерживает Windows, MacOS и Linux - Обработка видео с сохранением качества - Легкий в использовании интерфейс для загрузки видео 📌 GitHub: https://github.com/hate0s/sora2-watermark-remover

50 150

Uber запускает новый способ заработка для водителей в США 💰 Теперь водители смогут получать деньги, выполняя «цифровые задачи» — короткие задания, которые занимают всего пару минут и доступны даже во время ожидания пассажиров. Примеры таких задач: ▫️ разметка данных для обучения ИИ ▫️ загрузка меню ресторанов ▫️ запись голосовых сэмплов ▫️ озвучка сценариев на разных языках Потенциал огромен: компании вроде Scale AI и Surge AI, занимающиеся разметкой данных, уже оцениваются примерно в $30 млрд каждая. В начале октября Uber также приобрёл бельгийский стартап Segments AI, специализирующийся на разметке данных, чтобы усилить свои позиции в этой сфере.

50 150

Илон Маск написал у себя в X:

«У Grok 5 примерно 10 % шансов стать AGI - и он может оказаться очень близок к этому уровню.»

Большинство разногласий вокруг сроков появления AGI сводятся к тому, как именно его определяют. Например, по последнему мнению Андрея Карпатия, настоящая AGI — это не просто языковая модель, а интеллект с телом: продвинутые роботы, способные выполнять физическую работу и даже решать проблему согласования (alignment). Если придерживаться такого определения, то даже 10 лет - слишком оптимистичный прогноз.

50 150

📘 На Stepik вышел курс — «MLOps-инженер: С нуля до продакшена» Хотите автоматизировать ML-пайплайны, версионировать модели и выстраивать надёжный деплой в production? Этот курс — полный путь MLOps-инженера. ML Pipeline: MLflow, Airflow, автоматизация обучения и валидации моделей Эксперименты: DVC, Weights & Biases, версионирование и воспроизводимость Model Serving: TensorFlow Serving, ONNX, A/B тестирование моделей Контейнеризация: Docker для ML, GPU-контейнеры, оптимизация образов Kubernetes: Kubeflow, автомасштабирование inference Feature Store: Feast, управление фичами, data drift detection Мониторинг: Evidently AI, model drift, data quality CI/CD для ML: автотесты моделей, staged rollout Облака: SageMaker, Vertex AI, cost optimization Production: model registry, canary deployments, SLA для ML 🎓 Сертификат — добавьте в резюме или LinkedIn 🚀 Скидка 25%, действует 48 часов 👉 Пройти курс на Stepik

50 150

⚡️ Anthropic обнаружила тревожную уязвимость в обучении языковых моделей: всего 250 подставных документов достаточно, чтобы «внедрить» скрытую команду (backdoor) в модель размером от 600 миллионов до 13 миллиардов параметров - даже если среди данных есть в 20 раз больше нормальных примеров. Главное открытие: не процент заражённых документов, а их абсолютное количество определяет успех атаки. Увеличение объёмов данных и масштаба модели не защищает от целенаправленного отравления. Backdoor остаётся незаметным - модель работает как обычно, пока не встретит секретный триггер, после чего начинает выполнять вредоносные инструкции или генерировать бессмыслицу. Даже если продолжать обучение на «чистых» данных, эффект стирается очень медленно - backdoor может сохраняться длительное время. Вывод: защита LLM требует контроля происхождения данных, проверки целостности корпусов и мер по выявлению скрытых иньекций. 🟢 Подробнее: https://www.anthropic.com/research/small-samples-poison

50 150

📈 Вышел новый важный бенчмарк для исследовательских ИИ LiveResearchBench от команды [@SFResearch](https://twitter.com/SFResearch) — это *живой пользовательский бенчмарк* для оценки глубинных исследовательских систем на реальных, «полевых» задачах. Он проверяет, могут ли исследовательские агенты создавать отчеты с корректными цитатами под реальные запросы пользователей. Всего собрано *100 задач в 7 доменах и 10 категориях*, на разработку ушло 1500 часов работы экспертов. Старые бенчмарки устарели, были узкими и часто пересекались с данными предобучения. Поэтому авторы ввели 4 строгих правила: - задачи должны быть ориентированы на пользователя - четко определены - использовать актуальные данные из интернета - требовать синтеза информации из множества источников Каждая задача проходила 6 стадий создания (от интервью с пользователями до экспертной доработки) и 5 стадий проверки качества (независимые ревью и контроль качества). Для оценки результатов создан фреймворк DeepEval, который оценивает отчеты по 6 критериям: структура, фактическая точность, корректность цитирования и др. Используются чек-листы, парные сравнения и древовидные рубрики. Для снижения смещения авторы использовали ансамбль моделей Gemini 2.5 Pro и GPT-5 как оценщиков, что сделало результаты стабильнее. Тесты 17 агентных систем показали: - мультиагентные решения лучше оформляют отчеты и ставят цитаты - одиночные агенты стабильнее, но уступают в глубине рассуждений Это важный шаг к тому, чтобы измерять, могут ли ИИ-агенты работать как настоящие исследователи — находить, анализировать и цитировать информацию из живых источников. 🔗 https://arxiv.org/abs/2510.14240

50 150

📱 MobileLLM-Pro - языковая модель (~1B параметров) , оптимизированная для эффективной работы *на устройстве* (on-device). Модель превосходит Gemma 3 1B и Llama 3.2 1B по задачам рассуждения, знаний и длинного контекста, поддерживая до 128 000 токенов. Благодаря гибридному вниманию (локальное + глобальное в соотношении 3:1, окно 512) достигается низкая задержка и экономия памяти KV-кэша. Квантование в 4-бит (int4) почти не снижает качество: • CPU - групповое квантование весов и динамическая активация • GPU - поканальное квантование Модель дополнительно прошла instruction fine-tuning, что делает её подходящей для задач общения, генерации и обработки текста. https://huggingface.co/facebook/MobileLLM-Pro

50 150

☀️ Google DeepMind и Commonwealth Fusion Systems запускают проект по созданию управляемого ИИ ядерного синтеза Google DeepMind объединяется с Commonwealth Fusion Systems (CFS), чтобы применить искусственный интеллект для ускорения разработки термоядерной энергии — того самого процесса, который питает Солнце. 🔬 Как это работает: DeepMind создаёт систему управления, способную с помощью ИИ смоделировать миллионы виртуальных экспериментов в симуляторе TORAX. Ещё до запуска установки SPARC, ИИ определяет наиболее стабильные и энергоэффективные режимы плазмы, находя оптимальные условия для удержания температуры и плотности. 🔥 При работе на полную мощность SPARC выделяет огромное количество тепла, сконцентрированного в очень малой области. ИИ будет в реальном времени управлять формой и динамикой плазмы, чтобы равномерно распределять это тепло и защищать материалы реактора. > «Мы исследуем, как агенты с подкреплением могут научиться динамически контролировать плазму — чтобы поддерживать устойчивую работу и избегать перегрева.» 💡 Этот проект открывает новую эру - “AI-guided fusion”: ИИ становится не просто инструментом анализа, а активным управляющим звеном, которое помогает человечеству приблизиться к источнику чистой, безопасной и практически бесконечной энергии. ⚡ Благодаря ИИ путь к «пост-дефицитной» цивилизации становится реальностью - и, возможно, гораздо ближе, чем кажется. https://deepmind.google/discover/blog/bringing-ai-to-the-next-generation-of-fusion-energy/ #AI #DeepMind #FusionEnergy #Google #CFS #ReinforcementLearning #SPARC #CleanEnergy #Science #Innovation

50 150

Технологическая платформа Авито ускорила в 5 раз процесс поиска и проверки уязвимостей. Компания внедрила в работу отдела кибербезопасности собственную языковую модель, которую обучили на тысячах примерах уязвимостей. К работе также подключили сканер от Авито DeepSecrets — каждый разработчик может бесплатно его использовать, все лежит на GitHub. Модель научилась выявлять 99 из 100 потенциальных уязвимостей — она анализирует потенциально чувствительные данные и учитывает контекст кода. Чтобы не пропустить угрозы, код проверяют дополнительными алгоритмами, а инженеры выборочно оценивают работу нейросети. Такой подход позволил освободить 25% рабочего времени специалистов по кибербезопасности. Если раньше на оценку 50 000 предупреждений специалисты могли потратить полгода, то сейчас с этим объемом машина справляется за день. В планах Авито — внедрить ИИ в оценку рисков и моделирование угроз. Это эффективно, как доказывают исследования: компании, которые применяют ИИ, на 100 дней быстрее находят утечки данных. Подпишитесь на полезные каналы Авито

50 150

🏆 Sakana AI выиграла ICFP 2025 - благодаря новой системе эволюции кода ShinkaEvolve Исследователи из Sakana AI и команда Unagi показали, что большие языковые модели можно использовать не просто для генерации программ, а для пошаговой эволюции и оптимизации уже существующего кода. ShinkaEvolve - это эволюционный фреймворк, где языковая модель играет роль «генетического программиста». Она не пишет решения с нуля, а мутирует, оценивает и улучшает уже работающий код. Процесс идёт циклами, похожими на естественный отбор. 1. Инициализация Модель получает исходный код (обычно корректный, но неоптимальный) и описание метрики — например, скорость или точность. 2. Мутации (Variations) LLM вносит небольшие изменения: перестраивает цикл, меняет структуру данных, переписывает логику с рекурсии на итерацию, удаляет лишние вычисления и т.д. 3. Оценка (Evaluation) Каждая версия автоматически компилируется и запускается на тестах. Система измеряет, стало ли решение быстрее или стабильнее. 4. Отбор (Selection) Лучшие варианты проходят дальше, худшие отбрасываются. LLM получает обратную связь: что сработало, а что нет. 5. Итерации Процесс повторяется десятки или сотни раз. В исследовании — около 320 поколений за ~60 долларов вычислительных затрат. Изначально решение ICFP-задачи использовало SAT-кодирование (логическую форму для solver'а), но плохо масштабировалось. ShinkaEvolve смогла: - переписать часть кода, чтобы сократить количество ограничений; - внедрить промежуточное представление («дверь → вершина → дверь»), что уменьшило сложность; - оптимизировать поиск и кэширование данных. Результат — ускорение до 10×, а на некоторых тестах — почти в 10 раз быстрее базового решения. ShinkaEvolve — не просто автоматический оптимизатор. Это новый способ мышления об ИИ-программировании: модель не заменяет разработчика, а ведёт себя как «цифровой соавтор», который предлагает гипотезы и тестирует их сотни раз быстрее, чем человек. 🟠Подробнее: https://sakana.ai/icfp-2025 🟠Код: https://github.com/SakanaAI/ShinkaEvolve 🟠Статья: https://arxiv.org/abs/2509.19349 🟠Блог: https://sakana.ai/shinka-evolve/