Анализ данных (Data analysis)
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
Показати більше📈 Аналітичний огляд Telegram-каналу Анализ данных (Data analysis)
Канал Анализ данных (Data analysis) (@data_analysis_ml) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 50 152 підписників, посідаючи 2 679 місце в категорії Технології та додатки та 12 559 місце у регіоні Росія.
📊 Показники аудиторії та динаміка
З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 50 152 підписників.
За останніми даними від 13 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -42, а за останні 24 години на -11, загальне охоплення залишається високим.
- Статус верифікації: Не верифікований
- Рівень залученості (ER): Середній показник залученості аудиторії становить 8.83%. Протягом перших 24 годин після публікації контент зазвичай збирає 5.66% реакцій від загальної кількості підписників.
- Охоплення публікацій: В середньому кожен допис отримує 4 426 переглядів. Протягом першої доби публікація в середньому набирає 2 839 переглядів.
- Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 30.
- Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як llm, контекст, openai, архитектура, deepseek.
📝 Опис та контентна політика
Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
Завдяки високій частоті оновлень (останні дані отримано 14 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.
example::date и example::span.
- Удобное взаимодействие с отладчиком через .lldbinit.
📌 GitHub: https://github.com/codeinred/lldb_user_types
#python1e-16, чтобы быть меньше диапазона градиентов.
### 📚 Обучение
- Всего обучено на ~20 трлн токенов + отдельные фазы:
- STEM/код (70% смеси)
- расширение контекста: 80B токенов для 32k и 20B для 128k
- Данные: извлечение контекста → фильтрация → дедупликация.
🧪 Бенчмарки и результаты
- Новые тесты: Meeseeks (многошаговые инструкции) и VitaBench (реальные бизнес-сценарии).
- Отдельно показали:
- какие top_k лучше для разных задач
- как токены распределяются по слоям
- В инфре: оптимизация под inference, speculative decoding, квантизация, параллельные коммуникации.
📌 Репозиторий: github.com/meituan-longcat🟠Актуальность предсказания оттока клиентов для бизнеса 🟠Как работать с «сырыми» данными и подготовить их для обучения модели 🟠Как выбрать, построить и обучить базовую модель в Google Colab 🟠Как проверить, качество работы модели: разбор метрик и ошибок 🟠Какие ключевые навыки складываются в профессиюML-инженера.🕗 Встречаемся 16 сентября в 19:00 МСК Обязательно ждем вас в лайве — вы сможете напрямую задать свои вопросы Кристине Желтовой и забрать с собой пример файла в Google Colab, с которым сможете продолжить погружаться в задачу после вебинара! 😶Зарегистрироваться на бесплатный вебинар
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
