Анализ данных (Data analysis)
前往频道在 Telegram
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
显示更多📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览
频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 50 260 名订阅者,在 技术与应用 类别中位列第 2 668,并在 俄罗斯 地区排名第 12 514 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 50 260 名订阅者。
根据 20 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 46,过去 24 小时变化为 34,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 8.91%。内容发布后 24 小时内通常能获得 6.23% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 4 477 次浏览,首日通常累积 3 132 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 32。
- 主题关注点: 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
凭借高频更新(最新数据采集于 21 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
50 260
订阅者
+3424 小时
+1087 天
+4630 天
帖子存档
+2
🌟 whylogs — библиотека Python для конвейеров обработки данных и для ML-приложений
—
pip install whylogs
whylogs позволяет эффективно собирать данные для:
— отслеживания любых изменений в наборе данных
— быстрой визуализации основных статистических параметров данных
— обнаружения дрейфа данных
— выявления проблем в процессе обучения, причин снижения производительности ML-модели
🖥 GitHub
🟡 Доки
@data_analysis_mlRepost from Институт AIRI
CV-шница пройдет уже в этот четверг! 🍳
Делимся подробным расписанием онлайн-митапа:
▪️15:30
Вступление — Артур Кадурин, руководитель группы «Глубокое обучение в науках о жизни», AIRI
▪️15:35
3D генерация по тексту/изображению — Антон Конушин, кандидат физико-математических наук, руководитель группы «Пространственный интеллект», AIRI
▪️ 15:55
Kandinsky Flash: генеративно-состязательный подход к дистилляции диффузионных моделей — Владимир Архипкин, руководитель направления по исследованию данных, Sber AI
▪️ 16:15
Мультимодальные модели и способы эффективного представления визуального контекста — Андрей Кузнецов, кандидат технических наук, директор лаборатории FusionBrain, AIRI
▪️16:35
Генерация изображений по активности мозга — Абдуллин Ильгиз, AI Talent Hub, и Щетинников Константин, Quality Analyst Intern, Wildberries
▪️16:55
Ensemble-Based Image Annotation for Real-Time Human Detection
— Игорь Попов, Computer Vision Engineer, AI Talent Hub
Сохраняйте ссылку на трансляцию, чтобы не пропустить доклады 👾
🌟 Dolphin-2.9.3-Yi-1.5: квантизированные GGUF версии с 34B параметрами и контекстным окном 32k.
На Huffingface пользователь bartowski опубликовал несколько квантизированных версий с разной степенью сжатия,
Размерность моделей: от IQ2_XS (10.3 Gb) до Q8_0_L (37.4GB), рекомендуемая — Q6_K.
Семейство Dolfin основано на моделях Yi и распространяется по лицензии Аpache 2.0
Dolphin-2.9.3 обладает разнообразными навыками следования инструкциям, общения и программирования. Она также имеет начальные агентные способности и поддерживает вызов функций.
Модель не имеет цензуры. Создатели отфильтровали набор данных, чтобы удалить выравнивание и предвзятость. Dolphin обучался на данных, полученных из GPT4, среди других моделей.
🤗 Hugging Face
@data_analysis_ml
#LLM #ML #Huggingface
❓Как понять, что последний эксперимент дает лучшие результаты?
Часто при решении ML задачи нам приходится тестировать десятки моделей в десятках конфигурация гиперпараметров.
Как не запутаться в этой куче параметров и выбрать лучшую модель? - нам поможет замечательный инструмент мониторинга экспериментов MLFlow.
✅ MLFlow один из самых популярных инструментов который позволит зафиксировать все параметры, запишет кривые обучения и запомнит все метрики для каждого эксперимента.
Регистрируйтесь на открытый урок от Otus и изучите на практике ключевой инструмент ML инженера
Вы узнаете, как реализовать развернуть и настроить MLFlow локально и в облачной среде, как добавить в свой код логирование параметров экспериментов и как сохранить ваши обученные модели в реестр моделей для их дальнейшего переиспользования на основе полученных метрик.
👉 Регистрация и подробности:
https://otus.pw/6O9B/?erid=LjN8KB29H+1
🌟 Lepton — библиотека Python для удобного создания AI-приложений
—
pip install -U leptonai
Особенности Lepton:
— Простые абстракции для запуска моделей, наподобие тех, что представлены на HuggingFace
— Готовые шаблоны для распространенных моделей, таких как Llama, SDXL, Whisper и других.
— Возможность для лёгкого разворачивания в облачной среде.
🖥 GitHub
🟡 Доки
@data_analysis_mlВ мире, где No-Code ML и TinyML становятся ключевыми трендами, НИЯУ МИФИ совместно со Skillfactory запускает онлайн-магистратуру "Прикладной анализ данных и машинное обучение". Программа учитывает последние тенденции отрасли, включая развитие глубокого обучения и растущую важность ML в IoT устройствах.
По данным экспертов, навыки в области искусственного интеллекта становятся необходимостью для конкурентоспособности на рынке труда. Средняя зарплата мидл ML-инженера в России достигает 190 000 рублей в месяц, а спрос на специалистов продолжает расти.
Магистратура МИФИ предлагает:
- Обучение с нуля до продвинутого уровня
- Два карьерных трека: классический ML и MLOps
- Онлайн-формат с сохранением студенческих льгот
- Диплом государственного образца МИФИ
Стоимость первого года обучения - от 270 рублей в месяц благодаря господдержке. Не упустите шанс стать частью AI-революции с одним из ведущих технических вузов России.
Записаться тут: https://go.skillfactory.ru/na4y_w
Реклама. ООО «Скилфэктори»
erid: LjN8KAMQf
+3
🌟 Dive into Deep Learning — свободная книга от исследователей Amazon: Zhang, Li и других
Мощная книга, которая на 1108 страницах подробно описывает реализацию алгоритмов ML и Deep Learning с помощью PyTorch, NumPy/MXNet, JAX и TensorFlow.
По этой книге читаются лекции в 500 университетах 70 стран.
🟡 Dive into Deep Learning
🟡 PDF
🖥 GitHub с кодом к книге
@data_analysis_ml
🤗 Все что нужно знать о работе с Hugging Face за 10 минут!
В этом ролике мы разыгрываем 3 крутые книги по МАШИННОМУ ОБУЧЕНИЮ, нужно всего лишь оставить любой осмысленный коммент и лайк и быть подписанным на наш канал!
https://www.youtube.com/watch?v=4B_foZbWh2c
@machinelearning_ru
+1
🌟 SDV — библиотека Python для генерации синтетических данных на основе предоставленного набора данных
—
pip install sdv
При этом сгенерированные данные будут иметь те же статистические параметры, что и предоставленный набор данных. SDV генерирует данные, применяя математические методы и разные ML-модели.
С помощью SVD можно генерировать данные, даже если исходный набор содержат несколько типов значений и отсутствующие значения.
🖥 GitHub
🟡 Доки
@data_analysis_mlЦентральный университет приглашает на день открытых дверей всех интересующихся ИТ-программой в магистратуре!
На мероприятии расскажут больше про университет, в котором можно учиться одновременно с бакалавриатом и помогают попасть на работу в биг-тех, а преподаватели — топовые специалисты ИТ-компаний и профессора ведущих вузов. На мероприятии также будет:
— информация про направления обучения в университете;
— лекции от ведущих экспертов ИТ-индустрии;
— Q&A-сессии с магистрантами ЦУ и разбор задач отбора;
— прогулка по офису Т-Банка;
— знакомство со множеством классных людей и пицца.
А еще среди всех, кто зарегистрируется на ДОД и пройдет отбор в магистратуру до 16 июля, ЦУ разыграет новенький MacBook.
Начало 17 июля в 17:30. Вход свободный, но количество мест ограничено. Регистрация здесь.
erid:2VtzqwyThk5
Реклама, АНО ВО «Центральный университет», ИНН 7743418023
+2
⚡️ BitNet — масштабирование 1-битных трансформеров для LLM
—
pip install bitnet
Команда под руководством Furu Wei и Shuming Ma из исследовательского отдела Microsoft в Пекине, создала BitNet, первый 1-битный метод QAT для LLM.
И в этом репозитории представлена реализация BitNet на PyTorch.
Из интересного, модель BitNet 3B отвечает на разные текстовые запросы так же точно, как и LLaMA с тем же количеством параметров и временем обучения, но при этом BitNet в 2.71 раза быстрее, использует на 72% меньше GPU и потребляет на 94% меньше ресурсов GPU.
🖥 GitHub
🟡 Arxiv
@data_analysis_ml+1
🖥 tslearn — библиотека Python для анализа временных рядов и решения подобных ML-задач
—
pip install tslearn
tslearn — это библиотека Python, которая предоставляет ML-инструменты для анализа временных рядов.
tslearn основана на библиотеках scikit-learn, numpy и scipy.
🖥 GitHub
🟡 Доки
@data_analysis_ml+2
🖥 NumPyro — библиотека Python для вероятностного программирования
—
pip install numpyro
NumPyro — это легкая библиотека для вероятностного программирования, которая добавляет возможности NumPy к библиотеке Pyro.
В процессе вероятностного программирования с NumPyro также используется JAX для автоматического дифференцирования и JIT-компиляции на GPU/CPU.
🖥 GitHub
🟡 Доки
@data_analysis_mlСистематизируете и углубите знания бэкенд-разработки на Python на курсе Яндекс Практикума за 6 месяцев.
Преимущества курса:
— актуальная программа, которая постоянно обновляется;
— много практики, лайвкодинг и хакатон;
— возможность совмещать с другой учёбой или работой;
— наставники из Яндекса и не только;
— помощь с трудоустройством.
◾️Погружайтесь в Python, нарабатывайте нужные навыки и осваивайте инструменты для работы. Начните курс бесплатно, а если понравится, платите как удобно: в рассрочку или целиком.
→ Начать бесплатно
+1
🌟 SkyPilot — фреймворк для запуска LLM и AI-приложений в любом облаке
pip install "skypilot-nightly[aws,gcp,azure,oci,lambda,runpod,fluidstack,paperspace,cudo,ibm,scp,kubernetes]"SkyPilot позволяет: — управлять масштабированием: автоматическая постановка в очередь и запуск большого количества задач — получать легкий доступ к хранилищам S3, GCS, R2 — сократить расходы на облако: 3-6-кратное уменьшение расходов при использовании отдельных ВМ с автоматическим восстановлением после падений SkyPilot позволяет работать с GPU, TPU и CPU. Поддерживаемые облака — AWS, GCP, Azure, OCI, Lambda Cloud, RunPod, Fluidstack, Cudo, IBM, Samsung, Cloudflare, VMware vSphere, любой кластер Kubernetes 🖥 GitHub 🟡 Доки @data_analysis_ml
Зачем искать удобный планировщик задач, когда его можно создать самостоятельно? А заодно — узнать, насколько вам интересно программирование.
Бесплатный курс «Основы Python: создаём телеграм-бота» — полезный и надёжный вариант для самоопределения. Там на примере Python вы узнаете, как устроены процессы разработки, самостоятельно создадите планировщик задач и бота-помощника и поймёте, подходит ли вам этот язык.
Доступ в чат с экспертами и однокурсниками для получения ответов на вопросы и помощи в практике, а также сертификат Нетологии после прохождения курса прилагаются → https://netolo.gy/dg7u
Реклама ООО “Нетология” 2VSb5yoBgEc
+1
🧠 Наконец-то кто-то создал leetcode для машинного обучения.
Только что выполнено первое упражнение: вычисление матрично-векторного произведения без каких-либо тензорных операций (разрешены только списки на python).
http://deep-ml.com
@data_analysis_ml
+2
⚡️ Adversarial Robustness Toolbox — библиотека Python для обеспечения безопасности ML-приложений
—
pip install adversarial-robustness-toolbox
ART — это библиотека Python, которая предоставляет инструменты для оценивания, защиты и проверки моделей и ML-приложений на предмет разных угроз и уязвимостей.
ART поддерживает все популярные фреймворки машинного обучения (в т.ч. TensorFlow, Keras, PyTorch, MXNet, scikit-learn, XGBoost, LightGBM, CatBoost, GPy), все типы данных (изображения, таблицы, аудио, видео) и может использоваться для любых задачи ML (классификация, обнаружение объектов, генерация музыки, изображений и т. д.).
🖥 GitHub
🟡 Доки
🟡 Примеры атак и использования ART
@data_analysis_ml+3
🌟 Flair — мощная библиотека для NLP
—
pip install flair
Библиотека Flair была разработана Берлинским университетом как библиотека NLP с большими возможностями.
Flair позволяет проводить распознавание именованных сущностей (NER), анализ эмоциональной составляющей, тегирование части речи (PoS).
Помимо этого Flair может работать с биомедицинскими текстами.
Также Flair интегрируется с большим количеством других библиотек.
🖥 GitHub
🟡 Доки
@data_analysis_mlRepost from Machinelearning
+1
🌟 ControlNet++ — улучшенная версия вспомогательной технологии для генерации изображений
ControlNet++ использует дискриминационные модели вознаграждения для оптимизации согласованности между входными условиями (изрбражение-референс) и результатами генерации за счет оптимизации последовательности циклов.
Согласно опубликованным бенчмаркам, ControlNet++ значительно улучшает управляемость процессом генерации.
Новый метод метод превосходит классический ControlNet:
- на 7.9% по mIoU;
- на 13.4% по SSIM;
- на 7.6% по RMSE.
Адаптации под UI для Stable Diffusion пока нет.
Еще круче то, что контролнеты++ успели упаковать в Controlnet Union и собрали в 1 модель.
Теперь можно разом делать 12 препроцессов с одной модели CN.
👉 Репозиторий https://huggingface.co/xinsir/controlnet-union-sdxl-1.0
Модель safetensors без конфига в папку с Контролнетом Автоматика1111 или ComfyUI.
Это все действия которые необходимо сделать)
А самое главное - больше не нужно качать тонну моделей и следить в UI что нужный препроцессор выбран.
Работает controlnet union на SDXL-моделях. Для SD3 свой контролнет, для SD1.5 -свой, этот работать не будет.
👉 Видео: https://www.youtube.com/watch?v=UBFEw1IUX_I
🖥 GitHub [ Stars: 274 | Issues: 2 | Forks: 11 ]
🟡 Страничка проекта ControlNet++
🟡 Arxiv
🟡 Демо на HF
🟡 Модели на HF
#ControlNet #Diffusers #Image2Image
@ai_machinelearning_big_data
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
