Анализ данных (Data analysis)

前往频道在 Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

显示更多

网络:Machinelearning 俄罗斯12 514 技术与应用2 668...

📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览

频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语语言赛道中的是活跃参与者。目前社区聚集了 50 260 名订阅者，在 技术与应用 类别中位列第 2 668，并在 俄罗斯 地区排名第 12 514 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 50 260 名订阅者。

根据 20 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 46，过去 24 小时变化为 34，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 8.91%。内容发布后 24 小时内通常能获得 6.23% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 4 477 次浏览，首日通常累积 3 132 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 32。
主题关注点： 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

凭借高频更新（最新数据采集于 21 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

50 260

订阅者

+3424 小时

+1087 天

+4630 天

4 477

帖子浏览量

~ 3 13224 小时

~ 4 04348 小时

8.91%

参与率

~ 5

每日帖子数

Ads index

beta

帖子存档

50 256

🌟 whylogs — библиотека Python для конвейеров обработки данных и для ML-приложений — pip install whylogs whylogs позволяет эффективно собирать данные для: — отслеживания любых изменений в наборе данных — быстрой визуализации основных статистических параметров данных — обнаружения дрейфа данных — выявления проблем в процессе обучения, причин снижения производительности ML-модели 🖥 GitHub 🟡 Доки @data_analysis_ml

50 256

Repost from Институт AIRI

CV-шница пройдет уже в этот четверг! 🍳 Делимся подробным расписанием онлайн-митапа: ▪️15:30 Вступление — Артур Кадурин, руководитель группы «Глубокое обучение в науках о жизни», AIRI ▪️15:35 3D генерация по тексту/изображению — Антон Конушин, кандидат физико-математических наук, руководитель группы «Пространственный интеллект», AIRI ▪️ 15:55 Kandinsky Flash: генеративно-состязательный подход к дистилляции диффузионных моделей — Владимир Архипкин, руководитель направления по исследованию данных, Sber AI ▪️ 16:15 Мультимодальные модели и способы эффективного представления визуального контекста — Андрей Кузнецов, кандидат технических наук, директор лаборатории FusionBrain, AIRI ▪️16:35 Генерация изображений по активности мозга — Абдуллин Ильгиз, AI Talent Hub, и Щетинников Константин, Quality Analyst Intern, Wildberries ▪️16:55 Ensemble-Based Image Annotation for Real-Time Human Detection — Игорь Попов, Computer Vision Engineer, AI Talent Hub Сохраняйте ссылку на трансляцию, чтобы не пропустить доклады 👾

50 256

🌟 Dolphin-2.9.3-Yi-1.5: квантизированные GGUF версии с 34B параметрами и контекстным окном 32k. На Huffingface пользователь bartowski опубликовал несколько квантизированных версий с разной степенью сжатия, Размерность моделей: от IQ2_XS (10.3 Gb) до Q8_0_L (37.4GB), рекомендуемая — Q6_K. Семейство Dolfin основано на моделях Yi и распространяется по лицензии Аpache 2.0 Dolphin-2.9.3 обладает разнообразными навыками следования инструкциям, общения и программирования. Она также имеет начальные агентные способности и поддерживает вызов функций. Модель не имеет цензуры. Создатели отфильтровали набор данных, чтобы удалить выравнивание и предвзятость. Dolphin обучался на данных, полученных из GPT4, среди других моделей. 🤗 Hugging Face @data_analysis_ml #LLM #ML #Huggingface

50 256

❓Как понять, что последний эксперимент дает лучшие результаты?

Часто при решении ML задачи нам приходится тестировать десятки моделей в десятках конфигурация гиперпараметров.

Как не запутаться в этой куче параметров и выбрать лучшую модель?  -  нам поможет замечательный инструмент мониторинга экспериментов MLFlow.

✅ MLFlow один из самых популярных инструментов который позволит зафиксировать все параметры, запишет кривые обучения и запомнит все метрики для каждого эксперимента. Регистрируйтесь на открытый урок от Otus и изучите на практике ключевой инструмент ML инженера Вы узнаете, как реализовать развернуть и настроить MLFlow локально и в облачной среде, как добавить в свой код логирование параметров экспериментов и как сохранить ваши обученные модели в реестр моделей для их дальнейшего переиспользования на основе полученных метрик. 👉 Регистрация и подробности: https://otus.pw/6O9B/?erid=LjN8KB29H

50 256

🌟 Lepton — библиотека Python для удобного создания AI-приложений — pip install -U leptonai Особенности Lepton: — Простые абстракции для запуска моделей, наподобие тех, что представлены на HuggingFace — Готовые шаблоны для распространенных моделей, таких как Llama, SDXL, Whisper и других. — Возможность для лёгкого разворачивания в облачной среде. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 256

В мире, где No-Code ML и TinyML становятся ключевыми трендами, НИЯУ МИФИ совместно со Skillfactory запускает онлайн-магистратуру "Прикладной анализ данных и машинное обучение". Программа учитывает последние тенденции отрасли, включая развитие глубокого обучения и растущую важность ML в IoT устройствах. По данным экспертов, навыки в области искусственного интеллекта становятся необходимостью для конкурентоспособности на рынке труда. Средняя зарплата мидл ML-инженера в России достигает 190 000 рублей в месяц, а спрос на специалистов продолжает расти. Магистратура МИФИ предлагает: - Обучение с нуля до продвинутого уровня - Два карьерных трека: классический ML и MLOps - Онлайн-формат с сохранением студенческих льгот - Диплом государственного образца МИФИ Стоимость первого года обучения - от 270 рублей в месяц благодаря господдержке. Не упустите шанс стать частью AI-революции с одним из ведущих технических вузов России. Записаться тут: https://go.skillfactory.ru/na4y_w Реклама. ООО «Скилфэктори» erid: LjN8KAMQf

50 256

🌟 Dive into Deep Learning — свободная книга от исследователей Amazon: Zhang, Li и других Мощная книга, которая на 1108 страницах подробно описывает реализацию алгоритмов ML и Deep Learning с помощью PyTorch, NumPy/MXNet, JAX и TensorFlow. По этой книге читаются лекции в 500 университетах 70 стран. 🟡 Dive into Deep Learning 🟡 PDF 🖥 GitHub с кодом к книге @data_analysis_ml

50 256

🤗 Все что нужно знать о работе с Hugging Face за 10 минут! В этом ролике мы разыгрываем 3 крутые книги по МАШИННОМУ ОБУЧЕНИЮ, нужно всего лишь оставить любой осмысленный коммент и лайк и быть подписанным на наш канал! https://www.youtube.com/watch?v=4B_foZbWh2c @machinelearning_ru

50 256

🌟 SDV — библиотека Python для генерации синтетических данных на основе предоставленного набора данных — pip install sdv При этом сгенерированные данные будут иметь те же статистические параметры, что и предоставленный набор данных. SDV генерирует данные, применяя математические методы и разные ML-модели. С помощью SVD можно генерировать данные, даже если исходный набор содержат несколько типов значений и отсутствующие значения. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 256

Центральный университет приглашает на день открытых дверей всех интересующихся ИТ-программой в магистратуре! На мероприятии расскажут больше про университет, в котором можно учиться одновременно с бакалавриатом и помогают попасть на работу в биг-тех, а преподаватели — топовые специалисты ИТ-компаний и профессора ведущих вузов. На мероприятии также будет: — информация про направления обучения в университете; — лекции от ведущих экспертов ИТ-индустрии; — Q&A-сессии с магистрантами ЦУ и разбор задач отбора; — прогулка по офису Т-Банка; — знакомство со множеством классных людей и пицца. А еще среди всех, кто зарегистрируется на ДОД и пройдет отбор в магистратуру до 16 июля, ЦУ разыграет новенький MacBook. Начало 17 июля в 17:30. Вход свободный, но количество мест ограничено. Регистрация здесь. erid:2VtzqwyThk5 Реклама, АНО ВО «Центральный университет», ИНН 7743418023

50 256

⚡️ BitNet — масштабирование 1-битных трансформеров для LLM — pip install bitnet Команда под руководством Furu Wei и Shuming Ma из исследовательского отдела Microsoft в Пекине, создала BitNet, первый 1-битный метод QAT для LLM. И в этом репозитории представлена реализация BitNet на PyTorch. Из интересного, модель BitNet 3B отвечает на разные текстовые запросы так же точно, как и LLaMA с тем же количеством параметров и временем обучения, но при этом BitNet в 2.71 раза быстрее, использует на 72% меньше GPU и потребляет на 94% меньше ресурсов GPU. 🖥 GitHub 🟡 Arxiv @data_analysis_ml

50 256

🖥 tslearn — библиотека Python для анализа временных рядов и решения подобных ML-задач — pip install tslearn tslearn — это библиотека Python, которая предоставляет ML-инструменты для анализа временных рядов. tslearn основана на библиотеках scikit-learn, numpy и scipy. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 256

🖥 NumPyro — библиотека Python для вероятностного программирования — pip install numpyro NumPyro — это легкая библиотека для вероятностного программирования, которая добавляет возможности NumPy к библиотеке Pyro. В процессе вероятностного программирования с NumPyro также используется JAX для автоматического дифференцирования и JIT-компиляции на GPU/CPU. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 256

Систематизируете и углубите знания бэкенд-разработки на Python на курсе Яндекс Практикума за 6 месяцев. Преимущества курса: — актуальная программа, которая постоянно обновляется; — много практики, лайвкодинг и хакатон; — возможность совмещать с другой учёбой или работой; — наставники из Яндекса и не только; — помощь с трудоустройством. ◾️Погружайтесь в Python, нарабатывайте нужные навыки и осваивайте инструменты для работы. Начните курс бесплатно, а если понравится, платите как удобно: в рассрочку или целиком. → Начать бесплатно

50 256

🌟 SkyPilot — фреймворк для запуска LLM и AI-приложений в любом облаке

pip install "skypilot-nightly[aws,gcp,azure,oci,lambda,runpod,fluidstack,paperspace,cudo,ibm,scp,kubernetes]"

SkyPilot позволяет: — управлять масштабированием: автоматическая постановка в очередь и запуск большого количества задач — получать легкий доступ к хранилищам S3, GCS, R2 — сократить расходы на облако: 3-6-кратное уменьшение расходов при использовании отдельных ВМ с автоматическим восстановлением после падений SkyPilot позволяет работать с GPU, TPU и CPU. Поддерживаемые облака — AWS, GCP, Azure, OCI, Lambda Cloud, RunPod, Fluidstack, Cudo, IBM, Samsung, Cloudflare, VMware vSphere, любой кластер Kubernetes 🖥 GitHub 🟡 Доки @data_analysis_ml

50 256

Зачем искать удобный планировщик задач, когда его можно создать самостоятельно? А заодно — узнать, насколько вам интересно программирование. Бесплатный курс «Основы Python: создаём телеграм-бота» — полезный и надёжный вариант для самоопределения. Там на примере Python вы узнаете, как устроены процессы разработки, самостоятельно создадите планировщик задач и бота-помощника и поймёте, подходит ли вам этот язык. Доступ в чат с экспертами и однокурсниками для получения ответов на вопросы и помощи в практике, а также сертификат Нетологии после прохождения курса прилагаются → https://netolo.gy/dg7u Реклама ООО “Нетология” 2VSb5yoBgEc

50 256

🧠 Наконец-то кто-то создал leetcode для машинного обучения. Только что выполнено первое упражнение: вычисление матрично-векторного произведения без каких-либо тензорных операций (разрешены только списки на python). http://deep-ml.com @data_analysis_ml

50 256

⚡️ Adversarial Robustness Toolbox — библиотека Python для обеспечения безопасности ML-приложений — pip install adversarial-robustness-toolbox ART — это библиотека Python, которая предоставляет инструменты для оценивания, защиты и проверки моделей и ML-приложений на предмет разных угроз и уязвимостей. ART поддерживает все популярные фреймворки машинного обучения (в т.ч. TensorFlow, Keras, PyTorch, MXNet, scikit-learn, XGBoost, LightGBM, CatBoost, GPy), все типы данных (изображения, таблицы, аудио, видео) и может использоваться для любых задачи ML (классификация, обнаружение объектов, генерация музыки, изображений и т. д.). 🖥 GitHub 🟡 Доки 🟡 Примеры атак и использования ART @data_analysis_ml

50 256

🌟 Flair — мощная библиотека для NLP — pip install flair Библиотека Flair была разработана Берлинским университетом как библиотека NLP с большими возможностями. Flair позволяет проводить распознавание именованных сущностей (NER), анализ эмоциональной составляющей, тегирование части речи (PoS). Помимо этого Flair может работать с биомедицинскими текстами. Также Flair интегрируется с большим количеством других библиотек. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 256

Repost from Machinelearning

🌟 ControlNet++ — улучшенная версия вспомогательной технологии для генерации изображений ControlNet++ использует дискриминационные модели вознаграждения для оптимизации согласованности между входными условиями (изрбражение-референс) и результатами генерации за счет оптимизации последовательности циклов. Согласно опубликованным бенчмаркам, ControlNet++ значительно улучшает управляемость процессом генерации. Новый метод метод превосходит классический ControlNet: - на 7.9% по mIoU; - на 13.4% по SSIM; - на 7.6% по RMSE. Адаптации под UI для Stable Diffusion пока нет. Еще круче то, что контролнеты++ успели упаковать в Controlnet Union и собрали в 1 модель. Теперь можно разом делать 12 препроцессов с одной модели CN. 👉 Репозиторий https://huggingface.co/xinsir/controlnet-union-sdxl-1.0 Модель safetensors без конфига в папку с Контролнетом Автоматика1111 или ComfyUI. Это все действия которые необходимо сделать) А самое главное - больше не нужно качать тонну моделей и следить в UI что нужный препроцессор выбран. Работает controlnet union на SDXL-моделях. Для SD3 свой контролнет, для SD1.5 -свой, этот работать не будет. 👉 Видео: https://www.youtube.com/watch?v=UBFEw1IUX_I 🖥 GitHub [ Stars: 274 | Issues: 2 | Forks: 11 ] 🟡 Страничка проекта ControlNet++ 🟡 Arxiv 🟡 Демо на HF 🟡 Модели на HF #ControlNet #Diffusers #Image2Image @ai_machinelearning_big_data