ch
Feedback
Анализ данных (Data analysis)

Анализ данных (Data analysis)

前往频道在 Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

显示更多

📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览

频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 50 260 名订阅者,在 技术与应用 类别中位列第 2 668,并在 俄罗斯 地区排名第 12 514

📊 受众指标与增长动态

невідомо 创建以来,项目保持高速增长,吸引了 50 260 名订阅者。

根据 20 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 46,过去 24 小时变化为 34,整体触达仍然可观。

  • 认证状态: 未认证
  • 互动率 (ER): 平均受众互动率为 8.91%。内容发布后 24 小时内通常能获得 6.23% 的反应,占订阅者总量。
  • 帖子覆盖: 每篇帖子平均可获得 4 477 次浏览,首日通常累积 3 132 次浏览。
  • 互动与反馈: 受众积极参与,单帖平均反应数为 32
  • 主题关注点: 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台:
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

凭借高频更新(最新数据采集于 21 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。

50 260
订阅者
+3424 小时
+1087
+4630
帖子存档
🌟 Nous Hermes 2 - Mistral 7B - DPO - GGUF Это квантизованная версия модели Nous Hermes 2 Mistral 7B DPO; работает очень быст
+2
🌟 Nous Hermes 2 - Mistral 7B - DPO - GGUF Это квантизованная версия модели Nous Hermes 2 Mistral 7B DPO; работает очень быстро и неплохо умеет в код Сама исходная модель Nous Hermes 2 показала отличные результаты во всех бенчмарках — AGIEval, BigBench Reasoning, GPT4All и TruthfulQA; была обучена на 1000000 пар промпт-ответ качества GPT-4 или выше, а также на других высококачественных наборах данных, доступных в teknium/OpenHermes-2.5. 🤗 Hugging Face @data_analysis_ml

В России появилась среда разработки – встречайте GIGA IDE На главной технологической конференции лета GigaConf 2024 СберТех п
В России появилась среда разработки – встречайте GIGA IDE На главной технологической конференции лета GigaConf 2024 СберТех представил российскую среду разработки GIGA IDE со встроенным AI-ассистентом*. Среда позволяет вести разработку на популярных языках программирования, обеспечивает совместимость с востребованными плагинами, а также привычный пользовательский опыт. Встроенный в среду AI-ассистент GIGA CODE анализирует контекст, предлагает полные конструкции функций и других элементов, что позволяет писать код до 25% быстрее. • GIGA IDE Desktop – это интегрированная среда разработки, которая включает 70 инструментов для облегчения задач разработки, автоматизации тестирования и администрирования приложений. Разработчики уже могут скачать GIGA IDE Desktop на платформе GitVerse. • GIGA IDE Cloud позволит вести разработку в облаке, расширив возможности устройства дополнительными облачными ресурсами. Публичный релиз среды запланирован на осень 2024 года. Чтобы первыми получить доступ к GIGA IDE Cloud – регистрируйтесь на платформе GitVerse на раннее тестирование. *AI (Artificial Intelligence) - «искусственный интеллект»

+1
🌟 OSS Vizier — open-source инструмент для оптимизации, настройки гиперпараметров ML-системpip install google-vizier[jax] OSS Vizier — это инструмент, написанный на Python для оптимизации и исследования нейросетей и т.д. OSS Vizier основан на Google Vizier, одном из первых сервисов для настройки гиперпараметров, рассчитанных на работу с масштабными ML-системами. 🖥 GitHub 🟡 Доки @data_analysis_ml

🌟 Cambrian-1 — семейство мультимодальных LLM, ориентированных на CV-задачи Cambrian-1 — это семейство MLLM, разработанных с
+1
🌟 Cambrian-1 — семейство мультимодальных LLM, ориентированных на CV-задачи Cambrian-1 — это семейство MLLM, разработанных с упором на работу с визуальной информацией. На страничке Cambrian-1 представлены модели 3 размеров (8B, 13B и 34B), данные для обучения, скрипты для обучения на TPU. Скоро на GitHub появится скрипт для обучения на GPU. 🟡 Страничка Cambrian-1 🖥 GitHub 🤗 Hugging Face @data_analysis_ml

СКУЧНО. ТАК БОЛЬШЕ НЕЛЬЗЯ! — подумала наша команда летом и создала новое реалити-шоу о Data-инженерах 🤯 «‎Где Data, Коль?» —
СКУЧНО. ТАК БОЛЬШЕ НЕЛЬЗЯ! — подумала наша команда летом и создала новое реалити-шоу о Data-инженерах 🤯 «‎Где Data, Коль?» — это: ▶️5 разных участников из мира Big Data, прошедшие отбор; ▶️ментор — Николай Марков, Data Platform Lead в компании Altenar; ▶️участники строят пайплайны, осваивают Hadoop, Spark, Airflow и другие инструменты; ▶️реальный проект на собственных данных; ▶️секретное испытание в финале. ❗️Кто станет фаворитом зрителей? Кто дойдет до финала и получит заветный оффер?! 🔈Ссылка на первую серию уже в Telegram-канале «‎Где Data, Коль?» Вторая серия выйдет 5 июля. Подписывайся, чтобы не пропустить! Реклама ООО «Слёрм» ИНН 3652901451 erid: 2Vtzqviqabi

🔥Масштабируемое обучение MOE с помощью PyTorch В новом блоге Pytorch показано, как масштабировать до трех тысяч GPU, использ
🔥Масштабируемое обучение MOE с помощью PyTorch В новом блоге Pytorch показано, как масштабировать до трех тысяч GPU, используя Distributed и MegaBlocks, эффективную реализацию MoE с открытым исходным кодом в PyTorch. https://pytorch.org/blog/training-moes/ @data_analysis_ml

🌟 Тонкая настройка + RAG с помощью MistralAI В этом Colab'е детально показывается, как тонко настроить Mistral-7B для соотве
+1
🌟 Тонкая настройка + RAG с помощью MistralAI В этом Colab'е детально показывается, как тонко настроить Mistral-7B для соответствия уровня ответов Mistral-Large на RAG-конвейере обработки документов. Такая тонкая настройка стала возможной благодаря недавно вышедшему MistralAI Finetune Engine 🟡 Google Colab @data_analysis_ml

В нейросети GigaChat появился новый персонаж - Контент-мейкер. Теперь большинство ваших задач вы можете поручить ему — он под
В нейросети GigaChat появился новый персонаж - Контент-мейкер. Теперь большинство ваших задач вы можете поручить ему — он подробно расспросит о деталях задачи, уточнит, какая ЦА креатива, поможет с генерацией разного рода контента - и многое другое. Контент-мейкер может: 🔹Помочь с написанием SMM-стратегии 🔹Решить проблему "белого листа" и нагенерить креативов 🔹Разработать контент-план 🔹Разработать УТП для вашего бренда 🔹Сформировать тональность коммуникации для вашего сообщества Персонаж Контент-мейкер в GigaChat отлично справится с каждой из этих задач. Попробуй пообщаться с ним уже сейчас! 🖥 доступен в веб-версии и в боте Telegram 🖥 находится в разделе «Персонажи» или «Выбрать персонажа GigaChat» 🆘 — Контент-мейкер, придумай смешную подпись к этому посту 📝 — надо было попросить Контент-мейкера придумать смешную подпись к посту

🌟 TorchMetrics — большой набор реализованных метрик для ML-систем — pip install torchmetrics TorchMetrics — это коллекция из
+1
🌟 TorchMetrics — большой набор реализованных метрик для ML-системpip install torchmetrics TorchMetrics — это коллекция из 100+ реализаций метрик PyTorch и простой в использовании API для создания собственных метрик. Особенности API TorchMetrics: — стандартизированный интерфейс для воспроизводимости — можно использовать для распределенных ML-систем — автоматическая синхронизация между несколькими устройствами 🖥 GitHub 🟡 Доки 🟡 Все метрики @data_analysis_ml

🌟 Модель gte-Qwen2-7B-instruct от Alibaba gte-Qwen2-7B-instruct — это новейшая модель из семейства моделей gte (General Text
+1
🌟 Модель gte-Qwen2-7B-instruct от Alibaba gte-Qwen2-7B-instruct — это новейшая модель из семейства моделей gte (General Text Embedding), которая занимает 1-е место по оценкам на английском и китайском языках в бенчмарке Massive Text Embedding Benchmark MTEB gte-Qwen2-7B-instruct имеет несколько особенностей: — механизм двунаправленного внимания, улучшающий её понимание контекста — модель была обучена на большом многоязычном датасете текстов, охватывающем различные области 🤗 Hugging Face @data_analysis_ml

🌟 Во время GigaConf представили инновационное ПО от Cloud.ru Модульная облачная платформа Cloud.ru Evolution Stack позволит заказчикам реализовать гибридные сценарии и гибко использовать собственные вычислительные ресурсы, а также ресурсы публичного облака. Ожидается, что ПО позволит улучшить распределение пиковых нагрузок между публичным и частным облаками для оптимизации расходов на IT-инфраструктуру. До внедрения Evolution Stack, эксперты определят архитектуру и подходящие платформенные сервисы, осуществят установку и пуско-наладочные работы и реализуют необходимые интеграции с существующим корпоративным ПО. Ожидается, что на реализацию проекта уйдет около четырех месяцев. 🖥 GitHub 🟡 Доки @data_analysis_ml

🔹 Как усилить технический анализ финансовых рынков методами машинного обучения? Рассмотрим, как современные технологии машин
🔹 Как усилить технический анализ финансовых рынков методами машинного обучения? Рассмотрим, как современные технологии машинного обучения могут усилить и расширить классические подходы технического анализа на финансовых рынках на открытом уроке от Otus, посвященный курсу «ML для финансового анализа», 3 июля в 20:00. ✅ В течении часа рассмотрим реальные примеры и кейсы, демонстрирующие использование машинного обучения для улучшения торговых стратегий на основе технического анализа. Оставляйте заявку на курс «ML для финансового анализа» и создайте торгового робота для автоматического проведения операций с оценкой уровня риска 👉 Регистрация на урок и подробности: https://otus.pw/A44x/?erid=LjN8KATiv

🌟 DeepSeek-Coder-V2-Instruct-GGUF — квантизованные версии DeepSeek-Coder-V2-Instruct pip install -U "huggingface_hub[cli]" h
🌟 DeepSeek-Coder-V2-Instruct-GGUF — квантизованные версии DeepSeek-Coder-V2-Instruct
pip install -U "huggingface_hub[cli]"
huggingface-cli download bartowski/DeepSeek-Coder-V2-Instruct-GGUF --include "DeepSeek-Coder-V2-Instruct-Q4_K_M.gguf" --local-dir ./
Представлены несколько моделей с разным уровнем сжатия, требуют от 142.45 Гб до 52.7 Гб (но последняя не рекомендуется, экстремально низкое качество) Квантизация выполнена с использованием опции imatrix, с использованием датасета отсюда Исходная, не квантизованная модель 🤗 Hugging Face @data_analysis_ml

level up вашей карьеры инженера данных У вас уже есть опыт работы, но вы хотите выделиться на фоне «джунов» и охватить всю ар
level up вашей карьеры инженера данных У вас уже есть опыт работы, но вы хотите выделиться на фоне «джунов» и охватить всю архитектуру DWH целиком — тогда присоединяйтесь к курсу «Инженер данных» от karpov.courses и экспертов из Яндекса, Ozon, Vk и Сбера. За 5 месяцев вы освоите все актуальные технологии. А для большего погружения в работу, вы поработаете с ETL-процессами крупной двухуровневой платформы данных, закрепите понимание инструментов Airflow, Spark + S3 и Greenplum и поймёте, как использовать их в связке друг с другом. После обучения вы научитесь учитывать все взаимосвязи большого хранилища, понимать потребности заказчика и воспринимать данные как конечный продукт. Получите скидку 5% по промокоду DAMLL до 30.06.2024 и расширяйте свои навыки: https://clc.to/erid_LjN8K78jY

⚡️ OlympicArena — бенчмарк для оценки способностей LLM решать олимпийские задачи OlympicArena — это комплексный бенчмарк со с
+1
⚡️ OlympicArena — бенчмарк для оценки способностей LLM решать олимпийские задачи OlympicArena — это комплексный бенчмарк со сложным механизмом оценки LLM, предназначенный для определения возможностей AI в широком спектре задач олимпийского уровня. 🖥 GitHub 🟡 Страничка OlympicArena @data_analysis_ml

🌟 Evidently — фреймворк Python для оценки, тестирования и мониторинга ML-моделей в продакшене — pip install evidently Eviden
+2
🌟 Evidently — фреймворк Python для оценки, тестирования и мониторинга ML-моделей в продакшенеpip install evidently Evidently помогает оценивать, тестировать и контролировать данные и ML-системы. Вот некоторые из решаемых Evidently задач: — прогностические: классификация, регрессия, ранжирование, рекомендации — генеративные: чат-боты, RAGs, вопросно-ответные системы — мониторинг данных: качество данных и дрейф данных для текстовых, табличных данных 🖥 GitHub 🟡 Доки @data_analysis_ml

🌟 Enzyme — высокопроизводительное автоматическое дифференцирование LLVM и MLIR — brew install enzyme Enzyme — это инструмент
+1
🌟 Enzyme — высокопроизводительное автоматическое дифференцирование LLVM и MLIRbrew install enzyme Enzyme — это инструмент, который принимает произвольный код в виде LLVM IR и вычисляет производную (и градиент) этой функции. Это позволяет использовать Enzyme для автоматического создания градиентов своего исходного кода без лишней работы. Работая на уровне LLVM, Enzyme может дифференцировать программы на разных языках (C, C++, Swift, Julia, Rust, Fortran, TensorFlow и т. д.) с высокой производительностью. 🖥 GitHub 🟡 Доки @data_analysis_ml

По данным Yandex Cloud, в 2023 году спрос на инструменты аналитики данных вырос в 1,7 раза. Но если опираться на цифры из отч
По данным Yandex Cloud, в 2023 году спрос на инструменты аналитики данных вырос в 1,7 раза. Но если опираться на цифры из отчёта Chief Data Officer Study, то инвестиции в дата-проекты окупились лишь у 8% CDO. Одна из причин неудач — непонимание, как правильно оценивать эффективность таких проектов. Специалисты Yandex Cloud спросили об этом опытных CDO и директоров по данным. Своими советами о выборе метрик эффективности data-driven решений поделились эксперты Мосбиржи, УБРиР и «Альфа-Банка». Подробности ищите в статье.

⚡️ Cognitive Computations выпустиили dolphin-2.9.3-mistral-7B-32k В 2.9.3 включен многоязычный SystemChat 2.0 - 100 языков! О
⚡️ Cognitive Computations выпустиили dolphin-2.9.3-mistral-7B-32k В 2.9.3 включен многоязычный SystemChat 2.0 - 100 языков! Отличная базовая модель! https://huggingface.co/cognitivecomputations/dolphin-2.9.3-mistral-7B-32k @data_analysis_ml

🌟 4M-21 — open-source фреймворк от Apple для обучения мультимодальных моделей и решения множества задач Из-за CVPR релиз 4M-
+2
🌟 4M-21 — open-source фреймворк от Apple для обучения мультимодальных моделей и решения множества задач Из-за CVPR релиз 4M-21 прошёл незаметно, а ведь фреймворк очень функциональный. 4M-21 позволяет обучать универсальные мультимодальные модели, способные выполнять разные задачи, связанные с CV. 4M-21 позволяет: — создавать подписи к изображениям — оценивать глубину — обнаруживать объекты на изображении — делать сегментацию объектов — генерировать изображения — и решать много других задач 🟡 Страничка 4M-21 🖥 GitHub 🟡 Arxiv 🟡 Hugging Face @data_analysis_ml