Анализ данных (Data analysis)

前往频道在 Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

显示更多

网络:Machinelearning 俄罗斯12 538 技术与应用2 666...

📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览

频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语语言赛道中的是活跃参与者。目前社区聚集了 50 212 名订阅者，在 技术与应用 类别中位列第 2 666，并在 俄罗斯 地区排名第 12 538 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 50 212 名订阅者。

根据 18 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 10，过去 24 小时变化为 7，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 8.77%。内容发布后 24 小时内通常能获得 6.56% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 4 404 次浏览，首日通常累积 3 295 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 30。
主题关注点： 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

凭借高频更新（最新数据采集于 19 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

50 212

订阅者

+724 小时

+227 天

+1030 天

4 404

帖子浏览量

~ 3 29524 小时

~ 4 33648 小时

8.77%

参与率

~ 5

每日帖子数

Ads index

beta

帖子存档

50 213

Базы данных для задач любой сложности Безопасность, масштабируемость и отказоустойчивость баз данных — ключевые требования для любых современных веб-сервисов и приложений. А наличие этих требований по умолчанию, без дополнительной головной боли — мечта для любого бизнеса. Или не мечта, а реальность? Selectel предлагает одни из лучших облачных баз данных на рынке и берет эти на заботы на себя: ● предоставляет высокую производительность за счет оптимальной настройки ПО, подбора мощного железа и локальных NVMe-дисков; ● обеспечивает резервное копирование. Бесплатные бэкапы создаются автоматически, а восстановление данных происходит вплоть до секунды; ● гарантирует отказоустойчивость. Создать отказоустойчивый кластер можно всего от двух нод, что позволяет сэкономить до 33% стоимости ресурсов; ● дает возможности для быстрого масштабирования. При росте нагрузки можно поменять конфигурацию облачного сервера и количество реплик без простоя. ● заботится о безопасности: сервис соответствует российским и международным стандартам — закону 152-ФЗ (УЗ-1), приказу ФСТЭК № 21, PCI DSS, ISO 27001, 27017, 27018 и ГОСТ Р 57580. Развернуть готовые к работе кластеры облачных баз данных в несколько кликов: https://slc.tl/v7gmo Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzqwgdXD6

50 213

🔥 Qwen 2.5 - 7B and 14B с длинной контекста 1 миллион токенов Они также выпустили свой собственный форк vllm - чтобы вы могли развернуть модель у себя дома! 💥 Стоит отметить, что модель 14B-1M выигрывает у гораздо более крупной модели Qwen 2.5 Turbo (предположительно MoE с тем же количеством активных параметров). Более того, она еще и превосходит бета-версия GPT-4/ 4o на длинном контексте! https://huggingface.co/collections/Qwen/qwen25-1m-679325716327ec07860530ba @data_analysis_ml #Qwen

50 213

🖥 Audiblez — это инструмент для конвертации электронных книг в аудиокниги! 🌟 Он использует модель текст-в-речь Kokoro для создания файлов в формате .m4b из файлов .epub. Программа поддерживает различные языки, голоса и позволяет настроить скорость чтения. Также доступна работа на GPU для ускорения обработки. 🔐 Лицензия: MIT 🖥 Github @data_analysis_ml

50 213

🔥 MagicMirror — это приложение для мгновенной замены лиц, причесок и одежды с помощью ИИ! 🌟 Оно работает локально на macOS и Windows, не требует мощного оборудования и обеспечивает полную конфиденциальность, так как обработка изображений выполняется на устройстве. 🔐 Лицензия: MIT 🖥 Github @data_analysis_ml

50 213

⭐️ Anton Pidkuiko рассказывает, как он создал ИИ-агента, который занял первое место в Meta HackerCup 2024 (дивизион ИИ). Он демонстрирует использование передовых методов рассуждений LLM, методов RAG и облачной инфраструктуры для решения сложных задач программирования в больших масштабах. Посмотрите запись: https://www.youtube.com/watch?v=cvIeT4MlIx4 @data_analysis_ml #pytorch #ai #expertexchange

50 213

⚡️ Повторно дистиллированная Deepseek AiR1 (1,5B) превосходит по своим характеристикам оригинальную дистиллированную модель! https://huggingface.co/mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-1.5B-v1.0 @data_analysis_ml

50 213

🔥 Minima — это open source решение для RAG в контейнерах для развертывания на любых мощностях (клауд или локал), с возможностью интеграции с ChatGPT и MCP. Minima также может использоваться как RAG на вашей машине. Minima поддерживает три режима работы: 1. Изолированная установка — Работа в контейнерах без внешних зависимостей, таких как ChatGPT или Claude. Все нейронные сети (LLM, ранкер, эмбеддинг) и векторный сторедж запускаются на вашем сервере или ПК, обеспечивая безопасность ваших данных. 2. Кастомный GPT — Запросы к вашим локальным документам через приложение или веб-версию ChatGPT с использованием кастомных GPT. Индексатор работает на вашем сервере или локальном ПК, а основная LLM остаётся ChatGPT. 3. Anthropic Claude — Использование приложения Anthropic Claude для запросов к вашим локальным документам. Индексатор работает на вашем локальном ПК, а основная LLM — это Anthropic Claude. В данный момент, Minima решает задачу RAG on-premises и призывает всех поставить звезду и форкнуть репозиторий, а так же не стесняться и принять участие в разработке. 📌 Лицензия MPL-2.0 ▪ Github @data_analysis_ml

50 213

⭐️ Video LLaMA 3 "Мультимодальные базовые модели для понимания изображений и видео" от ДАМО Алибаба ▪ Model: https://huggingface.co/collections/DAMO-NLP-SG/videollama3-678cdda9281a0e32fe79af15 ▪ Paper: https://huggingface.co/papers/2501.13106 @data_analysis_ml

50 213

⭐️ DataDreamer, библиотека Python с открытым исходным кодом, позволяет легко генерировать синтетические данные и интегрируется с huggingface 🔍 Узнайте, как это сделать: https://huggingface.co/blog/asoria/datadreamer-datasets#6790671e20a7d3ca6f72b6cb @data_analysis_ml

50 213

Только что вышла версия CUDA 12.8 с поддержкой Blackwell. Гайд по работе с TensorCore 5-го поколения: https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#tensorcore-5th-generation-instructions #cuda #TensorCore #nvidia

50 213

Оптимизируйте бизнес-процессы с помощью данных и стратегического мышления — станьте бизнес-аналитиком за 6 месяцев Бизнес-аналитик собирает и интерпретирует данные, чтобы помогать бизнесу принимать обоснованные решения и создавать эффективные стратегии развития. В его задачи входит сбор и анализ требований, аудит бизнес-процессов, проведение исследований, выявление проблем и поиск их решений, подготовка отчётности. На курсе Нетологии «Бизнес-аналитик» вы можете освоить необходимые навыки всего за 6 месяцев и претендовать на junior-позицию уже во время обучения. Под руководством ментора вы научитесь работать с нотациями IDEF0, BPMN 2.0, EPC, а также с инструментами анализа данных: SQL, Python, Tableau и Power BI. Получите опыт работы с заказчиками и разберёте тестовые задания из реальных вакансий с преподавателем курса. Дополнительно вы можете освоить навыки кандитата на middle-позицию на расширенной траектории программы — пройти модуль по системному анализу. Он охватывает полный жизненный цикл ПО, включая гибкие подходы к разработке, UX/UI прототипирование, тестирование и развертывание, а также документирование IT-проектов. 🔥 До 31 января на курс действует дополнительная скидка 15% по промокоду ANALYTIC15. Реклама. ООО "Нетология". ИНН 7726464125 Erid 2VSb5yG4Lkp

50 213

🔥 OpenVINO Toolkit — это мощный инструмент с открытым исходным кодом для оптимизации и выполнения моделей машинного обучения! 🌟 OpenVINO позволяет преобразовывать модели из популярных фреймворков, таких как TensorFlow, PyTorch и ONNX, в формат, оптимизированный для работы на аппаратуре Intel. Он поддерживает широкий спектр устройств, включая процессоры, GPU, FPGA и специализированные чипы, что делает его идеальным выбором для разработки производительных AI-приложений. 🔐 Лицензия: Apache-2.0 🖥 Github @data_analysis_ml

50 213

Текст: 🚀 Вам от 13 до 20 лет, вы уже знаете основы Python и хотите двигаться дальше, в область современной аналитики? Тогда у вас есть крутой шанс прокачать свои навыки на бесплатной программе по анализу данных от Яндекс Лицея! 📊 Специализация длится 3 месяца и проходит онлайн. Вас будут учить опытные профессионалы с реальным практическим опытом. Они расскажут, как анализировать и визуализировать данные с помощью Python, а также принимать решения на основе полученной информации. Набор открыт также на онлайн-программы по веб-разработке на Go и Django, машинному обучению и большим данным. Не откладывайте на следующий год — подайте заявку до 29 января! 💻

50 213

Repost from Machinelearning

🌟 SmolVLM: набор компактных VLM от HuggingFace - Base, Synthetic и Instruct. SmolVLM - серия компактных VLM отличающихся высокой эффективностью использования памяти и могут быть развернуты на локальных устройствах с ограниченными ресурсами. Только что были выпущены SmolVLM (256M и 500M), которым требуются GPU <1GB для запуска. 🤗 SmolVLM-256M – это cамая маленькая VLM в мире! Модели настолько маленькт, что могут работать 100% локально в вашем браузере на WebGPU! 📌Лицензирование: Apache 2.0 ⭐️ Smolervlm: https://huggingface.co/blog/smolervlm 🤗 Модели: https://huggingface.co/collections/HuggingFaceTB/smolvlm-256m-and-500m-6791fafc5bb0ab8acc960fb0 @ai_machinelearning_big_data #AI #ML #SmallVLM #Huggingface

50 213

📖 Эта статья исследует методы оценки неопределенности больших языковых моделей в "черном ящике"! 💡 Авторы предлагают подход под названием DiverseAgentEntropy, который измеряет надежность модели, анализируя ее ответы на различные переформулированные версии одного и того же запроса. Если модель уверена в своих знаниях, она должна отвечать одинаково независимо от формулировки вопроса. Этот метод позволяет также обнаруживать случаи галлюцинаций, когда модель предоставляет недостоверные ответы. 🌟 В основе подхода лежит идея многократного взаимодействия "агентов" (вариаций одной и той же модели), которые обрабатывают один и тот же запрос с разным контекстом. Итоговая оценка основана на согласованности их ответов. В результате метод показывает более точные оценки неопределенности по сравнению с традиционными методами, такими как самосогласованность. Исследование также подчеркивает проблему неспособности моделей систематически извлекать правильные ответы, даже если они уже заложены в параметрические знания модели. @data_analysis_ml

50 213

⚡️ Bespoke-Stratos-32B, новая ризонинг модель, разработанную на основе DeepSeek-R1 с использованием Sky-T1 от Berkeley NovaSky. Модель превосходит Sky-T1 и o1-preview в тестах reasoning (математика и написаний кода) и почти достигает производительности DeepSeek-R1-Distill-Qwen-32B при обучении, котором было использовано 47 раз меньшее количество примеров! Важно отметить то, что разработчики используют набор данных с открытым исходным кодом. ▪Data: https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-17k ▪Curator: https://github.com/bespokelabsai/curator/ ▪32B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-32B ▪7B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-7B ▪Сode: https://github.com/bespokelabsai/curator/tree/main/examples/bespoke-stratos-data-generation @data_analysis_ml

50 213

🔥 Обобщение и переобучение в машинном обучении. - Видео - Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 / - Урок6/ Урок7/ Урок 8 - Colab -Полный курс #ml #math #mlmath #probability #машинноеобучение

50 213

⚡️ Creating new games with interactive generative videos that learns from a small-scale dataset of Minecraft data. ▪Project page: https://vvictoryuki.github.io/gamefactory/ ▪Paper: https://arxiv.org/abs/2501.08325 ▪ Dataset: https://huggingface.co/datasets/KwaiVGI/GameFactory-Dataset @data_analysis_ml

50 213

🔥 Agent Recipes — мастерская с огромным количеством примеров кода, который вы можете скопировать и использовать в своих собственных проектах ИИ! 🔗 Ссылка: *клик* @data_analysis_ml

50 213

Repost from Machinelearning

🌟 Google только что выпустили новую модель Gemini 2.0 Flash Thinking ✅ Контекст с 1 миллионом токенов (5-х больше, чем o1 Pro) #1 на арене чат-ботов 👑 Модель показала наивысший результат, обогнав Gemini-Exp-1206 + 17 очков прироста по сравнению с предыдущей контрольной точкой 1219 - №1 по всем направлениям (генерации кода), за исключением управления стилем. • AIME: 73.3% • GPQA: 74.2% • MMMU: 75.4% Модель доступна в ai-gradio pip install --upgrade "ai-gradio[gemini]" Они так же выпустили Gemini2.0 Pro. https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-thinking-exp-01-21 #google #gemini