Анализ данных (Data analysis)
前往频道在 Telegram
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
显示更多📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览
频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 50 212 名订阅者,在 技术与应用 类别中位列第 2 666,并在 俄罗斯 地区排名第 12 538 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 50 212 名订阅者。
根据 18 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 10,过去 24 小时变化为 7,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 8.77%。内容发布后 24 小时内通常能获得 6.56% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 4 404 次浏览,首日通常累积 3 295 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 30。
- 主题关注点: 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
凭借高频更新(最新数据采集于 19 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
50 212
订阅者
+724 小时
+227 天
+1030 天
帖子存档
Базы данных для задач любой сложности
Безопасность, масштабируемость и отказоустойчивость баз данных — ключевые требования для любых современных веб-сервисов и приложений. А наличие этих требований по умолчанию, без дополнительной головной боли — мечта для любого бизнеса. Или не мечта, а реальность? Selectel предлагает одни из лучших облачных баз данных на рынке и берет эти на заботы на себя:
● предоставляет высокую производительность за счет оптимальной настройки ПО, подбора мощного железа и локальных NVMe-дисков;
● обеспечивает резервное копирование. Бесплатные бэкапы создаются автоматически, а восстановление данных происходит вплоть до секунды;
● гарантирует отказоустойчивость. Создать отказоустойчивый кластер можно всего от двух нод, что позволяет сэкономить до 33% стоимости ресурсов;
● дает возможности для быстрого масштабирования. При росте нагрузки можно поменять конфигурацию облачного сервера и количество реплик без простоя.
● заботится о безопасности: сервис соответствует российским и международным стандартам — закону 152-ФЗ (УЗ-1), приказу ФСТЭК № 21, PCI DSS, ISO 27001, 27017, 27018 и ГОСТ Р 57580.
Развернуть готовые к работе кластеры облачных баз данных в несколько кликов: https://slc.tl/v7gmo
Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzqwgdXD6
🔥 Qwen 2.5 - 7B and 14B с длинной контекста 1 миллион токенов
Они также выпустили свой собственный форк vllm - чтобы вы могли развернуть модель у себя дома! 💥
Стоит отметить, что модель 14B-1M выигрывает у гораздо более крупной модели Qwen 2.5 Turbo (предположительно MoE с тем же количеством активных параметров).
Более того, она еще и превосходит бета-версия GPT-4/ 4o на длинном контексте!
https://huggingface.co/collections/Qwen/qwen25-1m-679325716327ec07860530ba
@data_analysis_ml
#Qwen
🖥 Audiblez — это инструмент для конвертации электронных книг в аудиокниги!
🌟 Он использует модель текст-в-речь Kokoro для создания файлов в формате .m4b из файлов .epub. Программа поддерживает различные языки, голоса и позволяет настроить скорость чтения. Также доступна работа на GPU для ускорения обработки.
🔐 Лицензия: MIT
🖥 Github
@data_analysis_ml
🔥 MagicMirror — это приложение для мгновенной замены лиц, причесок и одежды с помощью ИИ!
🌟 Оно работает локально на macOS и Windows, не требует мощного оборудования и обеспечивает полную конфиденциальность, так как обработка изображений выполняется на устройстве.
🔐 Лицензия: MIT
🖥 Github
@data_analysis_ml
⭐️ Anton Pidkuiko рассказывает, как он создал ИИ-агента, который занял первое место в Meta HackerCup 2024 (дивизион ИИ).
Он демонстрирует использование передовых методов рассуждений LLM, методов RAG и облачной инфраструктуры для решения сложных задач программирования в больших масштабах.
Посмотрите запись: https://www.youtube.com/watch?v=cvIeT4MlIx4
@data_analysis_ml
#pytorch #ai #expertexchange
⚡️ Повторно дистиллированная
Deepseek AiR1 (1,5B) превосходит по своим характеристикам оригинальную дистиллированную модель!
https://huggingface.co/mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-1.5B-v1.0
@data_analysis_ml
🔥 Minima — это open source решение для RAG в контейнерах для развертывания на любых мощностях (клауд или локал), с возможностью интеграции с ChatGPT и MCP.
Minima также может использоваться как RAG на вашей машине.
Minima поддерживает три режима работы:
1. Изолированная установка — Работа в контейнерах без внешних зависимостей, таких как ChatGPT или Claude. Все нейронные сети (LLM, ранкер, эмбеддинг) и векторный сторедж запускаются на вашем сервере или ПК, обеспечивая безопасность ваших данных.
2. Кастомный GPT — Запросы к вашим локальным документам через приложение или веб-версию ChatGPT с использованием кастомных GPT. Индексатор работает на вашем сервере или локальном ПК, а основная LLM остаётся ChatGPT.
3. Anthropic Claude — Использование приложения Anthropic Claude для запросов к вашим локальным документам. Индексатор работает на вашем локальном ПК, а основная LLM — это Anthropic Claude.
В данный момент, Minima решает задачу RAG on-premises и призывает всех поставить звезду и форкнуть репозиторий, а так же не стесняться и принять участие в разработке.
📌 Лицензия MPL-2.0
▪ Github
@data_analysis_ml
⭐️ Video LLaMA 3 "Мультимодальные базовые модели для понимания изображений и видео" от ДАМО Алибаба
▪ Model: https://huggingface.co/collections/DAMO-NLP-SG/videollama3-678cdda9281a0e32fe79af15
▪ Paper: https://huggingface.co/papers/2501.13106
@data_analysis_ml
⭐️ DataDreamer, библиотека Python с открытым исходным кодом, позволяет легко генерировать синтетические данные и интегрируется с huggingface
🔍 Узнайте, как это сделать: https://huggingface.co/blog/asoria/datadreamer-datasets#6790671e20a7d3ca6f72b6cb
@data_analysis_ml
Только что вышла версия CUDA 12.8 с поддержкой Blackwell.
Гайд по работе с TensorCore 5-го поколения:
https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#tensorcore-5th-generation-instructions
#cuda #TensorCore #nvidia
Оптимизируйте бизнес-процессы с помощью данных и стратегического мышления — станьте бизнес-аналитиком за 6 месяцев
Бизнес-аналитик собирает и интерпретирует данные, чтобы помогать бизнесу принимать обоснованные решения и создавать эффективные стратегии развития. В его задачи входит сбор и анализ требований, аудит бизнес-процессов, проведение исследований, выявление проблем и поиск их решений, подготовка отчётности.
На курсе Нетологии «Бизнес-аналитик» вы можете освоить необходимые навыки всего за 6 месяцев и претендовать на junior-позицию уже во время обучения. Под руководством ментора вы научитесь работать с нотациями IDEF0, BPMN 2.0, EPC, а также с инструментами анализа данных: SQL, Python, Tableau и Power BI. Получите опыт работы с заказчиками и разберёте тестовые задания из реальных вакансий с преподавателем курса.
Дополнительно вы можете освоить навыки кандитата на middle-позицию на расширенной траектории программы — пройти модуль по системному анализу. Он охватывает полный жизненный цикл ПО, включая гибкие подходы к разработке, UX/UI прототипирование, тестирование и развертывание, а также документирование IT-проектов.
🔥 До 31 января на курс действует дополнительная скидка 15% по промокоду ANALYTIC15.
Реклама. ООО "Нетология". ИНН 7726464125 Erid 2VSb5yG4Lkp
🔥 OpenVINO Toolkit — это мощный инструмент с открытым исходным кодом для оптимизации и выполнения моделей машинного обучения!
🌟 OpenVINO позволяет преобразовывать модели из популярных фреймворков, таких как TensorFlow, PyTorch и ONNX, в формат, оптимизированный для работы на аппаратуре Intel. Он поддерживает широкий спектр устройств, включая процессоры, GPU, FPGA и специализированные чипы, что делает его идеальным выбором для разработки производительных AI-приложений.
🔐 Лицензия: Apache-2.0
🖥 Github
@data_analysis_ml
+1
Текст:
🚀 Вам от 13 до 20 лет, вы уже знаете основы Python и хотите двигаться дальше, в область современной аналитики? Тогда у вас есть крутой шанс прокачать свои навыки на бесплатной программе по анализу данных от Яндекс Лицея! 📊
Специализация длится 3 месяца и проходит онлайн. Вас будут учить опытные профессионалы с реальным практическим опытом. Они расскажут, как анализировать и визуализировать данные с помощью Python, а также принимать решения на основе полученной информации.
Набор открыт также на онлайн-программы по веб-разработке на Go и Django, машинному обучению и большим данным. Не откладывайте на следующий год — подайте заявку до 29 января! 💻
Repost from Machinelearning
🌟 SmolVLM: набор компактных VLM от HuggingFace - Base, Synthetic и Instruct.
SmolVLM - серия компактных VLM отличающихся высокой эффективностью использования памяти и могут быть развернуты на локальных устройствах с ограниченными ресурсами.
Только что были выпущены SmolVLM (256M и 500M), которым требуются GPU <1GB для запуска.
🤗 SmolVLM-256M – это cамая маленькая VLM в мире!
Модели настолько маленькт, что могут работать 100% локально в вашем браузере на WebGPU!
📌Лицензирование: Apache 2.0
⭐️ Smolervlm: https://huggingface.co/blog/smolervlm
🤗 Модели: https://huggingface.co/collections/HuggingFaceTB/smolvlm-256m-and-500m-6791fafc5bb0ab8acc960fb0
@ai_machinelearning_big_data
#AI #ML #SmallVLM #Huggingface
📖 Эта статья исследует методы оценки неопределенности больших языковых моделей в "черном ящике"!
💡 Авторы предлагают подход под названием DiverseAgentEntropy, который измеряет надежность модели, анализируя ее ответы на различные переформулированные версии одного и того же запроса. Если модель уверена в своих знаниях, она должна отвечать одинаково независимо от формулировки вопроса. Этот метод позволяет также обнаруживать случаи галлюцинаций, когда модель предоставляет недостоверные ответы.
🌟 В основе подхода лежит идея многократного взаимодействия "агентов" (вариаций одной и той же модели), которые обрабатывают один и тот же запрос с разным контекстом. Итоговая оценка основана на согласованности их ответов. В результате метод показывает более точные оценки неопределенности по сравнению с традиционными методами, такими как самосогласованность. Исследование также подчеркивает проблему неспособности моделей систематически извлекать правильные ответы, даже если они уже заложены в параметрические знания модели.
@data_analysis_ml
⚡️ Bespoke-Stratos-32B, новая ризонинг модель, разработанную на основе DeepSeek-R1 с использованием Sky-T1 от Berkeley NovaSky.
Модель превосходит Sky-T1 и o1-preview в тестах reasoning (математика и написаний кода) и почти достигает производительности DeepSeek-R1-Distill-Qwen-32B при обучении, котором было использовано 47 раз меньшее количество примеров!
Важно отметить то, что разработчики используют набор данных с открытым исходным кодом.
▪Data: https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-17k
▪Curator: https://github.com/bespokelabsai/curator/
▪32B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-32B
▪7B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-7B
▪Сode: https://github.com/bespokelabsai/curator/tree/main/examples/bespoke-stratos-data-generation
@data_analysis_ml
⚡️ Creating new games with interactive generative videos that learns from a small-scale dataset of Minecraft data.
▪Project page: https://vvictoryuki.github.io/gamefactory/
▪Paper: https://arxiv.org/abs/2501.08325
▪ Dataset: https://huggingface.co/datasets/KwaiVGI/GameFactory-Dataset
@data_analysis_ml
🔥
Agent Recipes — мастерская с огромным количеством примеров кода, который вы можете скопировать и использовать в своих собственных проектах ИИ!
🔗 Ссылка: *клик*
@data_analysis_mlRepost from Machinelearning
🌟 Google только что выпустили новую модель Gemini 2.0 Flash Thinking
✅ Контекст с 1 миллионом токенов (5-х больше, чем o1 Pro)
#1 на арене чат-ботов 👑
Модель показала наивысший результат, обогнав Gemini-Exp-1206
+ 17 очков прироста по сравнению с предыдущей контрольной точкой 1219
- №1 по всем направлениям (генерации кода), за исключением управления стилем.
• AIME: 73.3%
• GPQA: 74.2%
• MMMU: 75.4%
Модель доступна в ai-gradio
pip install --upgrade "ai-gradio[gemini]"
Они так же выпустили Gemini2.0 Pro.
https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-thinking-exp-01-21
#google #gemini
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
