Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya12 538 Texnologiyalar & Aralashmalar2 666...

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 212 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 666-o'rinni va Rossiya mintaqasida 12 538-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 212 obunachiga ega bo‘ldi.

18 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 10 ga, so‘nggi 24 soatda esa 7 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 8.77% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.56% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 4 404 marta ko‘riladi; birinchi sutkada odatda 3 295 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 30 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 19 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 212

Obunachilar

+724 soatlar

+227 kunlar

+1030 kunlar

4 404

Post ko'rishlar

~ 3 29524 soatlar

~ 4 33648 soatlar

8.77%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Postlar arxiv

50 213

Базы данных для задач любой сложности Безопасность, масштабируемость и отказоустойчивость баз данных — ключевые требования для любых современных веб-сервисов и приложений. А наличие этих требований по умолчанию, без дополнительной головной боли — мечта для любого бизнеса. Или не мечта, а реальность? Selectel предлагает одни из лучших облачных баз данных на рынке и берет эти на заботы на себя: ● предоставляет высокую производительность за счет оптимальной настройки ПО, подбора мощного железа и локальных NVMe-дисков; ● обеспечивает резервное копирование. Бесплатные бэкапы создаются автоматически, а восстановление данных происходит вплоть до секунды; ● гарантирует отказоустойчивость. Создать отказоустойчивый кластер можно всего от двух нод, что позволяет сэкономить до 33% стоимости ресурсов; ● дает возможности для быстрого масштабирования. При росте нагрузки можно поменять конфигурацию облачного сервера и количество реплик без простоя. ● заботится о безопасности: сервис соответствует российским и международным стандартам — закону 152-ФЗ (УЗ-1), приказу ФСТЭК № 21, PCI DSS, ISO 27001, 27017, 27018 и ГОСТ Р 57580. Развернуть готовые к работе кластеры облачных баз данных в несколько кликов: https://slc.tl/v7gmo Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzqwgdXD6

50 213

🔥 Qwen 2.5 - 7B and 14B с длинной контекста 1 миллион токенов Они также выпустили свой собственный форк vllm - чтобы вы могли развернуть модель у себя дома! 💥 Стоит отметить, что модель 14B-1M выигрывает у гораздо более крупной модели Qwen 2.5 Turbo (предположительно MoE с тем же количеством активных параметров). Более того, она еще и превосходит бета-версия GPT-4/ 4o на длинном контексте! https://huggingface.co/collections/Qwen/qwen25-1m-679325716327ec07860530ba @data_analysis_ml #Qwen

50 213

🖥 Audiblez — это инструмент для конвертации электронных книг в аудиокниги! 🌟 Он использует модель текст-в-речь Kokoro для создания файлов в формате .m4b из файлов .epub. Программа поддерживает различные языки, голоса и позволяет настроить скорость чтения. Также доступна работа на GPU для ускорения обработки. 🔐 Лицензия: MIT 🖥 Github @data_analysis_ml

50 213

🔥 MagicMirror — это приложение для мгновенной замены лиц, причесок и одежды с помощью ИИ! 🌟 Оно работает локально на macOS и Windows, не требует мощного оборудования и обеспечивает полную конфиденциальность, так как обработка изображений выполняется на устройстве. 🔐 Лицензия: MIT 🖥 Github @data_analysis_ml

50 213

⭐️ Anton Pidkuiko рассказывает, как он создал ИИ-агента, который занял первое место в Meta HackerCup 2024 (дивизион ИИ). Он демонстрирует использование передовых методов рассуждений LLM, методов RAG и облачной инфраструктуры для решения сложных задач программирования в больших масштабах. Посмотрите запись: https://www.youtube.com/watch?v=cvIeT4MlIx4 @data_analysis_ml #pytorch #ai #expertexchange

50 213

⚡️ Повторно дистиллированная Deepseek AiR1 (1,5B) превосходит по своим характеристикам оригинальную дистиллированную модель! https://huggingface.co/mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-1.5B-v1.0 @data_analysis_ml

50 213

🔥 Minima — это open source решение для RAG в контейнерах для развертывания на любых мощностях (клауд или локал), с возможностью интеграции с ChatGPT и MCP. Minima также может использоваться как RAG на вашей машине. Minima поддерживает три режима работы: 1. Изолированная установка — Работа в контейнерах без внешних зависимостей, таких как ChatGPT или Claude. Все нейронные сети (LLM, ранкер, эмбеддинг) и векторный сторедж запускаются на вашем сервере или ПК, обеспечивая безопасность ваших данных. 2. Кастомный GPT — Запросы к вашим локальным документам через приложение или веб-версию ChatGPT с использованием кастомных GPT. Индексатор работает на вашем сервере или локальном ПК, а основная LLM остаётся ChatGPT. 3. Anthropic Claude — Использование приложения Anthropic Claude для запросов к вашим локальным документам. Индексатор работает на вашем локальном ПК, а основная LLM — это Anthropic Claude. В данный момент, Minima решает задачу RAG on-premises и призывает всех поставить звезду и форкнуть репозиторий, а так же не стесняться и принять участие в разработке. 📌 Лицензия MPL-2.0 ▪ Github @data_analysis_ml

50 213

⭐️ Video LLaMA 3 "Мультимодальные базовые модели для понимания изображений и видео" от ДАМО Алибаба ▪ Model: https://huggingface.co/collections/DAMO-NLP-SG/videollama3-678cdda9281a0e32fe79af15 ▪ Paper: https://huggingface.co/papers/2501.13106 @data_analysis_ml

50 213

⭐️ DataDreamer, библиотека Python с открытым исходным кодом, позволяет легко генерировать синтетические данные и интегрируется с huggingface 🔍 Узнайте, как это сделать: https://huggingface.co/blog/asoria/datadreamer-datasets#6790671e20a7d3ca6f72b6cb @data_analysis_ml

50 213

Только что вышла версия CUDA 12.8 с поддержкой Blackwell. Гайд по работе с TensorCore 5-го поколения: https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#tensorcore-5th-generation-instructions #cuda #TensorCore #nvidia

50 213

Оптимизируйте бизнес-процессы с помощью данных и стратегического мышления — станьте бизнес-аналитиком за 6 месяцев Бизнес-аналитик собирает и интерпретирует данные, чтобы помогать бизнесу принимать обоснованные решения и создавать эффективные стратегии развития. В его задачи входит сбор и анализ требований, аудит бизнес-процессов, проведение исследований, выявление проблем и поиск их решений, подготовка отчётности. На курсе Нетологии «Бизнес-аналитик» вы можете освоить необходимые навыки всего за 6 месяцев и претендовать на junior-позицию уже во время обучения. Под руководством ментора вы научитесь работать с нотациями IDEF0, BPMN 2.0, EPC, а также с инструментами анализа данных: SQL, Python, Tableau и Power BI. Получите опыт работы с заказчиками и разберёте тестовые задания из реальных вакансий с преподавателем курса. Дополнительно вы можете освоить навыки кандитата на middle-позицию на расширенной траектории программы — пройти модуль по системному анализу. Он охватывает полный жизненный цикл ПО, включая гибкие подходы к разработке, UX/UI прототипирование, тестирование и развертывание, а также документирование IT-проектов. 🔥 До 31 января на курс действует дополнительная скидка 15% по промокоду ANALYTIC15. Реклама. ООО "Нетология". ИНН 7726464125 Erid 2VSb5yG4Lkp

50 213

🔥 OpenVINO Toolkit — это мощный инструмент с открытым исходным кодом для оптимизации и выполнения моделей машинного обучения! 🌟 OpenVINO позволяет преобразовывать модели из популярных фреймворков, таких как TensorFlow, PyTorch и ONNX, в формат, оптимизированный для работы на аппаратуре Intel. Он поддерживает широкий спектр устройств, включая процессоры, GPU, FPGA и специализированные чипы, что делает его идеальным выбором для разработки производительных AI-приложений. 🔐 Лицензия: Apache-2.0 🖥 Github @data_analysis_ml

50 213

Текст: 🚀 Вам от 13 до 20 лет, вы уже знаете основы Python и хотите двигаться дальше, в область современной аналитики? Тогда у вас есть крутой шанс прокачать свои навыки на бесплатной программе по анализу данных от Яндекс Лицея! 📊 Специализация длится 3 месяца и проходит онлайн. Вас будут учить опытные профессионалы с реальным практическим опытом. Они расскажут, как анализировать и визуализировать данные с помощью Python, а также принимать решения на основе полученной информации. Набор открыт также на онлайн-программы по веб-разработке на Go и Django, машинному обучению и большим данным. Не откладывайте на следующий год — подайте заявку до 29 января! 💻

50 213

Repost from Machinelearning

🌟 SmolVLM: набор компактных VLM от HuggingFace - Base, Synthetic и Instruct. SmolVLM - серия компактных VLM отличающихся высокой эффективностью использования памяти и могут быть развернуты на локальных устройствах с ограниченными ресурсами. Только что были выпущены SmolVLM (256M и 500M), которым требуются GPU <1GB для запуска. 🤗 SmolVLM-256M – это cамая маленькая VLM в мире! Модели настолько маленькт, что могут работать 100% локально в вашем браузере на WebGPU! 📌Лицензирование: Apache 2.0 ⭐️ Smolervlm: https://huggingface.co/blog/smolervlm 🤗 Модели: https://huggingface.co/collections/HuggingFaceTB/smolvlm-256m-and-500m-6791fafc5bb0ab8acc960fb0 @ai_machinelearning_big_data #AI #ML #SmallVLM #Huggingface

50 213

📖 Эта статья исследует методы оценки неопределенности больших языковых моделей в "черном ящике"! 💡 Авторы предлагают подход под названием DiverseAgentEntropy, который измеряет надежность модели, анализируя ее ответы на различные переформулированные версии одного и того же запроса. Если модель уверена в своих знаниях, она должна отвечать одинаково независимо от формулировки вопроса. Этот метод позволяет также обнаруживать случаи галлюцинаций, когда модель предоставляет недостоверные ответы. 🌟 В основе подхода лежит идея многократного взаимодействия "агентов" (вариаций одной и той же модели), которые обрабатывают один и тот же запрос с разным контекстом. Итоговая оценка основана на согласованности их ответов. В результате метод показывает более точные оценки неопределенности по сравнению с традиционными методами, такими как самосогласованность. Исследование также подчеркивает проблему неспособности моделей систематически извлекать правильные ответы, даже если они уже заложены в параметрические знания модели. @data_analysis_ml

50 213

⚡️ Bespoke-Stratos-32B, новая ризонинг модель, разработанную на основе DeepSeek-R1 с использованием Sky-T1 от Berkeley NovaSky. Модель превосходит Sky-T1 и o1-preview в тестах reasoning (математика и написаний кода) и почти достигает производительности DeepSeek-R1-Distill-Qwen-32B при обучении, котором было использовано 47 раз меньшее количество примеров! Важно отметить то, что разработчики используют набор данных с открытым исходным кодом. ▪Data: https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-17k ▪Curator: https://github.com/bespokelabsai/curator/ ▪32B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-32B ▪7B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-7B ▪Сode: https://github.com/bespokelabsai/curator/tree/main/examples/bespoke-stratos-data-generation @data_analysis_ml

50 213

🔥 Обобщение и переобучение в машинном обучении. - Видео - Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 / - Урок6/ Урок7/ Урок 8 - Colab -Полный курс #ml #math #mlmath #probability #машинноеобучение

50 213

⚡️ Creating new games with interactive generative videos that learns from a small-scale dataset of Minecraft data. ▪Project page: https://vvictoryuki.github.io/gamefactory/ ▪Paper: https://arxiv.org/abs/2501.08325 ▪ Dataset: https://huggingface.co/datasets/KwaiVGI/GameFactory-Dataset @data_analysis_ml

50 213

🔥 Agent Recipes — мастерская с огромным количеством примеров кода, который вы можете скопировать и использовать в своих собственных проектах ИИ! 🔗 Ссылка: *клик* @data_analysis_ml

50 213

Repost from Machinelearning

🌟 Google только что выпустили новую модель Gemini 2.0 Flash Thinking ✅ Контекст с 1 миллионом токенов (5-х больше, чем o1 Pro) #1 на арене чат-ботов 👑 Модель показала наивысший результат, обогнав Gemini-Exp-1206 + 17 очков прироста по сравнению с предыдущей контрольной точкой 1219 - №1 по всем направлениям (генерации кода), за исключением управления стилем. • AIME: 73.3% • GPQA: 74.2% • MMMU: 75.4% Модель доступна в ai-gradio pip install --upgrade "ai-gradio[gemini]" Они так же выпустили Gemini2.0 Pro. https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-thinking-exp-01-21 #google #gemini