uz
Feedback
Анализ данных (Data analysis)

Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 212 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 666-o'rinni va Rossiya mintaqasida 12 538-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 212 obunachiga ega bo‘ldi.

18 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 10 ga, so‘nggi 24 soatda esa 7 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

  • Tasdiqlash holati: Tasdiqlanmagan
  • Jalb etish (ER): Auditoriya o‘rtacha 8.77% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.56% ini tashkil etuvchi reaksiyalarni to‘playdi.
  • Post qamrovi: Har bir post o‘rtacha 4 404 marta ko‘riladi; birinchi sutkada odatda 3 295 ta ko‘rish yig‘iladi.
  • Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 30 ta reaksiya keladi.
  • Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Yuqori yangilanish chastotasi (oxirgi ma’lumot 19 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 212
Obunachilar
+724 soatlar
+227 kunlar
+1030 kunlar
Postlar arxiv
Базы данных для задач любой сложности Безопасность, масштабируемость и отказоустойчивость баз данных — ключевые требования дл
Базы данных для задач любой сложности Безопасность, масштабируемость и отказоустойчивость баз данных — ключевые требования для любых современных веб-сервисов и приложений. А наличие этих требований по умолчанию, без дополнительной головной боли — мечта для любого бизнеса. Или не мечта, а реальность? Selectel предлагает одни из лучших облачных баз данных на рынке и берет эти на заботы на себя: ● предоставляет высокую производительность за счет оптимальной настройки ПО, подбора мощного железа и локальных NVMe-дисков; ● обеспечивает резервное копирование. Бесплатные бэкапы создаются автоматически, а восстановление данных происходит вплоть до секунды; ● гарантирует отказоустойчивость. Создать отказоустойчивый кластер можно всего от двух нод, что позволяет сэкономить до 33% стоимости ресурсов; ● дает возможности для быстрого масштабирования. При росте нагрузки можно поменять конфигурацию облачного сервера и количество реплик без простоя. ● заботится о безопасности: сервис соответствует российским и международным стандартам — закону 152-ФЗ (УЗ-1), приказу ФСТЭК № 21, PCI DSS, ISO 27001, 27017, 27018 и ГОСТ Р 57580. Развернуть готовые к работе кластеры облачных баз данных в несколько кликов: https://slc.tl/v7gmo Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzqwgdXD6

🔥 Qwen 2.5 - 7B and 14B с длинной контекста 1 миллион токенов Они также выпустили свой собственный форк vllm - чтобы вы могл
🔥 Qwen 2.5 - 7B and 14B с длинной контекста 1 миллион токенов Они также выпустили свой собственный форк vllm - чтобы вы могли развернуть модель у себя дома! 💥 Стоит отметить, что модель 14B-1M выигрывает у гораздо более крупной модели Qwen 2.5 Turbo (предположительно MoE с тем же количеством активных параметров). Более того, она еще и превосходит бета-версия GPT-4/ 4o на длинном контексте! https://huggingface.co/collections/Qwen/qwen25-1m-679325716327ec07860530ba @data_analysis_ml #Qwen

🖥 Audiblez — это инструмент для конвертации электронных книг в аудиокниги! 🌟 Он использует модель текст-в-речь Kokoro для с
🖥 Audiblez — это инструмент для конвертации электронных книг в аудиокниги! 🌟 Он использует модель текст-в-речь Kokoro для создания файлов в формате .m4b из файлов .epub. Программа поддерживает различные языки, голоса и позволяет настроить скорость чтения. Также доступна работа на GPU для ускорения обработки. 🔐 Лицензия: MIT 🖥 Github @data_analysis_ml

🔥 MagicMirror — это приложение для мгновенной замены лиц, причесок и одежды с помощью ИИ! 🌟 Оно работает локально на macOS
🔥 MagicMirror — это приложение для мгновенной замены лиц, причесок и одежды с помощью ИИ! 🌟 Оно работает локально на macOS и Windows, не требует мощного оборудования и обеспечивает полную конфиденциальность, так как обработка изображений выполняется на устройстве. 🔐 Лицензия: MIT 🖥 Github @data_analysis_ml

⭐️ Anton Pidkuiko рассказывает, как он создал ИИ-агента, который занял первое место в Meta HackerCup 2024 (дивизион ИИ). Он демонстрирует использование передовых методов рассуждений LLM, методов RAG и облачной инфраструктуры для решения сложных задач программирования в больших масштабах. Посмотрите запись: https://www.youtube.com/watch?v=cvIeT4MlIx4 @data_analysis_ml #pytorch #ai #expertexchange

⚡️ Повторно дистиллированная Deepseek AiR1 (1,5B) превосходит по своим характеристикам оригинальную дистиллированную модель!
⚡️ Повторно дистиллированная Deepseek AiR1 (1,5B) превосходит по своим характеристикам оригинальную дистиллированную модель! https://huggingface.co/mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-1.5B-v1.0 @data_analysis_ml

🔥 Minima — это open source решение для RAG в контейнерах для развертывания на любых мощностях (клауд или локал), с возможнос
🔥 Minima — это open source решение для RAG в контейнерах для развертывания на любых мощностях (клауд или локал), с возможностью интеграции с ChatGPT и MCP. Minima также может использоваться как RAG на вашей машине. Minima поддерживает три режима работы: 1. Изолированная установка — Работа в контейнерах без внешних зависимостей, таких как ChatGPT или Claude. Все нейронные сети (LLM, ранкер, эмбеддинг) и векторный сторедж запускаются на вашем сервере или ПК, обеспечивая безопасность ваших данных. 2. Кастомный GPT — Запросы к вашим локальным документам через приложение или веб-версию ChatGPT с использованием кастомных GPT. Индексатор работает на вашем сервере или локальном ПК, а основная LLM остаётся ChatGPT. 3. Anthropic Claude — Использование приложения Anthropic Claude для запросов к вашим локальным документам. Индексатор работает на вашем локальном ПК, а основная LLM — это Anthropic Claude. В данный момент, Minima решает задачу RAG on-premises и призывает всех поставить звезду и форкнуть репозиторий, а так же не стесняться и принять участие в разработке. 📌 Лицензия MPL-2.0 ▪ Github @data_analysis_ml

⭐️ Video LLaMA 3 "Мультимодальные базовые модели для понимания изображений и видео" от ДАМО Алибаба ▪ Model: https://huggingf
⭐️ Video LLaMA 3 "Мультимодальные базовые модели для понимания изображений и видео" от ДАМО Алибаба Model: https://huggingface.co/collections/DAMO-NLP-SG/videollama3-678cdda9281a0e32fe79af15Paper: https://huggingface.co/papers/2501.13106 @data_analysis_ml

⭐️ DataDreamer, библиотека Python с открытым исходным кодом, позволяет легко генерировать синтетические данные и интегрируетс
⭐️ DataDreamer, библиотека Python с открытым исходным кодом, позволяет легко генерировать синтетические данные и интегрируется с huggingface 🔍 Узнайте, как это сделать: https://huggingface.co/blog/asoria/datadreamer-datasets#6790671e20a7d3ca6f72b6cb @data_analysis_ml

Только что вышла версия CUDA 12.8 с поддержкой Blackwell. Гайд по работе с TensorCore 5-го поколения: https://docs.nvidia.com
Только что вышла версия CUDA 12.8 с поддержкой Blackwell. Гайд по работе с TensorCore 5-го поколения: https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#tensorcore-5th-generation-instructions #cuda #TensorCore #nvidia

Оптимизируйте бизнес-процессы с помощью данных и стратегического мышления — станьте бизнес-аналитиком за 6 месяцев Бизнес-ана
Оптимизируйте бизнес-процессы с помощью данных и стратегического мышления — станьте бизнес-аналитиком за 6 месяцев Бизнес-аналитик собирает и интерпретирует данные, чтобы помогать бизнесу принимать обоснованные решения и создавать эффективные стратегии развития. В его задачи входит сбор и анализ требований, аудит бизнес-процессов, проведение исследований, выявление проблем и поиск их решений, подготовка отчётности. На курсе Нетологии «Бизнес-аналитик» вы можете освоить необходимые навыки всего за 6 месяцев и претендовать на junior-позицию уже во время обучения. Под руководством ментора вы научитесь работать с нотациями IDEF0, BPMN 2.0, EPC, а также с инструментами анализа данных: SQL, Python, Tableau и Power BI. Получите опыт работы с заказчиками и разберёте тестовые задания из реальных вакансий с преподавателем курса. Дополнительно вы можете освоить навыки кандитата на middle-позицию на расширенной траектории программы — пройти модуль по системному анализу. Он охватывает полный жизненный цикл ПО, включая гибкие подходы к разработке, UX/UI прототипирование, тестирование и развертывание, а также документирование IT-проектов. 🔥 До 31 января на курс действует дополнительная скидка 15% по промокоду ANALYTIC15. Реклама. ООО "Нетология". ИНН 7726464125 Erid 2VSb5yG4Lkp

🔥 OpenVINO Toolkit — это мощный инструмент с открытым исходным кодом для оптимизации и выполнения моделей машинного обучения
🔥 OpenVINO Toolkit — это мощный инструмент с открытым исходным кодом для оптимизации и выполнения моделей машинного обучения! 🌟 OpenVINO позволяет преобразовывать модели из популярных фреймворков, таких как TensorFlow, PyTorch и ONNX, в формат, оптимизированный для работы на аппаратуре Intel. Он поддерживает широкий спектр устройств, включая процессоры, GPU, FPGA и специализированные чипы, что делает его идеальным выбором для разработки производительных AI-приложений. 🔐 Лицензия: Apache-2.0 🖥 Github @data_analysis_ml

Текст: 🚀 Вам от 13 до 20 лет, вы уже знаете основы Python и хотите двигаться дальше, в область современной аналитики? Тогда
+1
Текст: 🚀 Вам от 13 до 20 лет, вы уже знаете основы Python и хотите двигаться дальше, в область современной аналитики? Тогда у вас есть крутой шанс прокачать свои навыки на бесплатной программе по анализу данных от Яндекс Лицея! 📊 Специализация длится 3 месяца и проходит онлайн. Вас будут учить опытные профессионалы с реальным практическим опытом. Они расскажут, как анализировать и визуализировать данные с помощью Python, а также принимать решения на основе полученной информации. Набор открыт также на онлайн-программы по веб-разработке на Go и Django, машинному обучению и большим данным. Не откладывайте на следующий год — подайте заявку до 29 января! 💻

Repost from Machinelearning
+2
🌟 SmolVLM: набор компактных VLM от HuggingFace - Base, Synthetic и Instruct. SmolVLM - серия компактных VLM отличающихся высокой эффективностью использования памяти и могут быть развернуты на локальных устройствах с ограниченными ресурсами. Только что были выпущены SmolVLM (256M и 500M), которым требуются GPU <1GB для запуска. 🤗 SmolVLM-256M – это cамая маленькая VLM в мире! Модели настолько маленькт, что могут работать 100% локально в вашем браузере на WebGPU! 📌Лицензирование:  Apache 2.0 ⭐️ Smolervlm: https://huggingface.co/blog/smolervlm 🤗 Модели: https://huggingface.co/collections/HuggingFaceTB/smolvlm-256m-and-500m-6791fafc5bb0ab8acc960fb0 @ai_machinelearning_big_data #AI #ML #SmallVLM #Huggingface

📖 Эта статья исследует методы оценки неопределенности больших языковых моделей в "черном ящике"! 💡 Авторы предлагают подход
📖 Эта статья исследует методы оценки неопределенности больших языковых моделей в "черном ящике"! 💡 Авторы предлагают подход под названием DiverseAgentEntropy, который измеряет надежность модели, анализируя ее ответы на различные переформулированные версии одного и того же запроса. Если модель уверена в своих знаниях, она должна отвечать одинаково независимо от формулировки вопроса. Этот метод позволяет также обнаруживать случаи галлюцинаций, когда модель предоставляет недостоверные ответы. 🌟 В основе подхода лежит идея многократного взаимодействия "агентов" (вариаций одной и той же модели), которые обрабатывают один и тот же запрос с разным контекстом. Итоговая оценка основана на согласованности их ответов. В результате метод показывает более точные оценки неопределенности по сравнению с традиционными методами, такими как самосогласованность. Исследование также подчеркивает проблему неспособности моделей систематически извлекать правильные ответы, даже если они уже заложены в параметрические знания модели. @data_analysis_ml

⚡️ Bespoke-Stratos-32B, новая ризонинг модель, разработанную на основе DeepSeek-R1 с использованием Sky-T1 от Berkeley NovaSk
⚡️ Bespoke-Stratos-32B, новая ризонинг модель, разработанную на основе DeepSeek-R1 с использованием Sky-T1 от Berkeley NovaSky. Модель превосходит Sky-T1 и o1-preview в тестах reasoning (математика и написаний кода) и почти достигает производительности DeepSeek-R1-Distill-Qwen-32B при обучении, котором было использовано 47 раз меньшее количество примеров! Важно отметить то, что разработчики используют набор данных с открытым исходным кодом. ▪Data: https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-17kCurator: https://github.com/bespokelabsai/curator/32B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-32B7B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-7BСode: https://github.com/bespokelabsai/curator/tree/main/examples/bespoke-stratos-data-generation @data_analysis_ml

🔥 Обобщение и переобучение в машинном обучении. - Видео - Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 / - Урок6/ Урок7/ Урок 8 - Colab -Полный курс #ml #math #mlmath #probability #машинноеобучение

⚡️ Creating new games with interactive generative videos that learns from a small-scale dataset of Minecraft data.Project page: https://vvictoryuki.github.io/gamefactory/Paper: https://arxiv.org/abs/2501.08325Dataset: https://huggingface.co/datasets/KwaiVGI/GameFactory-Dataset @data_analysis_ml

🔥 Agent Recipes — мастерская с огромным количеством примеров кода, который вы можете скопировать и использовать в своих собс
🔥 Agent Recipes — мастерская с огромным количеством примеров кода, который вы можете скопировать и использовать в своих собственных проектах ИИ! 🔗 Ссылка: *клик* @data_analysis_ml

Repost from Machinelearning
🌟 Google только что выпустили новую модель Gemini 2.0 Flash Thinking ✅ Контекст с 1 миллионом токенов (5-х больше, чем o1 Pr
🌟 Google только что выпустили новую модель Gemini 2.0 Flash Thinking ✅ Контекст с 1 миллионом токенов (5-х больше, чем o1 Pro) #1 на арене чат-ботов 👑 Модель показала наивысший результат, обогнав Gemini-Exp-1206 + 17 очков прироста по сравнению с предыдущей контрольной точкой 1219 - №1 по всем направлениям (генерации кода), за исключением управления стилем. • AIME: 73.3% • GPQA: 74.2% • MMMU: 75.4% Модель доступна в ai-gradio pip install --upgrade "ai-gradio[gemini]" Они так же выпустили Gemini2.0 Pro. https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-thinking-exp-01-21 #google #gemini