Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya12 512 Texnologiyalar & Aralashmalar2 668...

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 254 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 668-o'rinni va Rossiya mintaqasida 12 512-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 254 obunachiga ega bo‘ldi.

21 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 39 ga, so‘nggi 24 soatda esa -7 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 8.79% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.66% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 4 415 marta ko‘riladi; birinchi sutkada odatda 3 346 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 31 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 22 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 254

Obunachilar

-724 soatlar

+977 kunlar

+3930 kunlar

4 415

Post ko'rishlar

~ 3 34624 soatlar

~ 4 33548 soatlar

8.79%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Postlar arxiv

50 256

50 256

Эффективный способ быстрого освоения ChatGPT. Создание правильных промптов и обучение нейронной сети - это долгий процесс, требующий значительных временных затрат. Здесь разработан краткий курс из 5 уроков по ChatGPT. После его прохождения вы сможете создать 9 нейронных сетей, которые помогут вам: ▪️ найти ошибки и оптимизировать код ▪️ генерировать посты в Телеграме ▪️ создавать заголовки для рекламы * отдать всю рутину на выполнение нейронке Вы также сможете разработать своих нейро-помощников для продаж, маркетинга и других целей. Бесплатный доступ доступен сразу после регистрации. Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8KYXR3

50 256

⚡️ Snowflake только что запустила самую крупную модель с открытым исходным кодом на сегодняшний день. 482 млрд параметр MoE. 17 млрд. активных параметров и 128 экспертов, обученных на 3,5 Т токенов. Даже описание данных с открытым исходным кодом! pip install git+https://github.com/Snowflake-Labs/transformers.git@arctic https://huggingface.co/Snowflake/snowflake-arctic-instruct

50 256

⚡️ Quix Streams - это облачная нативная библиотека для обработки данных в Kafka с использованием Python. Инструмент разработан, чтобы предоставить возможности распределенной системы в виде легкой библиотеки, сочетая низкоуровневую масштабируемость и отказоустойчивость функций Kafka с простым в использовании интерфейсом Python. Отлично подходит для новичков, которые хотят познакомиться с потоковой обработкой. python -m pip install quixstreams • Github • Docs @data_analysis_ml

50 256

Пробный ЕГЭ по информатике: бесплатно! Центральный университет приглашает 11-классиков, которые хотят: – потренироваться в написании ЕГЭ и проверить свой уровень знаний в баллах ЕГЭ – повысить свои шансы на успех – разобрать ошибки и понять, как не потерять баллы на экзамене – подготовиться морально к экзамену, снизив стресс 📅 Когда: 28 апреля, 10:00 МСК 📍 Где: Центральный университет, Москва, ул. Гашека, 7 или онлайн на платформе edu.tinkoff.ru 📚 Что: ты получишь: диагностику знаний, опыт сдачи ЕГЭ, экспертные комментарии, разбор ошибок Регистрируйся до 25 апреля 23:59 erid:2VtzqwXpLcQ Реклама, АНО ВО «Центральный университет», ИНН 7743418023

50 256

🖥 Обнаружение статистических выбросов в Python Выбросы — значения или наблюдения, отклоняющиеся от других данных. Всегда нужно сравнивать наблюдение с другими значениями, полученными тем же способом, прежде чем называть их выбросами. Имеет смысл формально выделять два класса выбросов: экстремальные значения и ошибки. Экстремальные значения интереснее, потому что они возможны, но маловероятны. В этой статье — несколько подходов к обнаружению выбросов в Python; от простых методов, таких как описательная статистика (включая минимальные, максимальные значения, гистограмму, прямоугольную диаграмму и процентили), до более формальных методов, таких как фильтр Хэмпеля, тесты Граббса, Диксона и Рознера. 📎 Поехали 📎 Кстати, по анализу выбросов в R #junior @data_analysis_ml

50 256

Tarantool Column Store — это новая российская in-memory колоночная СУБД для гибридной транзакционно-аналитической обработки данных (HTAP) в реальном времени. Позволяет анализировать данные в real-time, ускорять аналитические расчеты. Обладает высокой производительностью благодаря многопоточности. Где можно применять новую СУБД: • Формирование финансовой отчетности в real-time; • Ускорение и повышение точности антифрод-систем — обнаружение подозрительных транзакций практически с нулевой задержкой; • Повышение производительности системы выдачи кредитов. Tarantool Columnstore в реальном времени анализирует матрицы, в которых содержится более 100 000 вариантов кредитных предложений и дополнительных услуг. Попробуйте высокую производительность и скорость — 1,6 млн. сканирований и 200 тыс. агрегаций в секунду на ядро, <200 микросекунд на запрос. ➡️ Оставить заявку

50 256

🔥 С Transformers.js, теперь вы можете запускать CLIP в своем браузере со скоростью более 20 кадров в секунду с использованием WebGPU для классификации изображений в режиме реального времени! Как всегда, все работает на 100% локально, что означает, что вам не нужноAPI! 🔥 🔗 Демо: https://hf.co/spaces/Xenova/webgpu-clip @data_analysis_ml

50 256

Repost from Machinelearning

🍏 OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework by Apple Сегодня Apple выпустили Openly. - Новое семейство LM с открытым исходным кодом для обучения моделей и логического вывода - Работает наравне с OLMo, но требует в 2 раза меньше токенов для обучения - Модели для различных задач, включая базовые модели (например, CLIP и LLM), классификацию объектов, обнаружение объектов и семантическую сегментацию. Cписок моделей и подробная информации о каждой из них: - OpenELM-270M - OpenELM-450M - OpenELM-1_1B - OpenELM-3B - OpenELM-270M-Instruct - OpenELM-450M-Instruct - OpenELM-1_1B-Instruct - OpenELM-3B-Instruct • gitHub: https://github.com/apple/corenet • hf: https://huggingface.co/apple/OpenELM • abs: https://arxiv.org/abs/2404.14619 @ai_machinelearning_big_data

50 256

❓Как писать User Story на минималках по канонам и что у них под капотом? В каких кейсах польза от историй будет максимальная? Расскажем на бесплатном практическом уроке «User Story по шаблону и даже лучше» от OTUS. На вебинаре разберем: - User Story и беклог продукта; - расширение историй: сценарии использования и критерии приемки; - в каких командах и проектах они работают. Урок идеально подойдет тем, кто планирует стать системным аналитиком и оценивает курсы, а также начинающим аналитикам. Встречаемся 26 апреля в 20:00 мск в рамках курса «Специализация Системный аналитик». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджеров OTUS! Регистрируйтесь прямо сейчас, чтобы не пропустить бесплатный урок и получить запись: https://otus.pw/b0ky/ Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8Jz6Nt

50 256

⭐ IDM-VON - модель, которая превосходит другие подходы, основанные на диффузии и GAN, для переноса любых деталей одежды на фотографии, Только посмотрите на примеры выше) • Github: https://github.com/yisol/IDM-VTON • Demo: https://huggingface.co/spaces/yisol/IDM-VTON • Paper: https://arxiv.org/abs/2403.05139 • Project: https://idm-vton.github.io/ @data_analysis_ml

50 256

Ozon Tech приглашает на ML&DS митап 📍26 апреля | 19:00 мск | онлайн Ребята научили машины полезному и докладывают, как они справляются. Какие темы в программе: 1. Как команда адаптировала LLM под задачи Ozon — от разметки до генерации изображений. 2. Развитие генеративного ИИ, продуктовые разработки в генеративном дизайне и языковых моделях. 3. Кейс Ozon Tech: создание медиаконтента в карточке товара за 5 минут при помощи StableDiffusion, ControlNet и адаптеров. Зарегистрируйтесь, чтобы присоединиться к трансляции. Реклама. Рекламодатель ООО «Озон Технологии». erid: LjN8KBPSq

50 256

☁️ Stable Diffusion запуск в облаке. ▪ Видео @data_analysis_ml

50 256

📌L1 и L2 регуляризация в ML Регуляризация - подход, который позволяет снизить сложность модели за счет "штрафования" вектора параметров θ. Это один из эфективных методов борьбы с "переобучением", наряду с кросс-валидацией и уменьшением количества фичей, о которых мы поговорим позже. Регуляризация дает возможность выделить фичи,которые вносят наибольший вклад в принятия решения, и снизить влияние фич создающих "шум". Существует два вида регуляризации - L1 и L2, выбор вида регуляризации отвечает на вопрос "как штрафовать". Рассмотрим различия между ними. 📎 О L1 и L2 📎 Ещё статья (en) @data_analysis_ml

50 256

GitVerse – теперь и для малого и среднего бизнеса На онлайн-презентации «GitVerse: открой вселенную кода» СберТех рассказал про новые фичи платформы. Cреди них – CI/CD-инструменты, ускоряющие разработку, и новые функции GigaCode – персонального AI-ассистента разработчика (AI, artificial intelligence — искусственный интеллект). Но это еще не все: теперь возможности GitVerse доступны не только индивидуальным разработчикам, но и малому и среднему бизнесу. Это очень удобно: можно организовывать совместную работу команды с GitVerse и управлять доступами к своим репозиториям. Готовы попробовать? Присоединяйтесь .

50 256

🌟 С большой долей вероятности GPT-5 появится уже этим летом и будет значительно лучше прошлых моделей 🟡GPT-5, следующая LLM от OpenAI, находится в процессе разработки и должна быть запущена в течение нескольких месяцев, как сообщают независимые источники. 🟡GPT-5, скорее всего, будет ориентирован на корпоративных клиентов OpenAI, которые обеспечивают большую часть доходов компании. Потенциально, с запуском новой модели компания может создать систему уровней, подобную уровню Google Gemini LLM, с различными версиями моделей для разных целей и клиентов. В настоящее время модели GPT-4 и GPT-4 Turbo известны тем, что на них работает платный потребительский продукт ChatGPT Plus, а на модели GPT-3.5 – оригинальный и все еще бесплатный чатбот ChatGPT. 📎 Подробнее @data_analysis_ml

50 256

erid: 2RanynkawgU CodeFest — это ежегодная тёплая ламповая айтишная конференция, на которую слетаются русскоговорящие айтишники с разных уголков страны, чтобы встретиться с коллегами, поделиться новостями и обсудить последние тенденции в мире разработки. Ключевые направления программы: Backend, Frontend, Management, QA, Data Science, Mobile, Design, Web 3, System Аnalysis, а также дискуссионный народный поток Kvartirniki и вдохновляющие Keynote выступления от айти-звёзд. Изюминка CodeFest — неформальное общение, которого много, которое невероятно дружелюбное, и зачином для которого служат те самые выступления в ключевых секциях. Начали с доклада в зале — закончили спонтанным митапом в холле. Присоединяйтесь к невероятной атмосфере конференции: ■ 25-26 мая, Новосибирск, Экспоцентр. ■ 1800 участников на одной площадке. ■ Участие офлайн и онлайн. ■ Более 120 докладов. ■ Насыщенная программа от партнёров конференции. Приезжайте командой, участвуйте лично. Регистрация 👉 https://l.codefest.ru/data_analysis_ml Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

50 256

⚡️ Phi-3 7B только что был выпущен и уверенно превосходит Llama-3 7B. С MLU 75,3 модель приближается к 70-B моделям SOTA!! 🤯 Я не удивлюсь, если к концу года у нас появится модель 7B, которая превзойдет GPT-4. https://arxiv.org/pdf/2404.14219.pdf @data_analysis_ml

50 256

📌Генерация и отбор признаков в ML Невероятно полезный и практический notebook на тему генерации и отбора признаков. Здесь обсуждается очень много полезных вещей, освежить которые перед собеседованием не будет лишним Вот некоторые из обсуждаемых тем: 🟡Типы признаков: вещественные, категориальные 🟡Преобразования категориальных признаков: label encoding, one-hot encoding, count encoding, кодирование по вещественному признаку, Target encoding, embedding, кодирование циклических категориальных признаков 🟡Преобразования вещественных признаков: бинаризация, округление, binning 🟡Отбор признаков: полный перебор, одномерный отбор признаков 📎 Notebook @data_analysis_ml

50 256

27 и 28 апреля приглашаем специалистов робототехники и reinforcement learning на ROS Meetup в Москве 📅 Это возможность для робототехников всех уровней: от новичков до экспертов, — посвятить выходные практическому обучению и нетворкингу. Вы получите советы и рекомендации экспертов, сможете поделиться идеями с другими разработчиками. Доклады охватывают весь спектр тем: от ROS до reinforcement learning и антропоморфных роботов. Инженеры и руководители компаний поделятся реальным опытом использования ROS в исследовательских и коммерческих проектах. В этот раз мы решили разбавить технические доклады большим количеством тематических дискуссий и нетворкинга. На какие темы будем общаться: ✔️Антропоморфные роботы ✔️ Reinforcement learning ✔️ Large Language Models, Deep learning ✔️ Беспилотные автомобили и мобильные роботы ✔️ Манипуляторы и алгоритмы в манипуляции, в том числе MOVEit ✔️ ROS-пакеты и другие темы в робототехнике Локация: г. Москва, Кутузовский проспект 32к1, офис Сбера. Регистрируйтесь по ссылке 👈