Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya12 492 Texnologiyalar & Aralashmalar2 653...

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 251 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 653-o'rinni va Rossiya mintaqasida 12 492-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 251 obunachiga ega bo‘ldi.

24 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 38 ga, so‘nggi 24 soatda esa -6 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 9.10% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.25% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 4 571 marta ko‘riladi; birinchi sutkada odatda 3 142 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 29 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 25 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 251

Obunachilar

-624 soatlar

+447 kunlar

+3830 kunlar

4 571

Post ko'rishlar

~ 3 14224 soatlar

~ 3 63148 soatlar

9.10%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Postlar arxiv

50 250

⚡️ Python совет При объединении двух датафреймов Pandas с одинаковыми именами столбцов по умолчанию к именам столбцов добавляются суффиксы

"_x" и "_y".

Чтобы улучшить читаемость кода, вы можете указать собственные суффиксы. #Python @data_analysis_ml

50 250

Улучшение нейросетей, рекомендаций и медицинская диагностика — только часть решений, где могут пригодиться ML-исследования. Авторов самых перспективных из них отметил Яндекс на Yandex ML Prize. Yandex ML Prize — международная премия, которая уже пятый год поддерживает учёных-новичков и мотивирует их заниматься наукой. Участники изучают подходы и алгоритмы, которые позже могут лечь в основу разных технологий и продуктов. Например, поисковых сервисов или компьютерной графики. А ещё способны улучшить медицину: помогать изучать клетки живых организмов или находить редкие болезни на ранних этапах. В этом году 11 лауреатов получили от Яндекса премии от 500 тысяч до 1 миллиона рублей, грант на использование платформы Yandex Cloud для экспериментов и больших вычислений и другие призы. @data_analysis_ml

50 250

Аналитики, отзовитесь! 👋 Прямо сейчас в Авито требуются опытные специалисты, которые хотят работать с сильной командой амбициозных коллег с высокой профессиональной экспертизой: ➡️ Старший BI аналитик ➡️ Старший аналитик данных в команду прайсинга ➡️ Аналитик данных в направление инцидент и проблем менеджмент Конкурентная заработная плата (обсуждается на собеседовании). Что касается бенефитов: – прозрачная система премий; – классный офис в 2-х минутах от метро «Белорусская»; – забота о здоровье: ДМС со стоматологией с первого дня, в офисе ведут приём терапевт, психолог и массажист, два зала с тренажёрами, занятия йогой и скидки на абонементы; – самые передовые IT-инструменты для эффективного выполнения задач; – личный бюджет на обучение, который можно тратить на книги, курсы и конференции; – масштабные корпоративы, онлайн-вечеринки, командные тимбилдинги. Скорее откликайтесь на вакансии и присоединяйтесь к крутой аналитической культуре 💪

50 250

🎉 Лучшие Open Source проекты 2023 года. Выбрана вторая группа победителей программы Google Open Source Peer Bonus Program 2023 года 138 победителей были выбраны за влияние их вклада в проект с открытым исходным кодом, качество их работы и преданность открытому исходному коду. 👉 https://opensource.googleblog.com/2023/12/google-open-source-peer-bonus-program-announces-second-group-of-2023-winners.html @data_analysis_ml

50 250

Специалисты по Data Science работают везде, где нужно обрабатывать и хранить данные. Они решают самые разные задачи: от планирования маршрутов в логистике до прогнозирования спроса на наличные в банкомате. Плюсы профессии «Специалист по Data Science»: — вы сможете работать почти в любой отрасли, от промышленности и до коммерции; — решения специалистов по DS напрямую влияют на планирование и деятельность компаний; — никакой рутины — чем сильнее и опытнее специалист, тем сложнее и интереснее его задачи; — высокая заработная плата: младшие специалисты получают в среднем 60 000 рублей, специалисты с опытом — 120 000 рублей, а старшие специалисты — от 210 000 рублей. За 8 месяцев обучения в Практикуме вы освоите востребованную профессию, а дальше — начнёте работать, улучшать навыки и расти в зарплате. Начните курс бесплатно и большими данными двигайтесь в сферу IT. → Начать курс бесплатно

50 250

📈 PromptBench: A Unified Library for Evaluating and Understanding Large Language Models. PromptBench - это основанный на Pytorch пакет Python для оценки больших языковых моделей (LLM). Он предоставляет удобные API для исследователей, чтобы проводить оценку LLM. 🖥 Code: https://github.com/microsoft/promptbench 🌟 Docs: https://promptbench.readthedocs.io/en/latest/ 📚 Paper: https://arxiv.org/abs/2312.07910v1 ⚡️ Dataset: https://paperswithcode.com/dataset/mmlu @data_analysis_ml

50 250

Как обработать большое количество данных в несколько десятков петабайт? Как проанализировать и выявить полезные инструменты? Дмитрий, руководитель направления аналитики в команде mail.ru в VK в статье рассказывает о своём подходе к работе с большим количеством данных. В статье вы ознакомитесь с self-сервисом Metida и какие две крупные задачи решает данный сервис; - станет более понятен интерфейс Metida и из чего он состоит; - как данные из реестра попадают в колоночную базу данных; Об этом и других тонкостях работы с данными вы узнаете здесь. @data_analysis_ml

50 250

📈 SlimSAM: 0.1% Data Makes Segment Anything Slim Внушительный размер модели и высокие вычислительные требования модели Segment Anything Model (SAM) сделали ее громоздкой для развертывания на устройствах с ограниченными ресурсами. Существующие подходы к сжатию SAM обычно предполагают обучение новой сети с нуля, что ставит перед разработчиками сложную задачу компромисса между степенью сжатия и производительностью модели. Для решения этой проблемы представлен SlimSAM - новый метод сжатия SAM, который обеспечивает превосходную производительность при значительно меньших затратах на обучение. Это достигается за счет эффективного повторного использования предварительно обученных моделей с помощью единой системы обрезки и дистилляции. В отличие от предыдущих методов обрезки, мы тщательно обрезаем и дистиллируем разрозненные структуры моделей поочередно. SlimSAM обеспечивает значительный прирост производительности и требует в 10 раз меньше затрат на обучение, чем другие существующие методы. Даже по сравнению с оригинальным SAM-H, SlimSAM достигает приближающейся производительности при сокращении количества параметров всего до 0,9% (5,7M), MAC до 0,8% (21G) и требуя всего 0,1% (10k) обучающих данных SAM. 🖥 Code: https://github.com/czg1225/SlimSAM 🌟 Colab: http://modelslab.com 📚 Paper: https://arxiv.org/abs/2312.05284 ⚡️ Dataset: https://tianxingwu.github.io/pages/FreeInit/ @ai_machinelearning_big_data

50 250

Скажите что-то на карьерном Тинькофф в поиске крутых ИТ-спецов. С компании — профессиональный рост, интересные финтех-задачи, решение бытовых забот и работа там, где вы живете. С вас — выбрать вакансию и откликнуться тут АО «Тинькофф Банк», ИНН 7710140679

50 250

🔥 Новый беспланый курс по Reinforcement Learning from Human Feedback! RLHF - это одна из ключевых техник, которая привела к появлению современных LLM. В этом курсе, который ведет Никита Намджоши, разработчик из GenAI в Google cloud, вы узнаете, как работает RLHF, в том числе как применить его для настройки LLM в собственных приложениях. Вы также воспользуетесь библиотекой с открытым исходным кодом для настройки базового LLM и оцените настроенную модель, сравнив ее ответы до и после RLHF-настройки. deeplearning.ai/short-courses/reinforcement-learning-from-human-feedback/ @data_analysis_ml

50 250

Всегда мечтал быть айтишником? Освой новую профессию промт-инженера! Гарантия трудоустройства и низкая конкуренция! Приходи на бесплатный вебинар и узнай как: - Повысить свой доход на рабочем месте, создавая нейро-сотрудников - Получить новую специальность и увеличить доход на 30-40% - Создавать нейронки и продавать на заказ от 1 млн за проект - Зарабатывать на фрилансе от 300 000 рублей - Найти хобби, которое прокачает твой мозг и сделает жизнь ярче Обо всем ты узнаешь на бесплатном вебинаре от AI University. Вот ссылка, жми СЮДА Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8KGQNL

50 250

💡 Сейчас происходит слишком много событий, так что вот просто сымые интересные проекты за последние дни со ссылоками ▪GPT-4 + Medprompt -> SOTA MMLU https://microsoft.com/en-us/research/blog/steering-at-the-frontier-extending-the-power-of-prompting/ ▪Mixtral 8x7B @ MLX https://github.com/ml-explore/mlx-examples/tree/main/mixtral ▪За пределами человеческих данных: Масштабирование самообучения для решения проблем с помощью языковых моделей https://arxiv.org/abs/2312.06585 ▪Phi-2 (2.7B), самая маленькая и самая впечатляющая модель https://microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/ ▪LLM360: На пути к полностью прозрачным LLM с открытым исходным кодом https://arxiv.org/abs/2312.06550 @data_analysis_ml

50 250

🖥 Одна из самых глубоких статей объяняющих LLM. Автор, показывает что понимание и сжатие данных для llm- это две стороны одной медали.🪙 И что интересно, когда мы имеем дело с предсказанием слов, cжатие данных с потерями, выглядит умнее, чем сжатие без потерь! 💡 Ниже приводится объяснение того, почему ChatGPT дает нам иллюзию понимания: "Тот факт, что ChatGPT перефразирует материал из Сети, а не цитирует его слово в слово... создает иллюзию, что ChatGPT понимает материал". У людей заучивание не является показателем подлинного обучения, поэтому неспособность ChatGPT выдавать точные цитаты сайтов, как раз и заставляет нас думать, что он чему-то научился. Когда мы имеем дело с последовательностями слов, сжатие с потерями выглядит умнее, чем сжатие без потерь". Полный текст статьи читайте здесь: https://newyorker.com/tech/annals-of-technology/chatgpt-is-a-blurry-jpeg-of-the-web @data_analysis_ml

50 250

Новогодние подарки от karpovꓸcourses для тех, кто хочет сильно прокачать свою карьеру Только в декабре можно выгодно приобрести комбо «курс + один из двух симуляторов на выбор»: ▪️Курс Аналитик данных научит всем необходимым инструментам, позволит начать карьеру или внедрить все актуальные навыки аналитика в свои проекты. ▪️Симуляторы дадут более глубокое погружение и еще больше опыта решения задач: 1. В Симуляторе аналитика вы получите практику на реальных задачах в формате настоящей рабочей стажировки 2. В Симуляторе А/В-тестов еще глубже освоите А/В-тесты и станете в них настоящим экспертом Записаться можно до конца декабря [Забронировать скидку]

50 250

🔥 100 слайдов о внутреннем устройстве PyTorch 2 с упором на последние нововведения (Dynamo, Inductor и ExecuTorch). 📚 PDF: https://drive.google.com/file/d/1XBox0G3FI-71efQQjmqGh0-VkCd-AHPL/view?usp=drive_link 💻 Slideshare: https://slideshare.net/perone/pytorch-2-internals @data_analysis_ml

50 250

Внимание всем продуктовым аналитикам! 12 декабря Авито проведет онлайн-митап, на котором можно узнать о продуктовых кейсах, которые принесли компаниям реальный результат: ▫️ Эксперт компании Анна Москаленко расскажет, как ее команда работает над пользовательским негативом от CRM-коммуникаций. ▫️ Продуктовый аналитик Samokat.tech Илья Лоладзе объяснит, как его компания провела эксперимент, который позволил увеличить зону экспресс-доставки. ▫️ Леонид Медников, ведущий аналитик Яндекс Карт, поделится, как строить метрики качества данных на основе информации о миллионах компаний. Только реальные кейсы, никакой воды. Начало в 18:00, а регистрация — по ссылке. Реклама.ООО "КЕХ ЕКОММЕРЦ" ИНН 7710668349 erid: 2SDnjdRGxXa

50 250

⚡️ Если вы ищете открыте датасетов для работы - вот 7 бесплатных источников данных, где вы можете найти данные для любых задач. 1. Репозиторий Awesome Data Github В этом репозитории вы найдете ссылки на открыте наборы данных, которые содержат изображения, текст, аудио и табличные данные. https://github.com/awesomedata/awesome-public-datasets 2. Kaggle Более 1000 датасетов, которые можно легко скачать и работать с ними, совершенно бесплатно. https://www.kaggle.com/datasets 3. Открытый реестр данных на AWS Поиск и обмен датасетами х с помощью ресурсов AWS. 4. Open ML Более 20K+ наборов данных на Open ML https://openml.org 5. Papers with Code Papers with Code содержит более 7000 открытыз наборов данных по всем возможным тематикам. https://paperswithcode.com/datasets 6. Hugging Face На Hugging Face вы можете найти 80K+ наборов данных. https://huggingface.co/datasets 7. Dagshub Много бесплатных даатсетов можно найти на Dagshub: https://dagshub.com/datasets/ @data_analysis_ml

50 250

Оффер за выходной в Big Data.МегаФон для Data-специалистов! Зарплата от 250 до 450 тысяч рублей в зависимости от грейда, уютный офис или полная удаленка на территории РФ, а также ДМС со стоматологией и страховкой. На этом бонусы не заканчиваются: оплата связи, компенсация фитнеса, обучение за счет компании и многое другое. Вам предстоит работать с масштабными проектами: — разрабатывать аналитические сервисы на базе AI; — анализировать бизнес-процессы и внедрять языковые модели для облегчения рутины в LLM; — тестировать продуктовые и ML-гипотезы. Мегафон — оператор №1 по покрытию сети и скорости мобильного интернета. Оставляйте заявку и меняйте рынок телекома: https://u.to/C24sIA

50 250

🎞️Reenact Any Character in Movie🎞️ SMPLer-X первая открытая модель для монокулярного 4D захвата движения. Объеденив MPLerX и Propainter можно создать свой ЛА-ЛА Ленд! 🖥 (SMPLer-X): https://github.com/caizhongang/SMPLer-X 🖥 Код (Propainter): https://github.com/sczhou/ProPainter 🏆 Website: http://caizhongang.com/projects/SMPLer-X/ 🥩 Demo: http://caizhongang.com/projects/SMPLer-X/ #NeurIPS2023 @data_analysis_ml

50 250

⚡️X-MAS HACK 2023 Примите участие в уникальном новогоднем мероприятии, которое охватит популярные направления для разработки инновационных решений: Финтех, Информационная безопасность, Искусственный интеллект, Data Science, Legal Tech, Электронная коммерция. 🔷 Хакатон — это шанс проявить себя перед топ-менеджерами. Добавь успешный кейс в свое портфолио. Отправляй отклик на вакансии от партнеров и получи оффер в крутую компанию. 🔷 Идеатон - это секция, в которой ты можешь предложить свою идею, проработанную по определенным критериям, обсудить ее с экспертом и побороться за денежный приз. 🏆 Призовой фонд: 1 000 000 рублей и подарки самым активным участникам! 📆 Дата проведения: 22 - 24 декабря 📍 Формат: онлайн + офлайн в г. Москва Подробная информация и регистрация: https://tglink.io/a9fabbd340da?erid=LjN8K1PUs Реклама. ООО "АКСЕЛЕРАТОР ВОЗМОЖНОСТЕЙ". ИНН 9704005146.