uz
Feedback
Анализ данных (Data analysis)

Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 250 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 662-o'rinni va Rossiya mintaqasida 12 489-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 250 obunachiga ega bo‘ldi.

23 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 44 ga, so‘nggi 24 soatda esa -1 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

  • Tasdiqlash holati: Tasdiqlanmagan
  • Jalb etish (ER): Auditoriya o‘rtacha 9.18% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.54% ini tashkil etuvchi reaksiyalarni to‘playdi.
  • Post qamrovi: Har bir post o‘rtacha 4 612 marta ko‘riladi; birinchi sutkada odatda 3 286 ta ko‘rish yig‘iladi.
  • Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 31 ta reaksiya keladi.
  • Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Yuqori yangilanish chastotasi (oxirgi ma’lumot 24 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 250
Obunachilar
-124 soatlar
+587 kunlar
+4430 kunlar
Postlar arxiv
⚡️ Awesome-polars Большой полезный кураторский список примеров с кодом, инструментов, бенчмарков и статей о Polars. ▪Github ▪
⚡️ Awesome-polars Большой полезный кураторский список примеров с кодом, инструментов, бенчмарков и статей о Polars. GithubDocs @data_analysis_ml

Центральный университет проводит день открытых дверей Академии Data Science! С лекциями выступят эксперты из ИТ-индустрии и п
Центральный университет проводит день открытых дверей Академии Data Science! С лекциями выступят эксперты из ИТ-индустрии и профессоры Центрального университета, чтобы рассказать о карьере в Data Science и перспективах работы: — Константин Маркелов, вице-президент Тинькофф — «Об университете и вызовах современного образования»; — Иван Стельмах, CPO Центрального университета — «Зачем аналитикам и продактам искусственный интеллект»; — Ярослав Гаврилов, руководитель отдела бизнес-анализа в МТС — «Как живут бизнес-аналитики в МТС»; — Александр Дьяконов, академический руководитель программы — «Современные специальности и направления исследований: анализ данных, искусственный интеллект и большие данные — что выбрать и как стать лучшим?». День открытых дверей пройдет 6 февраля в новом офисе Тинькофф, но можно подключиться онлайн. Актуально для студентов 3-4 курсов бакалавриата, выпускников, а также всех, кому интересно обучение и карьера в ИТ! Регистрируйтесь здесь. erid:2VtzqvQicto Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

🖥 Совет Pandas! Используйте параметр parse_dates для указания столбцов с датами при создании даатфрейма из CSV, вместо pd.to
🖥 Совет Pandas! Используйте параметр parse_dates для указания столбцов с датами при создании даатфрейма из CSV, вместо pd.to_datetime. Это делает код более кратким и удобным для чтения. @data_analysis_ml

GigaChat обгоняет ChatGPT по всем характеристикам — к таким результатам пришли разработчики отечественной нейросетевой модели. В последнем исследовании разрабы решили сравнить модели от Сбера и OpenAI, результаты можно посмотреть здесь. Не зря на сегодняшний день нейросетью от Сбера пользуется более 2,5 млн человек.Теперь ждем, когда Яндекс проведет такое же исследование. @data_analysis_ml

⚡️ SUPIR - новая высокоточная модель восстановления изображений! ▪Код: https://github.com/Fanghua-Yu/SUPIRПроект: http://supir.xpixel.groupСтатья: https://arxiv.org/abs/2401.13627 @data_analysis_ml

11 марта Newprolab запускает уже 14-й поток программы Data-Engineer Программа будет полезна junior и middle дата-инженерам, а
11 марта Newprolab запускает уже 14-й поток программы Data-Engineer Программа будет полезна junior и middle дата-инженерам, аналитикам данных, бэкенд-разработчикам, техлидам и менеджерам, работающим с дата-командой - 7 недель (11 марта – 27 апреля) - 20 занятий с преподавателями в зуме - 6 лаб с реальными данными - чат с участниками и поддержка координаторов 📌Что дает программа: 1) научитесь решать типичные задачи DE и реально станете дата-инженером на время программы 2) структурируете ваши знания и познакомитесь с новыми инструментами 3) поработаете с облачным кластером для решения лаб с реальными данными 4) видеозаписи и другие материалы программы останутся у вас навсегда 📌Преподаватели – практики из ведущих компаний, рассказывают о сложном простым языком и ответят на все ваши вопросы 📌Промокод DEFRIENDS дает скидку 20% [Подробная информация и регистрация]

⚡️ Новая лекция Ян Лекуна : «Объектно-ориентированный ИИ: на пути к машинам, которые могут учиться, рассуждать и планировать»
⚡️ Новая лекция Ян Лекуна : «Объектно-ориентированный ИИ: на пути к машинам, которые могут учиться, рассуждать и планировать» Слайды: https://drive.google.com/file/d/1e6EtQPQMCreP3pwi5E9kKRsVs2NbWPrY/view?usp=drivesdk Видео: https://www.youtube.com/watch?si=UeLf0MhMzjXcSCAb&v=d_bdU3LsLzE&feature=youtu.be @data_analysis_ml

Вышел PyTorch 2.2 🎉 С Новые фичи: - Поддержка SDPA FlashAttention-2. - Новое расширение TorchInductor. - device_mesh, новая
Вышел PyTorch 2.2 🎉 С Новые фичи: - Поддержка SDPA FlashAttention-2. - Новое расширение TorchInductor. - device_mesh, новая абстракция для инициализации и представления групп процессов. - Стандартизированный управляемый механизм логирования под названием TORCH_LOGS. и др. ➡️ Полный список обновлений @data_analysis_ml

🖥 Примеры генеративного ИИ от NVIDIA Современные примеры генеративного ИИ, которые легко развертывать, тестировать и адптиро
🖥 Примеры генеративного ИИ от NVIDIA Современные примеры генеративного ИИ, которые легко развертывать, тестировать и адптировать под ваши задачи. Все примеры работают на высокопроизводительном стеке NVIDIA CUDA-X и графических процессорах NVIDIA. ▪Github @data_analysis_ml

💡 Проблема: ваш код,, содержит много скопированного чужого кода, но его трудно найти. Решение: jscpd jscpd — это инструмент
💡 Проблема: ваш код,, содержит много скопированного чужого кода, но его трудно найти. Решение: jscpd jscpd — это инструмент командной строки, который находит скопированный код и сообщает о конкретных повторяющихся строках. Работает более чем на 150 языках. Пример отчета на картинке. Github @data_analysis_ml

🖥 Nxs-data-anonymizer - это инструмент для анонимизации дампа баз данных PostgreSQL и MySQL/MariaDB/Percona. ▪Поддерживаемые
🖥 Nxs-data-anonymizer - это инструмент для анонимизации дампа баз данных PostgreSQL и MySQL/MariaDB/Percona. ▪Поддерживаемые базы данных и версии: PostgreSQL (9/10/11/12/13/14/15/все версии) MySQL/MariaDB/Percona (5.7/8.0/8.1/все версии) ▪Гибкая генерация фейковых данных на основе шаблонов Go и библиотеки шаблонов Sprig. ▪Потоковая обработка данных. Это означает, что вы можете перенаправлять дамп из исходной БД в любую другую БД с преобразованиями ▪Легко интегрируется в CI/CD ➡️ Github @data_analysis_ml

⚠️ С чего начать, если хотите работать в ML? С бесплатного практического урока «Кластерный анализ данных» от OTUS. Спикер Мар
⚠️  С чего начать, если хотите работать в ML? С бесплатного практического урока «Кластерный анализ данных» от OTUS. Спикер Мария Тихонова – Senior Data Scientist в «SberDevices» и преподаватель ВШЭ. • В результате вебинара вы узнаете общие принципы кластеризации данных в ML  • Изучите ряд алгоритмов, в том числе k-means и примените их на практике Встречаемся 7 февраля в 18:00 мск в рамках курса «Machine Learning. Professional». Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок и получить список вопросов и ответов для прохождения интервью 👉Регистрация https://otus.pw/jSCz/?erid=LjN8KFCpE Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

🖥 SQL-metadata Если вы хотите извлечь определенные компоненты #SQL-запроса для последующей работы с нмим на #Python, использ
🖥 SQL-metadata Если вы хотите извлечь определенные компоненты #SQL-запроса для последующей работы с нмим на #Python, используйте sql_metdata. Извлекает имена столбцов и таблиц, используемых в запросе. Автоматически выполняет разрешение псевдонимов столбцов, разрешение псевдонимов подзапросов, а также разрешение псевдонимов таблиц. Также предоставляет полезные функции для нормализации SQL-запросов. pip install sql-metadataGithubDocs

🖥 Google-Colab-Selenium Лучший способ использовать Selenium в блокнотах Google Colab! ▪Простая настройка Selenium и ChromeDr
🖥 Google-Colab-Selenium Лучший способ использовать Selenium в блокнотах Google Colab! ▪Простая настройка Selenium и ChromeDriver. ▪Бесшовная интеграция с Google Colab. ▪Поддержка ChromeDriver для сложных случаев парсинга. %pip install google-colab-selenium import google_colab_selenium as gs from selenium.webdriver.chrome.options import Options # Instantiate options options = Options() # Add extra options options.add_argument("--window-size=1920,1080") # Set the window size options.add_argument("--disable-infobars") # Disable the infobars options.add_argument("--disable-popup-blocking") # Disable pop-ups options.add_argument("--ignore-certificate-errors") # Ignore certificate errors options.add_argument("--incognito") # Use Chrome in incognito mode driver = gs.Chrome(options=options) driver.get('https://uproger.com') print(driver.title) driver.quit() ➡️Github ➡️Colab @data_analysis_ml

🎮 Build a Large Language Model (From Scratch) Еще один замечательный ресурс, который подходит для начинающих, чтобы построит
🎮 Build a Large Language Model (From Scratch) Еще один замечательный ресурс, который подходит для начинающих, чтобы построить ChatGPT-подобный LLM с нуля, шаг за шагом ▪Github @data_analysis_ml

⚡ RoMa: простая в использовании, стабильная и эффективная библиотека для работы с кватернионами, векторами вращения, простран
+1
RoMa: простая в использовании, стабильная и эффективная библиотека для работы с кватернионами, векторами вращения, пространственными преобразованиями в PyTorch. pip install romaGithubDocs @data_analysis_ml

🔊 Делимся «вредными советами» по работе с ClickHouse® ClickHouse® — быстрая и масштабируемая колоночная база данных. Она изв
🔊 Делимся «вредными советами» по работе с ClickHouse® ClickHouse® — быстрая и масштабируемая колоночная база данных. Она известна своей высокой производительностью, возможностью обрабатывать аналитические запросы в режиме онлайн и строить аналитические витрины. Как и у любой другой технологии, у ClickHouse® есть свои особенности и нюансы, которые необходимо учитывать при работе. В видео архитекторы Yandex Cloud поделятся распространёнными ошибками при использовании базы данных ClickHouse®, а также рекомендациями, как избежать этих ошибок и достичь максимально производительности БД ClickHouse. 🗣 Подробнее по ссылке.

🚀 LLMLingua: Enhancing Large Language Model Inference via Prompt Compression LLMLingua использует компактную, хорошо обученн
+3
🚀 LLMLingua: Enhancing Large Language Model Inference via Prompt Compression LLMLingua использует компактную, хорошо обученную языковую модель (например, LaMA-7B) для поиска и удаления несущественных лексем в промптах. Этот подход обеспечивает эффективный вывод с использованием больших языковых моделей (LLM), достигая 20-кратного сжатия при минимальной потере качества генерации. ▪GithubДокументация @data_analysis_ml

🚀 Одна из распространенных привычек Pandas, от которой полезно отказаться в Polars: В Pandas датасаентисты часто добавляют/п
🚀 Одна из распространенных привычек Pandas, от которой полезно отказаться в Polars: В Pandas датасаентисты часто добавляют/преобразуют столбцы в отдельных строках. В Polars наоборот удобно добавляют много выражений в однну функцию with_columns. Почему? Ответ в производительности. Потому что Polars может выполнять все выражения параллельно. @data_analysis_ml

🌟 При работе с файлами Parquet в pandas обычно сначала загружают данные в pandas DataFrame, а затем применяют фильтры. Чтобы
🌟 При работе с файлами Parquet в pandas обычно сначала загружают данные в pandas DataFrame, а затем применяют фильтры. Чтобы увеличить скорость выполнения запросов, переместите фильтры в движок PyArrow и воспользуйтесь оптимизацией обработки PyArrow. @data_analysis_ml