Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya12 512 Texnologiyalar & Aralashmalar2 668...

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 257 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 668-o'rinni va Rossiya mintaqasida 12 512-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 257 obunachiga ega bo‘ldi.

22 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 45 ga, so‘nggi 24 soatda esa 6 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 9.24% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.54% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 4 645 marta ko‘riladi; birinchi sutkada odatda 3 285 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 31 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 23 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 257

Obunachilar

+624 soatlar

+787 kunlar

+4530 kunlar

4 645

Post ko'rishlar

~ 3 28524 soatlar

~ 4 28448 soatlar

9.24%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Postlar arxiv

50 257

🚀 Датасет Amazon Reviews получил четвертое обновление! Amazon Reviews, один из крупнейших и наиболее широко используемых наборов данных отзывов, насчитывающий более 500 миллионов отзывов пользователей, более 48 миллионов товаров, более 60 миллионов токенов, из 33 категорий. https://amazon-reviews-2023.github.io @data_analysis_ml

50 257

🤗 Новый краткий курс "Модели с открытым исходным кодом на Hugging face". huggingface изменил правила игры, позволив разработчикам легко использовать любую из сотен тысяч уже готовых моделей с открытым исходным кодом для сборки в своих проектах. Этот курс научит вас лучшим практикам работы с hf, в том числе поиску и выбору моделей. Вы научитесь пользоваться библиотекой Transformers и познакомитесь с несколькими моделями обработки текста, аудио и изображений, включая сегментацию изображений с нулевым кадром, классификацию аудио с нулевым кадром и распознавание речи. Вы также научитесь использовать мультимодальные модели для визуального ответа на вопросы, поиска изображений и подписи к изображениям. Наконец вы поработаете с

Gradio и Hugging Face Spaces.

https://deeplearning.ai/short-courses/open-source-models-hugging-face/

50 257

Программа бакалавриата в Центральном университете от Тинькофф с грантом до 100% для сильных и мотивированных абитуриентов! Грант можно получить на одно из направлений бакалавриата по искусственному интеллекту, разработке и бизнес-аналитике. Помимо диплома и практико-ориентированного образования студенты получат: - Персонализацию учебной траектории; - Стажировку в одной из лучших ИТ-компании страны; - Личного ментора на все время обучения; - Доступ к современному кампусу в центре Москвы. Получить полную информацию и оставить заявку можно здесь. erid:2VtzqxQJgCq Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

50 257

⚡️Вышло обновление Automatic 1111 до версии 1.8.0 Обновился Automatic 1111 — самый популярный интерфейс для генерации изображений с помощью нейросетей Stable Diffusion 🟠Soft инпеинтинг с дополнительным размытием краев позволяет добиться невероятного качества изменения. Переходы теперь идеальные между оригиналом и инпеинтингом. Особенно если использовать модель для инпеинтинга SDXL, поддержка которых теперь доступна из коробки, просто скачайте модель как обычно. 🟠Поменялся интерфейс в меню экстрасетей (модели, лоры, эмбединги), теперь навигация представлена деревом каталогов и это наконец-то стало удобно. 🟠Добавлена нативная поддержка апскейлеров формата DAT, попробуйте скачать 4xLSDIRDAT в папку stable-diffusion-webui\models\DAT, не страшно если её нет, можете создать, она появится при попытке активировать DAT апскейлер на вкладке Extras. 🟠В txt2img теперь есть кнопка, которая позволяет сделать Hires. fix на уже готовой картинке, при этом сразу начинается апскейл экономя время. 🟠Крутых обновлений целая гора, вот список на изображении Тестите, пишите как оно) 🖥 Automatic1111 @ai_machinelearning_big_data

50 257

🌌 Galactic Если вы хотите, изучить,, подготовить, очистить или создать эмбединги из больших наборов неструктурированных текстовых данных, попробуйте Galatic. Он отдлично подходит для файнтюнинга данных, создания документов для RAG. Инструмент поможет выполнить полную подготовку неструктурированных датасетов для работы с LLM. ▪ Github @data_analysis_ml

50 257

💎 Дата-сайентист — сравнительно молодая профессия. Спрос на таких специалистов растёт гораздо быстрее, чем увеличивается количество самих аналитиков. Если тебе нравится работать с большими данными и находить в них закономерности, пройди обучение от Слёрм и получи профессию будущего! На курсе Data Scientist ты поймешь, как работают алгоритмы машинного обучения, и научишься применять их в проектах на реальных данных. Курс подойдёт: ✔️ Разработчикам, которые работают вместе с дата-сайентистами и хотят лучше понимать коллег; ✔️ Software Engineer, Data Engineer, DevOps Engineer уровня Middle, готовым перейти в смежную профессиональную область; ✔️ Программистам на Python, которые хотят освоить новое перспективное направление. Курс состоит на 30% из теории и на 70% из практики. За 96 часов обучения ты освоишь: ⚡️ Алгоритмы и теорию машинного обучения; ⚡️ Базовые подходы и популярный фреймворк для построения нейросетей; ⚡️ Машинное обучение для выполнения бизнес-задач; ⚡️ Способы анализа и визуализации больших объёмов данных разных типов; ⚡️ Библиотеки для анализа данных. Присоединяйся! Скачай презентацию курса и получи демо-доступ на 7 дней, чтобы убедиться, что курс тебе подходит. Реклама. ООО «Слёрм» г. Лиски, ИНН 3652901451

50 257

⚡️Сверхполезная статья от профи Data Science Здесь обсуждается и показывается, как производить конкатенацию, сегментацию данных, объединять данные — и ещё очень много насущных вещей DS Годно) ⏩ Клик @data_analysis_ml

50 257

➡️Совсем свежий 4-часовой курс по ML от freeCodeCamp.org В этом ролике затронуты самые важные понятия ML и смежных областей, помимо теории, есть много кода и практических заданий (например, прогнозирование стоимости жилья) Что есть в курсе? 🟢Дорожная карта ML на 2024 год 🟢Необходимый набор навыков для карьеры в области ML 🟢Основные карьерные пути 🟢Основы ML 🟢Bias-Variance Trade-Off 🟢Overfitting и регуляризация 🟢Основы линейной регрессии 🟢Теория моделей линейной регрессии 🟢Теория моделей логистической регрессии 🟢Пример с линейной регрессией 🟢Загрузка и исследование данных 🟢Определение независимых и зависимых переменных 🟢Очистка и предварительная обработка данных 🟢Описательная статистика и визуализация данных 🟢Межквантильный диапазон для обнаружения выбросов 🟢Корреляционный анализ 🟢Разделение данных на Train/Test с помощью sklearn 🟢Запуск линейной регрессии - причинно-следственный анализ 🟢Проверка допущений OLS в модели линейной регрессии 🟢Запуск линейной регрессии для прогнозной аналитики ➡️ Youtube @data_analysis_ml

50 257

🏆 Чтобы получить новые знания, опыт совместной работы и общение с лучшими экспертами, пройдите предварительную регистрацию в Летних школах Яндекса 2024! Больше 50% выпускников становятся стажёрами и сотрудниками Яндекса💪 В этом году будет запущено больше школ: 🔸 Школа бэкенд-разработки; 🔸 Школа разработки интерфейсов; 🔸 Школа мобильной разработки; 🔸 Школа менеджеров Яндекса; 🔸 Школа аналитиков-разработчиков. После лекций в онлайне будет практика в офисах Яндекса в Москве, Санкт-Петербурге и Екатеринбурге. Вам оплатят проезд и проживание, если вы из другого города📍 👉Подать заявку

50 257

Repost from Kali Linux

💻 Вредоносные Deep Learning модели На платформе Hugging Face обнаружено не менее 100 вредоносных Deep Learning моделей, некоторые из которых могут выполнять код на машине жертвы, предоставляя злоумышленникам постоянный бэкдор. Специалисты компании JFrog разработали и развернули продвинутую систему сканирования для проверки моделей PyTorch и Tensorflow Keras, размещенных на Hugging Face. Малварь проникла в Hugging Face несмотря на все меры безопасности, включая сканирование на наличие малвари, а также тщательное изучение функциональности моделей для обнаружения такого поведения, как небезопасная десериализация. Одним из примеров стала модель PyTorch, загруженная недавно пользователем под ником baller423 и уже удаленная с HuggingFace. Она содержала полезную нагрузку, которая позволяла создать реверс-шелл на указанный хост (210.117.212.93). Вредоносная полезная нагрузка использовала метод __reduce__ модуля pickle для выполнения произвольного кода при загрузке файла модели PyTorch, при этом избегая обнаружения за счет встраивания малвари в доверенный процесс сериализации. В JFrog обнаружили, что та же полезная нагрузка связывалась и с другими IP-адресами, что позволяет предположить, что ее операторы все же являются ИИ- и ИБ-исследователями, а не хакерами. Однако такие эксперименты в JFrog все равно называют слишком рискованными, учитывая, что опасные модели были общедоступны. Пытаясь определить истинные намерения операторов вредоноса, аналитики развернули приманку для привлечения активности и ее анализа. Им удалось установить соединение с сервером потенциальных злоумышленников, однако не удалось перехватить ни одной команды за время поддержания соединения. @linuxkalii

50 257

🚗 Gemini 1.5 создает структурированный JSON из видео На вход подается видео с классическими автомобилями и запрос с просьбой указать марку, производителя, год выпуска, цвет и описание авто - Gemini удалось проделать довольно приличную работу! Привожу часть ответа ниже (полный json на картинке):

[
  {
    "make": "Cadillac Eldorado",
    "manufacturer": "General Motors",
    "year": 1953,
    "color": "Blue",
    "description": "The Cadillac Eldorado was a luxury convertible that was known for its stylish design and powerful engine."
  },
  {
    "make": "Chevrolet Corvette",
    "manufacturer": "General Motors",
    "year": 1953,
    "color": "Red",
    "description": "The Chevrolet Corvette was a sports car that was known for its sleek design and impressive performance."
  },
  
]

Шикарный результат! @data_analysis_ml

50 257

📈 Если вы хотите преобразить свои графики #matplotlib попробуйте LovelyPlots Чтобы красивые графики, просто добавьте одну строку кода к существующему коду matplotlib. 📉 Lovely Plots - это инструмент, содержащий таблицы стилей matplotlib для легкого форматирования графиков для научных статей, проектов и презентаций. Библиотека сохраняет их полностью редактируемыми в Adobe Illustrator. Кроме того, параметры экспорта .svg позволяют автоматически адаптировать шрифт рисунков к шрифту вашего документа. Например, рисунки в формате .svg, импортированные в файл .tex, будут автоматически сгенерированы с использованием текстового шрифта, используемого в вашем файле

.tex.

pip install LovelyPlots

▪Github @data_analysis_ml

50 257

🖥 45+ IT-компаний ищут стажёров и джунов Карьерные форумы "Найти IT" — это шанс пообщаться с топовыми компаниями и получить оффер. Среди работодателей будут Сбер, Яндекс, Kaspersky, Avito и многие другие. Что вас ждёт: 🔹 Мастер-классы, кейсы и Q&A-сессии. 🔹 Розыгрыш призов среди участников. 🔹 Обширное пространство для общения и обмена опытом. 🔹 Карьерные консультации от HR-ов. Участие бесплатное! Выбирайте город и регистрируйтесь👇🏻 📍 Москва — 6 марта 📍 Санкт-Петербург — 6 апреля 📍 Новосибирск — 10 апреля

50 257

По умолчанию преобразователи #scikit-learn возвращают массив NumPy. Это может быть проблемой, если для последующих этапов обработки данных вам нужен датафрейм pandas. К счастью, начиная с scikit-learn версии 1.3.2, вы можете использовать метод set_output для получения результатов в формате датафреймов pandas. @data_analysis_ml

50 257

Присоединяйтесь к GitVerse – сервису для быстрого создания исходного кода с AI-помощником Разработчики получили доступ к GitVerse – платформе для совместной разработки и хостинга кода от СберТеха. Она позволяет создавать проекты с открытым и закрытым кодом, приглашать новых участников, переносить репозитории с популярных мировых ресурсов в один клик и общаться с единомышленниками в ИТ-сообществе. Первые пользователи, зарегистрировавшиеся на GitVerse, смогут присоединиться к открытому тестированию персонального AI-ассистента разработчика (AI, artificial intelligence — искусственный интеллект) — сервису GigaCode. Он ускоряет и упрощает программирование, генерируя варианты завершения кода непосредственно в среде разработки в режиме реального времени. В рамках акции пользователям доступен бесплатный годовой пакет облачных сервисов, с ним можно размещать разработанные приложения в облаке с использованием технологий распределённого хранения и вычислений. Подробности и правила акции, а также регистрация на сайте платформы.

50 257

⚡️Нереальная подборка полезных нейросетей. 226 AI-сервисов и приложений на все случаи жизни, от известных MGIE, Perplexity, Gemini, Groq до совсем свежих и малознакомых Эти нейросети помогут вам: ➖управлять движением объектов на видео ➖повысить качество записанного аудио ➖исправить грамматику в любом приложении ➖генерировать аудио, видео, изображения ➖апскейлить изображение ➖и ещё помогут с миллионом других задач 🔗 Каталог @ai_machinelearning_big_data

50 257

Всем привет! Владелец продукта ИТ-компании изучает потребности и пожелания участников процесса работы с даннымии аналитикой. У вас есть уникальная возможность поделиться опытом, дать рекомендации и подсветить проблемы используемых систем. Переходите по ссылке и делитесь бесценным опытом😉

50 257

⚡️ StarCoder2: открытые веса, датасеты, обучающие скрипты, топ лидерборда HF. StarCoder2 - это семейство открытых LLM для генерации кода, в трех различных размерах с параметрами 3B, 7B и 15B. StarCoder2-15B обучен на более чем 4 триллионах лексем и 600+ языках программирования из The Stack v2. Все модели используют Grouped Query Attention, контекстное окно из 16 384 лексем. StarCoder2 предлагает три размера модели: модель на 3 миллиарда параметров, обученная ServiceNow, модель на 7 миллиардов параметров, обученная Hugging Face, и модель на 15 миллиардов параметров, обученная NVIDIA с помощью NVIDIA NeMo и ускоренной инфраструктуры NVIDIA: ▪StarCoder2-3B был обучен на 17 языках программирования из The Stack v2 на 3+ триллионах токенов. ▪StarCoder2-7B обучался на 17 языках программирования из The Stack v2 на 3,5+ триллионах токенов. ▪StarCoder2-15B был обучен на 600+ языках программирования из The Stack v2 на 4+ триллионах токенов. StarCoder2-15B является лучшим в своем классе и по многим показателям превосходит модели 33B+. 📌HF 📌Github 📌Статья

50 257

Работаешь с данными и чувствуешь, что из них можно получить больше? В DataWorkshop расскажут как это сделать. 5 дней практики в Data Science на реальных данных магазина из Великобритании. 1-2 часа в день и самостоятельно создаешь модели машинного обучения. Старт - 4 марта. Обучаешься под руководством эксперта в своем темпе, в удобное время. 6000+ человек из разных стран мира уже приняли участие в данном интенсиве. 15 лет практического опыта у автора интенсива, поэтому полученные знания можно сразу применять в рабочих проектах. Обучают с 2017 года. Предоставляем готовое окружение - ничего устанавливать и настраивать не нужно. Участие бесплатно только для первых 100 записавшихся человек. Успевайте записаться по 👉 ЭТОЙ ССЫЛКЕ А еще много полезной информации о том, как начать работать в сфере Data Science в их канале. Реклама: ИП Кравченко Николай Васильевич LjN8KCNbP

50 257

🖥 3 лучших инструмента для автоматизации устранения SQL инъекций! SQL-инъекция (SQLi) - это уязвимость веб-безопасности, которая позволяет злоумышленнику вмешиваться в запросы, которые приложение делает к своей базе данных. Как правило, это позволяет просматривать данные, которые он обычно не может получить. Это могут быть других пользователей, или любые другие данные, доступ к которым имеет само приложение. Во многих случаях злоумышленник может изменять или удалять эти данные, вызывая постоянные изменения в содержимом или поведении приложения. 1⃣ SQLMap Вы, вероятно, уже знаете о первом инструменте. SQLMap - самый популярный сканер уязвимостей SQL Injection, полностью открытый! 2⃣ Ghauri Ghauri - это продвинутый инструмент, позволяющий легко автоматизировать обнаружение и эксплуатацию уязвимостей SQL Injection! Ghauri также имеет открытый исходный код и доступен на GitHub! 3⃣ SQLiv Обнаруживает уязвимости SQL-инъекций в веб-приложениях с помощью методов автоматического сканирования. Этот инструмент способен найти в Google определенную цель, просмотреть ее и просканировать несколько URL-адресов на наличие SQL-инъекций. @data_analysis_ml