Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya12 512 Texnologiyalar & Aralashmalar2 668...

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 254 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 668-o'rinni va Rossiya mintaqasida 12 512-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 254 obunachiga ega bo‘ldi.

21 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 39 ga, so‘nggi 24 soatda esa -7 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 8.79% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.66% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 4 415 marta ko‘riladi; birinchi sutkada odatda 3 346 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 31 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 22 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 254

Obunachilar

-724 soatlar

+977 kunlar

+3930 kunlar

4 415

Post ko'rishlar

~ 3 34624 soatlar

~ 4 33548 soatlar

8.79%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Postlar arxiv

50 256

🖥 Whisper.cpp для перевода аудио в текст 🟡Высокопроизводительный интерфейс на C++ для модели Whisper от OpenAI, которая отлично распознаёт текст. Простая реализация на C/C++ без зависимостей. Особенности самой модели Whisper: — Хорошо распознает русский текст (даже с вкраплениями английского) — Хорошо распознает цифры 🖥 GitHub 🟡 Использование Кстати, интересный факт: Whisper.cpp был написан Георгием Гергановым всего за 5 дней @data_analysis_ml

50 256

💨 Scaling hierarchical agglomerative clustering to trillion-edge graphs Кластеризация графов объединяет похожие элементы в группы, что помогает лучшему понять взаимосвязи в данных. В этой статье инженеры Google рассказывают о ключевых методах, которые позволили им построить мощнейший алгоритм, позволяющий группировать графы с триллионами ребер. https://research.google/blog/scaling-hierarchical-agglomerative-clustering-to-trillion-edge-graphs/ @data_analysis_ml

50 256

🔥 Animation with text that highlights important events Анимация является выразительным средством для оживления ваших графиков, и Matplotlib предлагает специализированные инструменты для этой цели. Это руководство представляет собой подробное пошаговое руководство с кодом, который вы можете воспроизвести по созданию эффектных анимаций. • Читать @data_analysis_ml

50 256

📌PyTorch Sentiment Analysis — анализ эмоциональной составляющей текста В этом репозитории содержатся разные реализации анализа текста в PyTorch: — с использованием "мешка слов" (bag of words) — с помощью рекурретной нейросети (RNN) — посредством свёртной нейросети (CNN) — с помощью модных трансформеров 🖥 GitHub @data_analysis_ml

50 256

🌟 О работе трансформеров с контекстом Отличная статья для глубокого понимания, как трансформеры работают с контекстом. Детально описаны механизмы, благодаря которым это вообще возможно, в том числе и механизм внимания. Выдвигается гипотеза, что обучение трансформеров в контексте возникает благодаря неявной реализации градиентного спуска по функции потерь, построенной на основе данных, взятых из контекста. 📎 Arxiv 🟡 Кстати, полезная статья об архитектуре трансформеров на Хабре 🟡 Визуализация механизма внимания от 3b1b @data_analysis_ml

50 256

🔥Common Voice 17 теперь на hf. Common Voice 17 - датасет С 31 175 часами аудиозаписей (и транскрипций) на 124 языках 🎶 Большинство аудио в датасете содержат демографические метаданные, такие как возраст, пол и акцент, которые могут помочь повысить точность систем распознавания речи. Хотите попробовать?


from datasets import load_dataset

cv17 = load_dataset("mozilla-foundation/common_voice_17_0", 
                       "hi", 
                       split="test", 
                       streaming=True)

https://huggingface.co/datasets/mozilla-foundation/common_voice_17_0 @data_analysis_ml

50 256

🌟 Cognita — опенсорсный RAG-фреймворк для построения сложных приложений с LLM 🟡Langchain/LlamaIndex предоставляют простые в использовании абстракции, которые можно использовать для быстрых экспериментов и создания прототипов в Jupyter Notebook. Но когда нужно сделать что-то крупнее пет-проекта, возникают ограничения — например, компоненты должны быть модульными и легко масштабируемыми. И вот здесь отлично пригодится Cognita. 🟡Cognita использует Langchain/Llamaindex под капотом и обеспечивает организацию вашей кодовой базы, где каждый из компонентов RAG является модульным, управляемым API и легко расширяемым. Cognita может быть легко использована локально, при этом инструмент предоставляет вам готовую к производству среду вместе с поддержкой пользовательского интерфейса без кода. 🖥 GitHub ▶️ Затестить Cognita можно тут @data_analysis_ml

50 256

🧠 Open AI только что добавили новую функцию памяти в Chatgpt. Память теперь доступна всем пользователям ChatGPT Plus. Пользоваться памятью очень просто: просто запустите новый чат и напишите ChatGPT все, что вы хотели бы, чтобы он запомнил. Память можно включить или отключить в настройках. @data_analysis_ml

50 256

🌟 Perplexica — открытый поисковой движок с AI Созданный на основе Perplexity AI, этот движок с открытым исходным кодом не просто ищет в интернете, но и понимает ваши вопросы. Perplexica использует передовые ML-алгоритмы для уточнения результатов и предоставляет четкие ответы со ссылками на источники. 🖥 GitHub @ai_machinelearning_big_data

50 256

Repost from Machine learning Interview

⭐️ Data Science разбор реальной задачи с собеседования. Прогнозирование оттока клиентов. ▪Смотреть ▪Данные ▪Ноутбук @machinelearning_interview

50 256

👨‍🎓 100 лекций по математике от Оксфорда Оксфорд публикует лекции по математике, чтобы дать представление об опыте студентов и о том, как они преподают математику в Оксфорде. В этом плейлисте собраны лекции из различных курсов за все студенческие годы (включая целые курсы). За всеми лекциями первого и второго курсов следуют учебные занятия, на которых студенты встречаются со своим преподавателем, чтобы ознакомиться с лекцией и соответствующими заданиями. Примерно 80 часов отборной математики. • Плейлист @data_analysis_ml

50 256

🖥 Giskard — библиотека Python для оценки и тестирования LLM-, ML-моделей Помогает обнаруживать проблемы в моделях. Сканирует LLM, позволяет определить производительность, фиксирует проблемы безопасности. Установка: pip install "giskard[llm]" -U ▶️ Попробовать в Google Colab 🖥 GitHub 3.1k ⭐️ @data_analysis_ml

50 256

📌ИИ может определить политические взгляды по лицу 🟡Исследователи из Высшей школы бизнеса Стэнфордского университета подтвердили, что распознавание лиц можно использовать, чтобы определять политические убеждения человека. Это создаёт новые угрозы приватности со стороны систем распознавания лиц. 🟡591 человека спросили об их политических предпочтениях, а потом «скормили» их фотографии обученной на распознавание лиц модели. Та смогла по чертам лица определить политические предпочтения участников исследования. 🟡Точность определения сравнивали с точностью предсказаний того, как хорошо собеседования определяют успех на работе или алкоголь повышает агрессивность. Достоверность увеличивалась, если показывать ИИ не только фото, но и добавлять контекст: возраст, пол, этническую принадлежность. Модель определяет не принадлежность к конкретной партии, а скорее спектр взглядов человека — консервативные они или либеральные. Судя по представлению модели и небольшой выборке, у либералов лица меньше, а у консерваторов — больше. Вот и пришли мы к ИИ, который мерит черепа и даёт людям оценку, ориентируясь на «большие данные». 📎 Подробнее @data_analysis_ml

50 256

🌟 Mage-ai — отличная замена Airflow Позволяет: • интегрировать и синхронизировать данные из сторонних источников • создавать конвейеры обработки данных в реальном времени и в пакетном режиме, используя Python, SQL и R • производить запуск, мониторинг и оркестровку тысяч конвейеров 🖥 GitHub 7k ⭐️ @data_analysis_ml

50 256

▶️Microsoft представила Infra Copilot, который использует GitHub Copilot для генерации инфраструктурного кода ⏩Microsoft представила новый инструмент Infra Copilot, предназначенный для помощи в написании кода для инфраструктурных систем (подход Infrastructure as Code). В качестве основы инструмент использует GitHub Copilot. ⏩«Infra Copilot использует возможности машинного обучения для интерпретации намерений, стоящих за промптами, и быстрого создания инфраструктурного когда. Он понимает контекст инфраструктурных задач и позволяет профессионалам задавать вопросы на естественном языке и получать соответствующие предложения по коду», — указывает Microsoft. ⏩Infra Copilot доступен пользователям, у которых установлена последняя версия Visual Studio Code и есть лицензия GitHub Copilot. @ai_machinelearning_big_data

50 256

📌Классификация и ординация с помощью R В этой статье мы поговорим о том, как делать кластерный анализ и строить тепловые карты экспрессии в R. Рассмотрим такие понятия как: • Многомерные данные • Облако точек в многомерном пространстве • Коэффициенты сходства-различия • Евклидово расстояние • Коэффициент Жаккара • Иерархическая кластеризация • Алгоритмы иерархической кластеризации на основании расстояний • Метод ближайшего соседа • Метод отдаленного соседа • Метод невзвешенного попарного среднего 📎 Статья @data_analysis_ml

50 256

⚡️ Искусственный интеллект Adobe превращает размытое видео в HD 🟡Исследователи из Adobe разработали модель генеративного искусственного интеллекта (ИИ) VideoGigaGAN, которая может до восьми раз увеличить разрешение видео, снятого в низком качестве. В описании технологии разработчики утверждают, что новый ИИ превосходит другие методы повышения разрешения видео (VSR), поскольку он обеспечивает высокую детализацию, не добавляя заметных артефактов редактирования. 🟡Как правило, при масштабировании видео с помощью генеративно-состязательных нейросетей в кадрах появляются эффекты мерцания и другие нежелательные артефакты. Другие методы позволяют избежать этого, но картинка теряет четкость и детализацию. VideoGigaGAN обеспечивает высокое качество видео с меньшим количеством проблем, заявляют разработчики. 🟡Компания предоставила несколько примеров, демонстрирующих работу ИИ. В демонстрационных клипах действительно видно высокое качество обработки и незаметны эффекты редактирования. Например, текстура кожи или детали внешности выглядят естественно. Пока неизвестно, будет ли VideoGigaGAN доступен простым пользователям в Creative Cloud или Adobe планирует иначе использовать новую модель. ▶️ Вживую посмотреть на работу VideoGigaGAN можно тут @data_analysis_ml

50 256

Когда опять ничего не получается Помните, как котёнок в мультике складывает кубики и приговаривает: «Опять ничего не получается. Ну, и пожалуйста, ну и не нужно»? Так многие бросают английский, думая, что научиться звучать уверенно невозможно. На самом деле всё реально. Есть три слагаемых в изучении английского, которые помогают прийти к результату и повысить уровень. Первое: чёткая цель, которая будет мотивировать двигаться дальше. Второе: продуманный план обучения, а не отдельные занятия время от времени, чтобы видеть постоянный прогресс. И третье: большое количество разговорной практики, чтобы наконец избавиться от языкового барьера. На курсах английского от Яндекс Практикума всё именно так: ✺ Преподаватели-профессионалы, прошедшие отбор: они сфокусированы на вашем результате и помогают достигать целей в комфортной обстановке. ✺ План обучения, который адаптируется под текущий уровень языка — так вы не будете снова учить то, что хорошо знаете, а сможете сосредоточиться на темах, которые пока вызывают сложности. ✺ Много разговорной практики, в том числе с иностранцами, чтобы раскрепоститься в общении и почувствовать себя увереннее, например в поездках. ✺ Программа, разработанная методистами с кембриджским дипломом DELTA: чтобы развивать навыки по международным стандартам обучения. Начните путь к новому уровню английского с малого: запишитесь на бесплатную консультацию. Куратор определит языковой уровень и подберёт курс под ваши цели и амбиции. Всего 30 минут, которые ни к чему вас не обязывают, но помогут поверить в свои силы.

50 256

50 256

Эффективный способ быстрого освоения ChatGPT. Создание правильных промптов и обучение нейронной сети - это долгий процесс, требующий значительных временных затрат. Здесь разработан краткий курс из 5 уроков по ChatGPT. После его прохождения вы сможете создать 9 нейронных сетей, которые помогут вам: ▪️ найти ошибки и оптимизировать код ▪️ генерировать посты в Телеграме ▪️ создавать заголовки для рекламы * отдать всю рутину на выполнение нейронке Вы также сможете разработать своих нейро-помощников для продаж, маркетинга и других целей. Бесплатный доступ доступен сразу после регистрации. Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8KYXR3