Анализ данных (Data analysis)

Открыть в Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Больше

Сеть:Machinelearning Россия12 512 Технологии и приложения2 668...

📈 Аналитический обзор Telegram-канала Анализ данных (Data analysis)

Канал Анализ данных (Data analysis) (@data_analysis_ml) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 50 254 подписчиков, занимая 2 668 место в категории Технологии и приложения и 12 512 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 50 254 подписчиков.

Согласно последним данным от 21 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило 39, а за последние 24 часа — -7, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 8.79%. В первые 24 часа после публикации контент обычно набирает 6.66% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 4 415 просмотров. В течение первых суток публикация набирает 3 346 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 31.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как llm, контекст, openai, архитектура, deepseek.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Благодаря высокой частоте обновлений (последние данные получены 22 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

50 254

Подписчики

-724 часа

+977 дней

+3930 день

4 415

Просмотры поста

~ 3 34624 часа

~ 4 33548 часов

8.79%

Коэффициент вовлеченности

~ 5

Постов в день

Ads index

beta

Архив постов

50 256

🖥 Whisper.cpp для перевода аудио в текст 🟡Высокопроизводительный интерфейс на C++ для модели Whisper от OpenAI, которая отлично распознаёт текст. Простая реализация на C/C++ без зависимостей. Особенности самой модели Whisper: — Хорошо распознает русский текст (даже с вкраплениями английского) — Хорошо распознает цифры 🖥 GitHub 🟡 Использование Кстати, интересный факт: Whisper.cpp был написан Георгием Гергановым всего за 5 дней @data_analysis_ml

50 256

💨 Scaling hierarchical agglomerative clustering to trillion-edge graphs Кластеризация графов объединяет похожие элементы в группы, что помогает лучшему понять взаимосвязи в данных. В этой статье инженеры Google рассказывают о ключевых методах, которые позволили им построить мощнейший алгоритм, позволяющий группировать графы с триллионами ребер. https://research.google/blog/scaling-hierarchical-agglomerative-clustering-to-trillion-edge-graphs/ @data_analysis_ml

50 256

🔥 Animation with text that highlights important events Анимация является выразительным средством для оживления ваших графиков, и Matplotlib предлагает специализированные инструменты для этой цели. Это руководство представляет собой подробное пошаговое руководство с кодом, который вы можете воспроизвести по созданию эффектных анимаций. • Читать @data_analysis_ml

50 256

📌PyTorch Sentiment Analysis — анализ эмоциональной составляющей текста В этом репозитории содержатся разные реализации анализа текста в PyTorch: — с использованием "мешка слов" (bag of words) — с помощью рекурретной нейросети (RNN) — посредством свёртной нейросети (CNN) — с помощью модных трансформеров 🖥 GitHub @data_analysis_ml

50 256

🌟 О работе трансформеров с контекстом Отличная статья для глубокого понимания, как трансформеры работают с контекстом. Детально описаны механизмы, благодаря которым это вообще возможно, в том числе и механизм внимания. Выдвигается гипотеза, что обучение трансформеров в контексте возникает благодаря неявной реализации градиентного спуска по функции потерь, построенной на основе данных, взятых из контекста. 📎 Arxiv 🟡 Кстати, полезная статья об архитектуре трансформеров на Хабре 🟡 Визуализация механизма внимания от 3b1b @data_analysis_ml

50 256

🔥Common Voice 17 теперь на hf. Common Voice 17 - датасет С 31 175 часами аудиозаписей (и транскрипций) на 124 языках 🎶 Большинство аудио в датасете содержат демографические метаданные, такие как возраст, пол и акцент, которые могут помочь повысить точность систем распознавания речи. Хотите попробовать?


from datasets import load_dataset

cv17 = load_dataset("mozilla-foundation/common_voice_17_0", 
                       "hi", 
                       split="test", 
                       streaming=True)

https://huggingface.co/datasets/mozilla-foundation/common_voice_17_0 @data_analysis_ml

50 256

🌟 Cognita — опенсорсный RAG-фреймворк для построения сложных приложений с LLM 🟡Langchain/LlamaIndex предоставляют простые в использовании абстракции, которые можно использовать для быстрых экспериментов и создания прототипов в Jupyter Notebook. Но когда нужно сделать что-то крупнее пет-проекта, возникают ограничения — например, компоненты должны быть модульными и легко масштабируемыми. И вот здесь отлично пригодится Cognita. 🟡Cognita использует Langchain/Llamaindex под капотом и обеспечивает организацию вашей кодовой базы, где каждый из компонентов RAG является модульным, управляемым API и легко расширяемым. Cognita может быть легко использована локально, при этом инструмент предоставляет вам готовую к производству среду вместе с поддержкой пользовательского интерфейса без кода. 🖥 GitHub ▶️ Затестить Cognita можно тут @data_analysis_ml

50 256

🧠 Open AI только что добавили новую функцию памяти в Chatgpt. Память теперь доступна всем пользователям ChatGPT Plus. Пользоваться памятью очень просто: просто запустите новый чат и напишите ChatGPT все, что вы хотели бы, чтобы он запомнил. Память можно включить или отключить в настройках. @data_analysis_ml

50 256

🌟 Perplexica — открытый поисковой движок с AI Созданный на основе Perplexity AI, этот движок с открытым исходным кодом не просто ищет в интернете, но и понимает ваши вопросы. Perplexica использует передовые ML-алгоритмы для уточнения результатов и предоставляет четкие ответы со ссылками на источники. 🖥 GitHub @ai_machinelearning_big_data

50 256

Repost from Machine learning Interview

⭐️ Data Science разбор реальной задачи с собеседования. Прогнозирование оттока клиентов. ▪Смотреть ▪Данные ▪Ноутбук @machinelearning_interview

50 256

👨‍🎓 100 лекций по математике от Оксфорда Оксфорд публикует лекции по математике, чтобы дать представление об опыте студентов и о том, как они преподают математику в Оксфорде. В этом плейлисте собраны лекции из различных курсов за все студенческие годы (включая целые курсы). За всеми лекциями первого и второго курсов следуют учебные занятия, на которых студенты встречаются со своим преподавателем, чтобы ознакомиться с лекцией и соответствующими заданиями. Примерно 80 часов отборной математики. • Плейлист @data_analysis_ml

50 256

🖥 Giskard — библиотека Python для оценки и тестирования LLM-, ML-моделей Помогает обнаруживать проблемы в моделях. Сканирует LLM, позволяет определить производительность, фиксирует проблемы безопасности. Установка: pip install "giskard[llm]" -U ▶️ Попробовать в Google Colab 🖥 GitHub 3.1k ⭐️ @data_analysis_ml

50 256

📌ИИ может определить политические взгляды по лицу 🟡Исследователи из Высшей школы бизнеса Стэнфордского университета подтвердили, что распознавание лиц можно использовать, чтобы определять политические убеждения человека. Это создаёт новые угрозы приватности со стороны систем распознавания лиц. 🟡591 человека спросили об их политических предпочтениях, а потом «скормили» их фотографии обученной на распознавание лиц модели. Та смогла по чертам лица определить политические предпочтения участников исследования. 🟡Точность определения сравнивали с точностью предсказаний того, как хорошо собеседования определяют успех на работе или алкоголь повышает агрессивность. Достоверность увеличивалась, если показывать ИИ не только фото, но и добавлять контекст: возраст, пол, этническую принадлежность. Модель определяет не принадлежность к конкретной партии, а скорее спектр взглядов человека — консервативные они или либеральные. Судя по представлению модели и небольшой выборке, у либералов лица меньше, а у консерваторов — больше. Вот и пришли мы к ИИ, который мерит черепа и даёт людям оценку, ориентируясь на «большие данные». 📎 Подробнее @data_analysis_ml

50 256

🌟 Mage-ai — отличная замена Airflow Позволяет: • интегрировать и синхронизировать данные из сторонних источников • создавать конвейеры обработки данных в реальном времени и в пакетном режиме, используя Python, SQL и R • производить запуск, мониторинг и оркестровку тысяч конвейеров 🖥 GitHub 7k ⭐️ @data_analysis_ml

50 256

▶️Microsoft представила Infra Copilot, который использует GitHub Copilot для генерации инфраструктурного кода ⏩Microsoft представила новый инструмент Infra Copilot, предназначенный для помощи в написании кода для инфраструктурных систем (подход Infrastructure as Code). В качестве основы инструмент использует GitHub Copilot. ⏩«Infra Copilot использует возможности машинного обучения для интерпретации намерений, стоящих за промптами, и быстрого создания инфраструктурного когда. Он понимает контекст инфраструктурных задач и позволяет профессионалам задавать вопросы на естественном языке и получать соответствующие предложения по коду», — указывает Microsoft. ⏩Infra Copilot доступен пользователям, у которых установлена последняя версия Visual Studio Code и есть лицензия GitHub Copilot. @ai_machinelearning_big_data

50 256

📌Классификация и ординация с помощью R В этой статье мы поговорим о том, как делать кластерный анализ и строить тепловые карты экспрессии в R. Рассмотрим такие понятия как: • Многомерные данные • Облако точек в многомерном пространстве • Коэффициенты сходства-различия • Евклидово расстояние • Коэффициент Жаккара • Иерархическая кластеризация • Алгоритмы иерархической кластеризации на основании расстояний • Метод ближайшего соседа • Метод отдаленного соседа • Метод невзвешенного попарного среднего 📎 Статья @data_analysis_ml

50 256

⚡️ Искусственный интеллект Adobe превращает размытое видео в HD 🟡Исследователи из Adobe разработали модель генеративного искусственного интеллекта (ИИ) VideoGigaGAN, которая может до восьми раз увеличить разрешение видео, снятого в низком качестве. В описании технологии разработчики утверждают, что новый ИИ превосходит другие методы повышения разрешения видео (VSR), поскольку он обеспечивает высокую детализацию, не добавляя заметных артефактов редактирования. 🟡Как правило, при масштабировании видео с помощью генеративно-состязательных нейросетей в кадрах появляются эффекты мерцания и другие нежелательные артефакты. Другие методы позволяют избежать этого, но картинка теряет четкость и детализацию. VideoGigaGAN обеспечивает высокое качество видео с меньшим количеством проблем, заявляют разработчики. 🟡Компания предоставила несколько примеров, демонстрирующих работу ИИ. В демонстрационных клипах действительно видно высокое качество обработки и незаметны эффекты редактирования. Например, текстура кожи или детали внешности выглядят естественно. Пока неизвестно, будет ли VideoGigaGAN доступен простым пользователям в Creative Cloud или Adobe планирует иначе использовать новую модель. ▶️ Вживую посмотреть на работу VideoGigaGAN можно тут @data_analysis_ml

50 256

Когда опять ничего не получается Помните, как котёнок в мультике складывает кубики и приговаривает: «Опять ничего не получается. Ну, и пожалуйста, ну и не нужно»? Так многие бросают английский, думая, что научиться звучать уверенно невозможно. На самом деле всё реально. Есть три слагаемых в изучении английского, которые помогают прийти к результату и повысить уровень. Первое: чёткая цель, которая будет мотивировать двигаться дальше. Второе: продуманный план обучения, а не отдельные занятия время от времени, чтобы видеть постоянный прогресс. И третье: большое количество разговорной практики, чтобы наконец избавиться от языкового барьера. На курсах английского от Яндекс Практикума всё именно так: ✺ Преподаватели-профессионалы, прошедшие отбор: они сфокусированы на вашем результате и помогают достигать целей в комфортной обстановке. ✺ План обучения, который адаптируется под текущий уровень языка — так вы не будете снова учить то, что хорошо знаете, а сможете сосредоточиться на темах, которые пока вызывают сложности. ✺ Много разговорной практики, в том числе с иностранцами, чтобы раскрепоститься в общении и почувствовать себя увереннее, например в поездках. ✺ Программа, разработанная методистами с кембриджским дипломом DELTA: чтобы развивать навыки по международным стандартам обучения. Начните путь к новому уровню английского с малого: запишитесь на бесплатную консультацию. Куратор определит языковой уровень и подберёт курс под ваши цели и амбиции. Всего 30 минут, которые ни к чему вас не обязывают, но помогут поверить в свои силы.

50 256

50 256

Эффективный способ быстрого освоения ChatGPT. Создание правильных промптов и обучение нейронной сети - это долгий процесс, требующий значительных временных затрат. Здесь разработан краткий курс из 5 уроков по ChatGPT. После его прохождения вы сможете создать 9 нейронных сетей, которые помогут вам: ▪️ найти ошибки и оптимизировать код ▪️ генерировать посты в Телеграме ▪️ создавать заголовки для рекламы * отдать всю рутину на выполнение нейронке Вы также сможете разработать своих нейро-помощников для продаж, маркетинга и других целей. Бесплатный доступ доступен сразу после регистрации. Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8KYXR3