Анализ данных (Data analysis)

Открыть в Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Больше

Сеть:Machinelearning Россия12 514 Технологии и приложения2 668...

📈 Аналитический обзор Telegram-канала Анализ данных (Data analysis)

Канал Анализ данных (Data analysis) (@data_analysis_ml) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 50 248 подписчиков, занимая 2 668 место в категории Технологии и приложения и 12 514 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 50 248 подписчиков.

Согласно последним данным от 21 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило 39, а за последние 24 часа — -7, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 8.79%. В первые 24 часа после публикации контент обычно набирает 6.66% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 4 415 просмотров. В течение первых суток публикация набирает 3 346 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 31.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как llm, контекст, openai, архитектура, deepseek.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Благодаря высокой частоте обновлений (последние данные получены 22 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

50 248

Подписчики

-724 часа

+977 дней

+3930 день

4 415

Просмотры поста

~ 3 34624 часа

~ 4 33548 часов

8.79%

Коэффициент вовлеченности

~ 5

Постов в день

Ads index

beta

Архив постов

50 248

🌟 TextGrad — open-source фреймворк для реализации обратного распространения, опирающегося на текстовую обратную связь — pip install textgrad TextGrad может оптимизировать неструктурированные переменные, такие как текст. Пусть у нас есть исходное решение математической задачи, мы хотим, чтобы это решение выглядело лучше. Вот как можно реализовать это в коде с помощью TextGrad и GPT-4o:

tg.set_backward_engine("gpt-4o")

initial_solution = """To solve the equation 3x^2 - 7x + 2 = 0, we use the quadratic formula:
x = (-b ± √(b^2 - 4ac)) / 2a
a = 3, b = -7, c = 2
x = (7 ± √((-7)^2 - 4 * 3(2))) / 6
x = (7 ± √(7^3) / 6
The solutions are:
x1 = (7 + √73)
x2 = (7 - √73)"""

# Define the variable to optimize, let requires_grad=True to enable gradient computation
solution = tg.Variable(initial_solution,
                       requires_grad=True,
                       role_description="solution to the math question")

# Define the optimizer, let the optimizer know which variables to optimize, and run the loss function

loss_fn = tg.TextLoss("You will evaluate a solution to a math question. Do not attempt to solve it yourself, do not give a solution, only identify errors. Be super concise.")

optimizer = tg.TGD(parameters=[solution])
loss = loss_fn(solution)

🖥 GitHub 🟡 Colab с примерами примитивов TextGrad 🟡 Arxiv @data_analysis_ml

50 248

В следующий раз, когда будете выбирать бенчмарки для оценки модели, ознакомьтесь с этой корреляционной матрицей из статьи MixEval. Удобно смотреть производительность чат-ботов на арене, идеально подходит для поиска чат-ботов общего назначения. 🌀 MixEval: https://mixeval.github.io

50 248

🌟 d3rlpy — библиотека Python, предоставляющая реализации алгоритмов Deep Learning — pip install d3rlpy d3rlpy уделяет большое внимание простоте использования; эта библиотека предназначена не только для исследователей, но и для практиков, работающих над обычными проектами. 🖥 GitHub 🟡 Доки 🟡 Arxiv @data_analysis_ml

50 248

6–9 июля проводим Weekend Offer Analytics Устроиться в Яндекс за выходные — реально. Ищем крутых аналитиков с опытом работы от 2 лет на Python или C++, готовых работать в офисном или гибридном режиме на территории России или Республики Беларусь. Подавайте заявку до 3 июля — и всего за 3 дня пройдите все технические собеседования. После сможете пообщаться с девятью нанимающими командами и выбрать ту, которая покажется самой интересной. Если всё сложится хорошо, сразу же пришлём вам офер. Узнать подробности и зарегистрироваться. Реклама. ООО "Яндекс". ИНН 7736207543

50 248

🌟 AXLearn — open-source библиотека от Apple, созданная на основе JAX и XLA для разработки больших Deep Learning моделей — pip install 'axlearn[apple-silicon]' Система конфигурации AXLearn позволяет пользователям создавать модели из многократно используемых строительных блоков и интегрировать их с другими библиотеками, такими как Flax и Hugging Face transformers. AXLearn создана для масштабирования — она поддерживает обучение моделей с сотнями миллиардов параметров на тысячах GPU. AXLearn также поддерживает работу в публичных облаках и предоставляет инструменты для развертывания и управления моделями. Поддерживает широкий спектр приложений, включая NLP, CV и распознавание речи, и содержит базовые конфигурации для обучения современных моделей. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 248

⚡️ Google Mind gредставили AvatarPopUp! Этот метод позволяет создавать высококачественные трехмерные аватары людей из одного изображения или текстового запроса всего за 2 секунды 🔥 https://nikoskolot.com/avatarpopup/ @data_analysis_ml

50 248

🌟 R2R — open-source RAG фреймворк — pip install r2r R2R создан, чтобы помочь разработчикам преодолеть разрыв между локальными экспериментами с LLM и созданием масштабируемого, готового к продакшену приложения. R2R, созданный для работы с пользовательскими приложениями RAG, обеспечивает достаточную производительность и возможности для большинства случаев использования RAG. Фичи R2R: — позволяет легко развернуть RAG-приложение в проде — гибкий в настройке, легко конфигурируется 🖥 GitHub 🟡 Доки @data_analysis_ml

50 248

🖥 Вышел NumPy 2.0.0. Самые значительные обновления с 2006 года для Python разработчиков Вышла новая версия Python-библиотеки для научных вычислений NumPy 2.0.0, предназначенная для работы с многомерными массивами и матрицами. Она включает обширную коллекцию функций, реализующих различные алгоритмы, связанные с использованием матриц. NumPy считается одной из самых популярных библиотек для научных расчетов. Код библиотеки написан на Python с применением оптимизаций на языке C и распространяется под лицензией BSD. NumPy 2.0.0 является первым значительным обновлением с 2006 года. В новой версии добавлены новые функции и улучшена производительность, а также внесены изменения в ABI, Python API и C-API, нарушающие обратную совместимость. Например, библиотека SciPy, собранная с NumPy 1.x, потребует перекомпиляции для работы с NumPy 2.0. В некоторых случаях для использования NumPy 2.0 в приложениях потребуется внести изменения в код. Одно из наиболее значимых изменений связано с сохранением точности скалярных выражений. Например, выражение “np.float32(3) + 3” теперь вернет значение типа float32, а не float64. В выражениях с несколькими типами для результата будет использоваться тип с наивысшей точностью, например, “np.array([3], dtype=np.float32) + np.float64(3)” вернет значение типа float64. Также изменены целочисленные типы по умолчанию на платформе Windows: на 64-разрядных системах теперь используется 64-разрядный целый тип, а на 32-разрядных – 32-разрядный (ранее использовался аналог типа long из C, теперь это эквивалент np.intp). Некоторые определения в C-API были изменены или удалены, например, структура PyArray_Descr. Максимальное число измерений и аргументов, выставляемое через макросы NPY_MAXDIMS и NPY_MAXARGS, увеличено до 64. Все комплексные типы переведены на использование стандартных типов из спецификации C99 (cfloat_t, cdouble_t, clongdouble_t). Добавлен новый C API для создания собственных dtype. Также предложены новые упрощённые функции инициализации PyArray_ImportNumPyAPI и PyUFunc_ImportUFuncAPI. В Python API обеспечено более четкое разделение между публичными и приватными API, представлена новая структура модулей. Около 100 функций, модулей и констант вынесены из основного пространства имен “np”, объявлены устаревшими или удалены. Пространство имен np.lib было очищено. Число объектов в основном пространстве имен сокращено на 10%, а в пространстве имен numpy.lib – на 80%. Пространство имен numpy.core переведено в разряд приватных. Удалены некоторые методы из классов np.ndarray и np.generic. Создано новое пространство имен numpy.stringsf со строковыми операциями. https://uproger.com/vyshel-numpy-2-0-0-samye-znachitelnye-obnovleniya-s-2006-goda-dlya-python-razrabotchikov/ @machinelearning_ru

50 248

⚡️ Понимание Deep Learning Отличная книга и масса Colab'ов от MIT для полного понимания Deep Learning Определённо это один из лучших ресурсов по DL 🟡 Understanding Deep Learning 📎 PDF @data_analysis_ml

50 248

🏆 Depth Anything 2 - новая версия модели для анализа сцен, которая иопределяет глубину каждого пикселя. Новая модель 10 раз быстрее, чем другие современные модели! Нейросеть, которая 💪 Модели различных размеров (от 25 миллионов до 1,3 миллиарда параметров) доступны на Hugging face Hub ✨ https://huggingface.co/collections/depth-anything/depth-anything-v2-666b22412f18a6dbfde23a93 @data_analysis_ml

50 248

📚Grog book - это приложение streamlit, которое позволяет создавать книги из просптов с помощью Llama3 в Groq. Оно неплохо работает с научно-популярными книгами и создает каждую га=лавы за считанные секунды. ▪Github ▪П риложение @data_analysis_ml

50 248

🔥 Thread — типо Jupyter Notebook, но не совсем, — позволяет генерировать и редактировать код, коммуницируя при этом с GPT — pip install thread-dev Thread — это Jupyter Notebook на максималках, в нём можно использовать естественный язык для создания ячеек, редактирования кода, задавать вопросы GPT или исправлять ошибки, при всём этом можно редактировать работать с кодом, как в обычном Jupyter Notebook. После установки для запуска достаточно прописать thread или jupyter thread 🖥 GitHub @data_analysis_ml

50 248

🔥 Реализация архитектуры nanoGPT в электронной таблице — для полного понимания, как работает типичный трансформер Внутренние операции любого трансформера можно свести к простым матричным вычислениям — собственно это и реализовано в этой таблице. Таблица воспроизводит структуру nanoGPT от Андрея Карпати с ~85000 параметрами. И эта таблица представляет собой систему предсказания следующих символов на основе предыдущих, то есть для простоты каждый токен — это символ; для уменьшения сложности токенизируются только буквы A/B/C. На прикреплённых изображениях — механизм самовнимания и полный вид всей таблицы 🖥 GitHub 🟡 Тред в X @data_analysis_ml

50 248

Для тех, кто хочет в финтех Т-Банк растет и зовет сильных специалистов в команду. Условия — мед: задачи нескучные, коллеги недушные. Есть над чем подумать и когда отдохнуть. Приходите прокачивать навыки, развивать финтех и работать в команде единомышленников. Посмотреть вакансии и откликнуться, если у вас больше двух лет опыта, можно здесь Реклама. АО «Тинькофф Банк», ИНН 7710140679

50 248

🌟 «R for Data Science» — open-source книга для дата-сайентистов Здесь описывается практически всё, что только может пригодится среднестатистическому специалисту Data Science; вот некоторые из раскрываемых тем: — разведочный анализ данных (EDA) — преобразование данных, удаление пропущенных значений, выбросов — веб-скрепинг, сбор данных из открытых источников 📎 Книга «R for Data Science» @data_analysis_ml

50 248

Профессия аналитика данных — одна из самых высокооплачиваемых и перспективных в сфере IT. На курсе «Аналитик данных» от Нетологии вы с нуля освоите необходимые навыки за 7 месяцев под руководством опытных наставников-практиков. Вы изучите SQL, Python, Power BI — ключевые инструменты для работы с данными. Научитесь использовать статистические методы, строить и проверять гипотезы. Создадите 4 полноценных проекта для своего портфолио и выполните более 20 практических заданий. А по окончании курса получите диплом о профпереподготовке и сможете претендовать на должность junior-аналитика. Начните свой путь в сфере аналитики данных — присоединяйтесь к программе: https://netolo.gy/degZ Реклама. ООО "Нетология". Erid 2VSb5wEwF9z

50 248

🌟 Cognee — open-source фреймворк для работы с LLM, с графами и для векторного поиска — pip install cognee Cognee поддерживает множество инструментов для различных операций: — LanceDB или Neo4j для локального хранения графов и не только — Qdrant и Weaviate для хранения векторных данных — в качестве LLM можно использовать Anyscale или Ollama 🖥 GitHub 🟡 Доки 🟡 Попробовать в Colab'е 🟡 Обзор на YouTube @data_analysis_ml

50 248

Repost from Яндекс

🔴 Разработали библиотеку, чтобы быстрее обучать нейросети YaFSDP оптимизирует использование ресурсов графических процессоров (GPU). Нейросети обучаются быстрее, а требования к вычислительным ресурсам снижаются. Это особенно важно для небольших компаний и научных проектов. Библиотека рассчитана в первую очередь на большие языковые модели, но также может ускорять и обучение других типов нейросетей, например, рисующих картинки. Исходный код YaFSDP опубликован на GitHub, а на Хабре можно подробнее узнать о разработке библиотеки. ↗️ А зачем вообще большие компании делятся своими разработками с сообществом? Поговорили об этом в одном из выпусков yet another podcast — смотрите на YouTube. Подписывайтесь ✨ @yandex

50 248

🌟 Merlion — ML-фреймворк для анализа временных рядов — pip install salesforce-merlion[dashboard] Merlion — это фреймворк Python для интеллектуального анализа временных рядов. Merlion представляет собой набор ML-алгоритмов, позволяющих загружать и преобразовывать данные, строить и обучать модели, проводить обработку результатов моделирования и оценивать эффективности модели. Merlion позволяет решать такие задачи как прогнозирование, обнаружение аномалий (как для одномерных, так и для многомерных временных рядов). 🖥 GitHub 🟡 Доки @data_analysis_ml

50 248

⚡️ DALI — библиотека с GPU-ускорением, содержащая высокооптимизированные компоненты и движок для обработки данных для ускорения обучения моделей Deep Learning и не только (для CUDA 12.0) — pip install nvidia-dali-cuda120 NVIDIA Data Loading Library (DALI) — это библиотека для загрузки и предобработки данных с GPU-ускорением для приложений Deep Learning. DALI может использоваться в качестве замены встроенных загрузчиков данных в популярных фреймворках глубокого обучения. DALI решает проблему узкого места CPU, перекладывая предобработку данных на GPU. 🖥 GitHub 🟡 Доки @data_analysis_ml