Анализ данных (Data analysis)

Open in Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Network:Machinelearning Russia12 514 Technologies & Applications2 668...

📈 Analytical overview of Telegram channel Анализ данных (Data analysis)

Channel Анализ данных (Data analysis) (@data_analysis_ml) in the Russian language segment is an active participant. Currently, the community unites 50 248 subscribers, ranking 2 668 in the Technologies & Applications category and 12 514 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 50 248 subscribers.

According to the latest data from 21 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 39 over the last 30 days and by -7 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.79%. Within the first 24 hours after publication, content typically collects 6.66% reactions from the total number of subscribers.
Post reach: On average, each post receives 4 415 views. Within the first day, a publication typically gains 3 346 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 31.
Thematic interests: Content is focused on key topics such as llm, контекст, openai, архитектура, deepseek.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Thanks to the high frequency of updates (latest data received on 22 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

50 248

Subscribers

-724 hours

+977 days

+3930 days

4 415

Post views

~ 3 34624 hours

~ 4 33548 hours

8.79%

Engagement rate

~ 5

Posts per day

Ads index

beta

Posts Archive

50 248

🌟 TextGrad — open-source фреймворк для реализации обратного распространения, опирающегося на текстовую обратную связь — pip install textgrad TextGrad может оптимизировать неструктурированные переменные, такие как текст. Пусть у нас есть исходное решение математической задачи, мы хотим, чтобы это решение выглядело лучше. Вот как можно реализовать это в коде с помощью TextGrad и GPT-4o:

tg.set_backward_engine("gpt-4o")

initial_solution = """To solve the equation 3x^2 - 7x + 2 = 0, we use the quadratic formula:
x = (-b ± √(b^2 - 4ac)) / 2a
a = 3, b = -7, c = 2
x = (7 ± √((-7)^2 - 4 * 3(2))) / 6
x = (7 ± √(7^3) / 6
The solutions are:
x1 = (7 + √73)
x2 = (7 - √73)"""

# Define the variable to optimize, let requires_grad=True to enable gradient computation
solution = tg.Variable(initial_solution,
                       requires_grad=True,
                       role_description="solution to the math question")

# Define the optimizer, let the optimizer know which variables to optimize, and run the loss function

loss_fn = tg.TextLoss("You will evaluate a solution to a math question. Do not attempt to solve it yourself, do not give a solution, only identify errors. Be super concise.")

optimizer = tg.TGD(parameters=[solution])
loss = loss_fn(solution)

🖥 GitHub 🟡 Colab с примерами примитивов TextGrad 🟡 Arxiv @data_analysis_ml

50 248

В следующий раз, когда будете выбирать бенчмарки для оценки модели, ознакомьтесь с этой корреляционной матрицей из статьи MixEval. Удобно смотреть производительность чат-ботов на арене, идеально подходит для поиска чат-ботов общего назначения. 🌀 MixEval: https://mixeval.github.io

50 248

🌟 d3rlpy — библиотека Python, предоставляющая реализации алгоритмов Deep Learning — pip install d3rlpy d3rlpy уделяет большое внимание простоте использования; эта библиотека предназначена не только для исследователей, но и для практиков, работающих над обычными проектами. 🖥 GitHub 🟡 Доки 🟡 Arxiv @data_analysis_ml

50 248

6–9 июля проводим Weekend Offer Analytics Устроиться в Яндекс за выходные — реально. Ищем крутых аналитиков с опытом работы от 2 лет на Python или C++, готовых работать в офисном или гибридном режиме на территории России или Республики Беларусь. Подавайте заявку до 3 июля — и всего за 3 дня пройдите все технические собеседования. После сможете пообщаться с девятью нанимающими командами и выбрать ту, которая покажется самой интересной. Если всё сложится хорошо, сразу же пришлём вам офер. Узнать подробности и зарегистрироваться. Реклама. ООО "Яндекс". ИНН 7736207543

50 248

🌟 AXLearn — open-source библиотека от Apple, созданная на основе JAX и XLA для разработки больших Deep Learning моделей — pip install 'axlearn[apple-silicon]' Система конфигурации AXLearn позволяет пользователям создавать модели из многократно используемых строительных блоков и интегрировать их с другими библиотеками, такими как Flax и Hugging Face transformers. AXLearn создана для масштабирования — она поддерживает обучение моделей с сотнями миллиардов параметров на тысячах GPU. AXLearn также поддерживает работу в публичных облаках и предоставляет инструменты для развертывания и управления моделями. Поддерживает широкий спектр приложений, включая NLP, CV и распознавание речи, и содержит базовые конфигурации для обучения современных моделей. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 248

⚡️ Google Mind gредставили AvatarPopUp! Этот метод позволяет создавать высококачественные трехмерные аватары людей из одного изображения или текстового запроса всего за 2 секунды 🔥 https://nikoskolot.com/avatarpopup/ @data_analysis_ml

50 248

🌟 R2R — open-source RAG фреймворк — pip install r2r R2R создан, чтобы помочь разработчикам преодолеть разрыв между локальными экспериментами с LLM и созданием масштабируемого, готового к продакшену приложения. R2R, созданный для работы с пользовательскими приложениями RAG, обеспечивает достаточную производительность и возможности для большинства случаев использования RAG. Фичи R2R: — позволяет легко развернуть RAG-приложение в проде — гибкий в настройке, легко конфигурируется 🖥 GitHub 🟡 Доки @data_analysis_ml

50 248

🖥 Вышел NumPy 2.0.0. Самые значительные обновления с 2006 года для Python разработчиков Вышла новая версия Python-библиотеки для научных вычислений NumPy 2.0.0, предназначенная для работы с многомерными массивами и матрицами. Она включает обширную коллекцию функций, реализующих различные алгоритмы, связанные с использованием матриц. NumPy считается одной из самых популярных библиотек для научных расчетов. Код библиотеки написан на Python с применением оптимизаций на языке C и распространяется под лицензией BSD. NumPy 2.0.0 является первым значительным обновлением с 2006 года. В новой версии добавлены новые функции и улучшена производительность, а также внесены изменения в ABI, Python API и C-API, нарушающие обратную совместимость. Например, библиотека SciPy, собранная с NumPy 1.x, потребует перекомпиляции для работы с NumPy 2.0. В некоторых случаях для использования NumPy 2.0 в приложениях потребуется внести изменения в код. Одно из наиболее значимых изменений связано с сохранением точности скалярных выражений. Например, выражение “np.float32(3) + 3” теперь вернет значение типа float32, а не float64. В выражениях с несколькими типами для результата будет использоваться тип с наивысшей точностью, например, “np.array([3], dtype=np.float32) + np.float64(3)” вернет значение типа float64. Также изменены целочисленные типы по умолчанию на платформе Windows: на 64-разрядных системах теперь используется 64-разрядный целый тип, а на 32-разрядных – 32-разрядный (ранее использовался аналог типа long из C, теперь это эквивалент np.intp). Некоторые определения в C-API были изменены или удалены, например, структура PyArray_Descr. Максимальное число измерений и аргументов, выставляемое через макросы NPY_MAXDIMS и NPY_MAXARGS, увеличено до 64. Все комплексные типы переведены на использование стандартных типов из спецификации C99 (cfloat_t, cdouble_t, clongdouble_t). Добавлен новый C API для создания собственных dtype. Также предложены новые упрощённые функции инициализации PyArray_ImportNumPyAPI и PyUFunc_ImportUFuncAPI. В Python API обеспечено более четкое разделение между публичными и приватными API, представлена новая структура модулей. Около 100 функций, модулей и констант вынесены из основного пространства имен “np”, объявлены устаревшими или удалены. Пространство имен np.lib было очищено. Число объектов в основном пространстве имен сокращено на 10%, а в пространстве имен numpy.lib – на 80%. Пространство имен numpy.core переведено в разряд приватных. Удалены некоторые методы из классов np.ndarray и np.generic. Создано новое пространство имен numpy.stringsf со строковыми операциями. https://uproger.com/vyshel-numpy-2-0-0-samye-znachitelnye-obnovleniya-s-2006-goda-dlya-python-razrabotchikov/ @machinelearning_ru

50 248

⚡️ Понимание Deep Learning Отличная книга и масса Colab'ов от MIT для полного понимания Deep Learning Определённо это один из лучших ресурсов по DL 🟡 Understanding Deep Learning 📎 PDF @data_analysis_ml

50 248

🏆 Depth Anything 2 - новая версия модели для анализа сцен, которая иопределяет глубину каждого пикселя. Новая модель 10 раз быстрее, чем другие современные модели! Нейросеть, которая 💪 Модели различных размеров (от 25 миллионов до 1,3 миллиарда параметров) доступны на Hugging face Hub ✨ https://huggingface.co/collections/depth-anything/depth-anything-v2-666b22412f18a6dbfde23a93 @data_analysis_ml

50 248

📚Grog book - это приложение streamlit, которое позволяет создавать книги из просптов с помощью Llama3 в Groq. Оно неплохо работает с научно-популярными книгами и создает каждую га=лавы за считанные секунды. ▪Github ▪П риложение @data_analysis_ml

50 248

🔥 Thread — типо Jupyter Notebook, но не совсем, — позволяет генерировать и редактировать код, коммуницируя при этом с GPT — pip install thread-dev Thread — это Jupyter Notebook на максималках, в нём можно использовать естественный язык для создания ячеек, редактирования кода, задавать вопросы GPT или исправлять ошибки, при всём этом можно редактировать работать с кодом, как в обычном Jupyter Notebook. После установки для запуска достаточно прописать thread или jupyter thread 🖥 GitHub @data_analysis_ml

50 248

🔥 Реализация архитектуры nanoGPT в электронной таблице — для полного понимания, как работает типичный трансформер Внутренние операции любого трансформера можно свести к простым матричным вычислениям — собственно это и реализовано в этой таблице. Таблица воспроизводит структуру nanoGPT от Андрея Карпати с ~85000 параметрами. И эта таблица представляет собой систему предсказания следующих символов на основе предыдущих, то есть для простоты каждый токен — это символ; для уменьшения сложности токенизируются только буквы A/B/C. На прикреплённых изображениях — механизм самовнимания и полный вид всей таблицы 🖥 GitHub 🟡 Тред в X @data_analysis_ml

50 248

Для тех, кто хочет в финтех Т-Банк растет и зовет сильных специалистов в команду. Условия — мед: задачи нескучные, коллеги недушные. Есть над чем подумать и когда отдохнуть. Приходите прокачивать навыки, развивать финтех и работать в команде единомышленников. Посмотреть вакансии и откликнуться, если у вас больше двух лет опыта, можно здесь Реклама. АО «Тинькофф Банк», ИНН 7710140679

50 248

🌟 «R for Data Science» — open-source книга для дата-сайентистов Здесь описывается практически всё, что только может пригодится среднестатистическому специалисту Data Science; вот некоторые из раскрываемых тем: — разведочный анализ данных (EDA) — преобразование данных, удаление пропущенных значений, выбросов — веб-скрепинг, сбор данных из открытых источников 📎 Книга «R for Data Science» @data_analysis_ml

50 248

Профессия аналитика данных — одна из самых высокооплачиваемых и перспективных в сфере IT. На курсе «Аналитик данных» от Нетологии вы с нуля освоите необходимые навыки за 7 месяцев под руководством опытных наставников-практиков. Вы изучите SQL, Python, Power BI — ключевые инструменты для работы с данными. Научитесь использовать статистические методы, строить и проверять гипотезы. Создадите 4 полноценных проекта для своего портфолио и выполните более 20 практических заданий. А по окончании курса получите диплом о профпереподготовке и сможете претендовать на должность junior-аналитика. Начните свой путь в сфере аналитики данных — присоединяйтесь к программе: https://netolo.gy/degZ Реклама. ООО "Нетология". Erid 2VSb5wEwF9z

50 248

🌟 Cognee — open-source фреймворк для работы с LLM, с графами и для векторного поиска — pip install cognee Cognee поддерживает множество инструментов для различных операций: — LanceDB или Neo4j для локального хранения графов и не только — Qdrant и Weaviate для хранения векторных данных — в качестве LLM можно использовать Anyscale или Ollama 🖥 GitHub 🟡 Доки 🟡 Попробовать в Colab'е 🟡 Обзор на YouTube @data_analysis_ml

50 248

Repost from Яндекс

🔴 Разработали библиотеку, чтобы быстрее обучать нейросети YaFSDP оптимизирует использование ресурсов графических процессоров (GPU). Нейросети обучаются быстрее, а требования к вычислительным ресурсам снижаются. Это особенно важно для небольших компаний и научных проектов. Библиотека рассчитана в первую очередь на большие языковые модели, но также может ускорять и обучение других типов нейросетей, например, рисующих картинки. Исходный код YaFSDP опубликован на GitHub, а на Хабре можно подробнее узнать о разработке библиотеки. ↗️ А зачем вообще большие компании делятся своими разработками с сообществом? Поговорили об этом в одном из выпусков yet another podcast — смотрите на YouTube. Подписывайтесь ✨ @yandex

50 248

🌟 Merlion — ML-фреймворк для анализа временных рядов — pip install salesforce-merlion[dashboard] Merlion — это фреймворк Python для интеллектуального анализа временных рядов. Merlion представляет собой набор ML-алгоритмов, позволяющих загружать и преобразовывать данные, строить и обучать модели, проводить обработку результатов моделирования и оценивать эффективности модели. Merlion позволяет решать такие задачи как прогнозирование, обнаружение аномалий (как для одномерных, так и для многомерных временных рядов). 🖥 GitHub 🟡 Доки @data_analysis_ml

50 248

⚡️ DALI — библиотека с GPU-ускорением, содержащая высокооптимизированные компоненты и движок для обработки данных для ускорения обучения моделей Deep Learning и не только (для CUDA 12.0) — pip install nvidia-dali-cuda120 NVIDIA Data Loading Library (DALI) — это библиотека для загрузки и предобработки данных с GPU-ускорением для приложений Deep Learning. DALI может использоваться в качестве замены встроенных загрузчиков данных в популярных фреймворках глубокого обучения. DALI решает проблему узкого места CPU, перекладывая предобработку данных на GPU. 🖥 GitHub 🟡 Доки @data_analysis_ml