Анализ данных (Data analysis)

Open in Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Network:Machinelearning Russia12 514 Technologies & Applications2 668...

📈 Analytical overview of Telegram channel Анализ данных (Data analysis)

Channel Анализ данных (Data analysis) (@data_analysis_ml) in the Russian language segment is an active participant. Currently, the community unites 50 248 subscribers, ranking 2 668 in the Technologies & Applications category and 12 514 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 50 248 subscribers.

According to the latest data from 21 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 39 over the last 30 days and by -7 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.79%. Within the first 24 hours after publication, content typically collects 6.66% reactions from the total number of subscribers.
Post reach: On average, each post receives 4 415 views. Within the first day, a publication typically gains 3 346 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 31.
Thematic interests: Content is focused on key topics such as llm, контекст, openai, архитектура, deepseek.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Thanks to the high frequency of updates (latest data received on 22 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

50 248

Subscribers

-724 hours

+977 days

+3930 days

4 415

Post views

~ 3 34624 hours

~ 4 33548 hours

8.79%

Engagement rate

~ 5

Posts per day

Ads index

beta

Posts Archive

50 252

Игнорирование больших данных и нейросетей сегодня — почти гарантия провала. Именно поэтому стоит начать погружение в востребованную сферу Data Science и понять, чем занимаются специалисты по машинному обучению и анализу данных. За 5 дней вы узнаете, как работают нейросети, и создадите свою для поиска новостей. 📌 Зарегистрируйтесь прямо сейчас и получите эксклюзивный бонус — гайд «Как пользоваться ChatGPT и Midjourney + 25 полезных нейросетей»: https://epic.st/aP_hhJ?erid=2VtzqvfoxFK Что будем делать на мини-курсе: — Узнаем, где востребована наука о данных, и разберёмся в различиях 3 основных направлений — Освоим азы языка Python и визуализируем данные с его помощью — Изучим базовые конструкции языка SQL 🎁 Вас ждут подарки: — Год бесплатного изучения английского языка — Персональная карьерная консультация — 5 полезных чек-листов для старта карьеры 🎉 Все участники мини-курса получат сертификат на скидку 10 000 рублей на любой курс Skillbox. Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880

50 252

⚡️ xLSTM: расширенная долгая краткосрочная память С тех пор как LSTM возникли и выдержали испытание временем, они способствовали многочисленным успехам глубокого обучения, в частности, привели к созданию LLM. Однако появление технологии Transformer с распараллеливаемым самовниманием в основе ознаменовало рассвет новой эры, превзойдя LSTM по масштабу. Возникают вопросы: как далеко мы можем продвинуться в языковом моделировании при масштабировании LSTM до миллиардов параметров, используя новейшие методы современных LLM, но смягчая известные ограничения LSTM? • 1 — можно использовать экспоненциальный гейтинг с соответствующими методами нормализации и стабилизации. • 2 — можно модифицировать структуру памяти LSTM, получая: (I) sLSTM со скалярной памятью, скалярным обновлением и новым смешиванием памяти; (II) полностью распараллеливаемую mLSTM с матричной памятью и правилом обновления ковариации. Так и возникает xLSTM — расширенная долгая краткосрочная память. Экспоненциальный гейтинг и модифицированные структуры памяти повышают возможности xLSTM и позволяют сравнить их с современными трансформерами как по производительности, так и по масштабированию. Держите совсем свежую статью с описанием xLSTM 📎 Arxiv @data_analysis_ml

50 252

Вас заменит не искусственный интеллект, а те, кто будет работать с ним. Не дайте таким специалистам шанс отобрать у вас место в компании мечты — записывайтесь на бесплатный онлайн-практикум «Как не потерять работу из-за ИИ: погружаемся в аналитику и Data Science». За 2 дня вы: - узнаете, чем занимаются аналитик данных и Data Scientist - попробуете эти профессии на практике -определите, какое направление вам больше подходит - наметите карьерный план и заберете подарки Зарегистрироваться бесплатно: https://go.skillfactory.ru/&erid=2VtzqvUpTXF Реклама ООО "Скилфэктори", ИНН 9702009530

50 252

🌟 Novu — IaaC инфраструктура уведомлений на основе GitOps. Встроенный центр уведомлений, интеграция с электронной почтой, Push и Slack Novu — open-source инфраструктура уведомлений; Novu предоставляет унифицированный API, который упрощает отправку уведомлений по нескольким каналам, включая In-App, Push, Email, SMS и Chat. С Novu можно создавать пользовательские рабочие процессы и определять условия для каждого канала, не беспокоясь, что уведомления будут доставлены наиболее эффективным способом. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 252

🫖 Слёрм набирает новый поток курса «Data-инженер» Кто владеет информацией, тот владеет миром. А Data-инженер умеет выстраивать рабочие гипотезы и помогает бизнесу решать бизнес-запросы. А вы можете освоить инструменты и подходы Data-инженера на курсе от Слёрм. Старт 3 июня. Записаться на курс можно по ссылке ⬅️ Вы освоите наиболее популярные инструменты Data-инжениринга: Bash, Hadoop, Spark, PostgreSQL, ClickHouse, AirFiow, Nifi, Kafka, Neo4j, MongoDBI и другие. Это обширный и полноценный курс, который охватывает как базовые темы, так и более сложный материал. Эксперты курса: 🔎 Николай Марков. Работал с сетями, протоколами и различными облаками (AWS, GCP, Azure, OpenStack), писал проекты на Python, а также Golang, C/C++, Scala и Rust. Сейчас выстраивает аналитические архитектуры и Data Governance в разных компаниях. 🐍 Николай Акимов, инженер по внедрению в TaskData. В профессиональном IT уже более 20 лет. Активно участвует в Open Source проектах на Github, поддерживает сообщество NiFi. 🌺Ася Гайламазян. Работала в сферах телекоммуникаций, игровой индустрии, розничных и оптовых продажах в роли разработчика системного обеспечения. Как проходит обучение: Эксперты рассматривают каждую тему в коротких видеоуроках. После каждого занятия будут идти практические задания и тесты — можно пройти теорию и сразу закрепить её. В заданиях вы можете развернуть стенды и отработать учебный материал на практике. Всех студентов мы соберем в одном чате в Telegram: здесь можно будет поделиться инсайтом, задать вопрос кураторам и экспертам курса. После каждого тематического блока спикеры курса готовы будут встретиться с вами на онлайн-сессиях и обсудить возникшие сложности, ответить на любые вопросы по учебной программе. Старт 3 июня. Записаться на курс можно по ссылке Реклама ООО «Слёрм» ИНН 3652901451

50 252

⚡️ Plandex — AI-инструмент для создания кода — curl -sL https://plandex.ai/install.sh | bash Это open-source AI-инструмент для генерации кода с консольным интерфейсом, который помогает выполнять даже большие задачи. Для выполнения задач, охватывающих несколько файлов и требующих множества шагов, Plandex использует долго работающих AI-агентов. Большие задачи разбиваются на более мелкие подзадачи, которые затем выполняются — и так пока не будет выполнено всё. Фишки Plandex: — позволяет экспериментировать, пересматривать и анализировать в защищенной песочнице, прежде чем применять изменения — даёт возможность пробовать разные модели и настройки моделей, а затем сравнивать результаты — облегчает контроль над контекстом и над тем, сколько токенов используется 🖥 GitHub @data_analysis_ml

50 252

Yandex приглашает поучаствовать в Practical ML Conf 14 сентября! На конференции поговорим о том, как применять ML-технологии в бизнесе и реальных продуктах. Регистрируйтесь уже сейчас — те, кто сделает это раньше всех, попадут на закрытый мини-ивент в июле. А если хотите поделиться своим опытом в ML, станьте спикером, оставив заявку. Ключевые темы конференции — CV, RecSys, MLOps, NLP, Speech и Analytics. После подачи программный комитет рассмотрит заявки и примет решение об участии каждого претендента. 🔹 Сбор заявок завершится 13 июля. Реклама. ООО "Яндекс", ИНН 7736207543.

50 252

Repost from Machinelearning

🔥 Грег Брокман, соучредитель OpenAI, опубликовал 5-минутное видео, в котором он общается с языковой моделью GPT-4 Omni и демонстрирует ее возможности компьютерного зрения. А вот еще 33 видео с примерами работы ИИ - https://vimeo.com/openai. А если интерсно, тут обращение самого Сэма Альтмана - https://blog.samaltman.com/gpt-4o @ai_machinelearning_big_data

50 252

Repost from Machinelearning

🖥 Вышла новая, улучшенная версия GPT-4 Omni для. И что самое главное — она доступна всем БЕСПЛАТНО! Это самая совершенная модель из всех, намного превосходящая своих предшественников, включая таинственный gpt2-chatbot. Она появится уже сегодня в виде приложения для пк. GPT-4 Omni будет понимать эмоции и тон голоса. @ai_machinelearning_big_data

50 252

🌟 LLM2Vec — инструмент для преобразования LLM в кодировщик текста

pip install llm2vec
pip install flash-attn --no-build-isolation

LLM2Vec позволяет выполнить 3 простых шага: 1) включение двунаправленного внимания 2) обучение с скрытым предсказанием следующей лексемы 3) неконтролируемое контрастное обучение При этом LLM может быть дополнительно настроена для достижения современной производительности. 🖥 GitHub 🟡 Arxiv @data_analysis_ml

50 252

📌Featuretools для генерации признаков — python -m pip install featuretools Featuretools — это Python библиотека для автоматизированной разработки фич, т.е. определения переменных из набора данных для обучения ML-модели. Featuretools отлично справляется с преобразованием временных и реляционных наборов данных в матрицы признаков для машинного обучения. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 252

Вспомним школьную математику и подготовим к вступительным в магистратуру 16 мая пройдет первый вебинар в рамках онлайн-марафона по подготовке к вступительному экзамену в онлайн-магистратуру "Master of Data Science" Марафон продлится до 3 июня. Чтобы успешно сдать вступительный экзамен в магистратуру "Master of Data Science", вам нужно знать математику школьного уровня. Обучение рассчитано для поступающих с нулевым уровнем в программировании или желающих изменить свою сферу деятельности. Марафон будет также полезен всем, кто хочет вспомнить основы базовой математики. 📆 Дата: 16 мая 💻 Формат: онлайн 📕 Зарегистрироваться на онлайн-марафон по ссылке ✏ "Master of Data Science" — онлайн-магистратура на факультете компьютерных наук НИУ ВШЭ, которая реализуется полностью на английском языке. Реклама. НИУ ВШЭ. ИНН 7714030726 Erid: 2SDnjccrqVs

50 252

⚡️ DeepSeek-V2 — экономичная и эффективная языковая модель Mixture-of-Experts Встречайте DeepSeek-V2, производительную языковую модель Mixture-of-Experts (MoE), характеризующуюся экономичным обучением и эффективным выводом. Она включает в себя 236B параметров, из которых 21B активируется для каждой лексемы. По сравнению с DeepSeek 67B, DeepSeek-V2 достигает более высокой производительности, при этом экономит 42,5% затрат на обучение, сокращает кэш KV на 93,3% и увеличивает максимальную производительность генерации в 5,76 раза. Предварительное обучение DeepSeek-V2 было проведено на разнообразном и высококачественном наборе из 8,1 триллиона лексем. После этого комплексного предварительного обучения последовал процесс Supervised Fine-Tuning (SFT) и Reinforcement Learning (RL) для полного раскрытия возможностей DeepSeek-V2. Результаты оценок подтверждают эффективность такого подхода: DeepSeek-V2 достигает выдающихся результатов как в стандартных бенчмарках, так и в открытой системе оценивания. 🖥 GitHub 🤗 Hugging Face 🟡 Arxiv @data_analysis_ml

50 252

🖥🖥 Решаем задачи на стажировку аналитика в яндекс. Подключаем CHATGPT и другие ИИ модели! https://www.youtube.com/watch?v=I_6exF29t0k #youtube #стажировка #яндекс @machinelearning_interview

50 252

⚡️ Открытый MLOps курс от DataTalks.Club Мощный курс по MLOps; состоит из 6 модулей, к каждому модулю прилагается подробный Jupyter Notebook со всей нужной теорией и примерами кода 🖥 GitHub @data_analysis_ml

50 252

⚡️ Marqo — векторный поиск для ML-приложений и не только — pip install marqo Marqo — это open-source фреймворк тензорного поиска, который обеспечивает работу приложений для поиска, извлечения информации и ML-приложений. Особенности Marqo — генерация, хранение и поиск векторов из коробки — позволяет создавать приложения для поиска, разрешения сущностей и изучения данных, используя свои тексты и изображения — можно создавать сложные семантические запросы, комбинируя взвешенные поисковые термины — поддерживается фильтрация результатов поиска с помощью DSL запросов Marqo — позволяет использовать ML-модели от PyTorch, Huggingface, OpenAI и не только — можно использовать предварительно сконфигурированную модель или подключить свою собственную — поддержка CPU и GPU — модели хранятся в индексах HNSW в памяти, что позволяет достичь высокой скорости поиска — масштабирование до индексов на сотни миллионов документов с помощью горизонтального чередования индексов — асинхронная и неблокируемая загрузка данных и поиск 🖥 GitHub 🟡 Доки @data_analysis_ml

50 252

⚡️ PyWinAssistant — AI-инструмент для управления пользовательским интерфейсом PyWinAssistant — это первый AI-фреймворк для Windows 10/11 с открытым исходным кодом для управления любыми пользовательскими интерфейсами win32api путем использования визуализации мышления (VoT) и пространственных рассуждений в LLM (без OCR / обнаружения объектов / сегментации — такой подход улучшает качество работы PyWinAssistant). PyWinAssistant имеет встроенные опции чтобы помогать человеку пользоваться компьютером. Он правильно понимает любые запросы на естественном языке и планирует выполнение правильных действий в ОС с учетом требований безопасности. 🖥 GitHub 🟡 Arxiv (связанное с этим исследование) @data_analysis_ml

50 252

🖥 SQL генератор Выпущена Sqlcode 8b на базе Llama-3! Вероятно, это лучшая на данный момент модель размером <10B для преобразования текста в SQL. Работает лучше, чем gpt-4-turbo и claude opus для генерации SQL запросов. ▪Github: https://github.com/defog-ai/sql-eval ▪Weights: https://huggingface.co/defog/llama-3-sqlcoder-8b/ ▪Demo (optimized for postgres): https://defog.ai/sqlcoder-demo/ @data_analysis_ml

50 252

📌Artificial Analysis собрали топ 100 LLM в одном месте Компания Artificial Analysis разработала рейтинговую систему, оценивающую стоимость, производительность и качество более 100 LLM, чтобы обеспечить удобный выбор модели, соответствующей индивидуальным потребностям. Параметры для оценивания LLM: 🟡Качество: комплексный индекс, рассчитанный на основе метрик, таких как MMLU, MT-Bench, оценки HumanEval, а также рейтинг Chatbot Arena; 🟡Цена: метрики, учитывающие цену на вход/выход на один токен, а также среднюю цену для сравнения провайдеров хостинга. Стоимость представляет собой взвешенную смесь цен на входные и выходные токены в соотношении 3:1; 🟡Окно контекста: максимальное количество комбинированных входных и выходных токенов; 🟡Скорость: токены/с, получаемые во время генерации моделью токенов. Median, P5, P25, P75 и P95; 🟡Задержка: время до первого полученного токена, измеренное в секундах, после отправки запроса через API. Median, P5, P25, P75 и P95. @ai_machinelearning_big_data

50 252

🌟 Статистическое моделирование с PyMC PyMC — это пакет Python для байесовского статистического моделирования, сфокусированный на продвинутых алгоритмах Марковской цепи Монте-Карло (MCMC) и вариационного вывода (VI). Гибкость и расширяемость позволяют применять PyMC для решения большого набора задач. 🖥 GitHub 🟡 Доки @data_analysis_ml