Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

网络:Frontender's notes [ru]俄罗斯33 739 技术与应用6 738...

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语语言赛道中的是活跃参与者。目前社区聚集了 20 041 名订阅者，在 技术与应用 类别中位列第 6 738，并在 俄罗斯 地区排名第 33 739 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 20 041 名订阅者。

根据 14 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -87，过去 24 小时变化为 -13，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 7.71%。内容发布后 24 小时内通常能获得 4.62% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 1 546 次浏览，首日通常累积 926 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 7。
主题关注点： 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

凭借高频更新（最新数据采集于 15 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

20 041

订阅者

-1324 小时

+257 天

-8730 天

1 546

帖子浏览量

~ 92624 小时

~ 1 11548 小时

7.71%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

20 043

➡️ Самые интересные статьи за последние дни: • Эксперимент: даём ChatGPT полный доступ к компьютеру • Правильный путь создания python-библиотеки: от создания до публикации • Запускаем Yolo на пятирублёвой монете или Luckfox Pico Mini • Более мощное семейство моделей YandexGPT 4: рост качества ответов, длинный контекст, пошаговые рассуждения • Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито

20 043

Яндекс открывает новый сезон Тренировок по ML Смотрите лекции, решайте задачи, поднимайтесь в рейтинге. В третьем сезоне Тренировки по ML сосредоточатся на теме Computer Vision. Вас ждут 4 темы с контестами по 10 задач. Вы изучите не только классические методы компьютерного зрения, но и генеративные модели, локальные дескрипторы изображений, детекцию, сегментацию, контрастное предобучение и многое другое. Лучшие участники получат сертификат о прохождении Тренировок (нужно решить 20 из 40 задач), возможность пройти пробное техническое собеседование в Яндекс, проходку на топовый гик-фест о старте карьеры в IT Young Con и не только. Участники, которые хорошо себя проявят, получат возможность пройти ускоренный отбор на стажировку или сразу в штат компании. Подать заявку на Тренировки можно здесь.

20 043

🔎 Подборка зарубежных вакансий Data Analyst 🟢SQL, Python, ClickHouse, MySQL, Snowflake, Tableau, Power BI 🟢Уровень дохода не указан | 3–6 лет E-commerce Data Analyst (Amazon, Walmart) 🟢Excel, Google Sheets, Looker Studio, Power BI, Tableau 🟢от 1 000 до 1 300 $ | 1–3 года AI Game Designer (UE) 🟢Unreal Engine, Blueprints, Gameplay Ability System 🟢Уровень дохода не указан | 3–6 лет

20 043

📉 Иногда нужно сознательно писать меньше кода Чем больше кода — тем больше точек отказа, багов и времени на поддержку. А мы здесь не ради фич ради фич. 👉 Совет: прежде чем что-то реализовать — подумай, а нужно ли это вообще? Может, задачу можно решить конфигом, сторонним инструментом или просто выкинуть. Самый чистый код — тот, которого не пришлось писать.

20 043

👩‍💻 7 малоизвестных возможностей стандартной библиотеки Python Стандартная библиотека Python – это кладезь возможностей. Мы представляем семь недооцененных модулей, которые помогут вам улучшить организацию данных, оптимизировать производительность и упростить распространение ваших программ. Читать...

20 043

⚡ Мы делимся с вами папкой «TECH & SCI», в которой собрали статьи о самых инновационных разработках, новостях, которые были реализованы в 2024-2025 году в сфере технологий, науки. 📂 Внутри вас ждет: 🟠 ИИ-агенты - новый способ оптимизации процессов в 2024-2025. 🟠 Золотая жила для разработчиков в 2025 GenAI: подборка из 44 готовых ИИ-агентов с исходным кодом. 🟠 Прорывы в сфере астрономии в 2025 году. 🟠 Последние изобретения в Data Science. 🟠 И еще 24 полезные статьи, которые прокачают ваши навыки. 🔗 А мы с вами делимся статьёй: «Как я с помощью нейросетей обогнала инфляцию». ✔ Сохраняйте папку «TECH & SCI», изучайте материалы и выходите на новый уровень!

20 043

❓ Как работает кросс-валидация в ML? Кросс-валидация — это техника оценки модели, которая помогает избежать переобучения и лучше оценить её обобщающую способность. В классической k-блочной кросс-валидации данные разбиваются на k равных частей, и модель обучается k раз, каждый раз используя одну часть для тестирования и остальные для обучения. ➡️ Пример применения кросс-валидации с использованием библиотеки scikit-learn:

from sklearn.model_selection import cross_val_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris

data = load_iris()
X, y = data.data, data.target
clf = RandomForestClassifier()

scores = cross_val_score(clf, X, y, cv=5)
print(f'Средняя точность: {scores.mean()}')

Здесь модель обучается 5 раз (5-fold) на разных частях данных, и вычисляется средняя точность.

🗣️ Кросс-валидация помогает лучше понять, как модель будет работать на новых данных, улучшая её обобщение.

🖥 Подробнее тут

20 043

Готов увидеть будущее искусственного интеллекта? 🧠 GoCloud — масштабная конференция про облака и AI. Здесь ML-инженеры, дата сайентисты, разработчики и архитекторы обмениваются лучшими практиками и знаниями. В программе: ▫️ презентация платформы для работы с AI&ML — от идеи до результата ▫️ анонс новых сервисов для работы с GenAI ▫️ реальный кейс трансформации клиентского сервиса с помощью AI ▫️ анонс сервиса для простого и быстрого запуска ML-моделей в облаке 30+ докладов, нетворкинг с экспертами и live-демо сервисов ждут тебя 10 апреля. Регистрация по ссылке 👈

20 043

🚀 Оптимизируй свой AI: разоблачение 6 мифов о работе с векторами в Pgvector Шесть заблуждений, которые мешают тебе использовать всю мощь векторных баз данных в AI. Развенчав эти мифы, ты сможешь раскрыть истинный потенциал векторов и значительно повысить эффективность твоих AI-проектов. Читать...

20 043

🤖 ChatGPT VS DeepSeek Приглашаем на открытый урок. 🗓 01 апреля в 18:00 МСК 🆓 Бесплатно. Урок в рамках старта курса «NLP. Advanced». ChatGPT, DeepSeek, Gemini… Что у них внутри и какие технологии их создают? На открытом уроке разберем архитектуру современных LLM, методы их обучения и принципы, которые двигают индустрию NLP вперед. Спикер Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ. Если вы хотите глубже понять работу LLM, разобраться в ключевых концепциях DeepSeek и узнать о будущих трендах, этот вебинар для вас. Участвуйте и получите скидку для обучения на курсе «NLP. Advanced». 🔗 Ссылка на регистрацию: https://vk.cc/cKhpfL Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqxCbVse

20 043

📝 Подборка вакансий для сеньоров Системный аналитик (Data Office) • SQL, BPMN, REST, анализ требований • Уровень дохода не указан | опыт не указан Senior Data Scientist в команду антифрода • Python, SQL, TensorFlow, PyTorch, машинное обучение • Уровень дохода не указан | от 2 лет Продуктовый аналитик • Yandex DataLens, Python, Amplitude, ClickHouse, Oracle, Microsoft Excel, Tableau, Metabase, PowerBI, анализ данных • Уровень дохода не указан | от 2 лет

20 043

МТС True Tech Hack 2025 — создай новое решение на базе The Platform от МТС и поборись за призовой фонд в 1 500 000 рублей. Регистрация открыта до 16 апреля. Твоя формула успеха: ✅ Хочешь внести вклад в продукты, которые приносят пользу разработчикам по всей России ✅ Знаешь, как превратить идею в работающий прототип ✅ Любишь работать в команде. На хакатон приглашают разработчиков, Data Scientists, Data Engineers, системных и бизнес-аналитиков, UI/UX-дизайнеров и других специалистов. Участие — командное, в каждой будет от 2 до 5 человек. Треки МТС True Tech Hack 2025: ✅ DataOps Pipeline: оптимизация от сбора до отчета ✅ AI Schema Builder: генерация схем ✅ Цифровизация через True Tabs: интеграция данных и процессов в единую экосистему ✅ TouchVision: AI-ассистент для незрячих и слабовидящих пользователей ✅ Золотая середина: дистилляция моделей MWS GPT Не пропусти митап 9 апреля с экспертами хакатона — задай вопросы и узнай больше о задачах. Регистрируйся на МТС True Tech Hack 2025

20 043

📈 Подборка статей для вашей карьеры • Продуктивность и почему «сделать много всего» — это не про неё • Куда выйти из айти? • Как я боролся с выгоранием в ИТ: лайфхаки и личный опыт • ИТ-пенсионеры и где они обитают • Почему мне нужно, чтобы ты вкатился в айти

20 043

↗️ Как я с помощью нейросетей обогнала инфляцию В статье рассказывается, как использовать нейросети для оптимизации работы, если ваш доход в рублях, а расходы — в валюте. Спойлер: полное делегирование задач ИИ — миф, но с его помощью можно значительно упростить рутину и повысить продуктивность. Поделены реальные кейсы из жизни автора. Читать...

20 043

⚡️Разбираем тестовое задание в Альфа Банк на позицию Junior Аналитика данных Чтобы найти работу, мало пройти курс и сделать классное резюме. На практике, чтобы выделиться на собеседовании, нужно понимать, что лежит под капотом каждого инструмента, а не следовать конкретному заученному алгоритму. Чтобы попрактиковаться в этом, приходите на бесплатный вебинар, где будем разбирать реальное тестовое задание, которое дают аналитикам в Альфа Банке. Что будем делать на вебинаре: 🟠Напишем сложные SQL-запросы для банковских данных; 🟠Вспомним, как правильно использовать оконные функции; 🟠Узнаем, как создавать разметку, из чего она состоит и для чего она нужна; 🟠На реальных данных проведем когортный анализ и сделаем выводы; 🟠Расскажем, как доставать инсайты из данных. Вебинар проведет Денис Иванов, ведущий продуктовый аналитик 😶Зарегистрироваться на бесплатный вебинар

20 043

🌞 Автоэнкодеры простыми словами Автоэнкодеры являются базовой техникой машинного обучения и искусственного интеллекта, на основе которой строятся более сложные модели, например, в диффузионных моделях, таких как Stable Diffusion. Что же такое автоэнкодер? Читать...

20 043

👩‍💻 Задачка по Python Напишите функцию, которая принимает DataFrame и возвращает имена двух столбцов с наибольшей положительной корреляцией. ➡️ Пример:

data = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [2, 4, 6, 8],
    'C': [1, 0, 1, 0],
    'D': [10, 20, 30, 40]
})

print(find_highest_correlation(data))  
# Ожидаемый результат: ('B', 'D')

Решение задачи ⬇️

def find_highest_correlation(df): corr_matrix = df.corr() max_corr = 0 columns = (None, None) for col1 in corr_matrix.columns: for col2 in corr_matrix.columns: if col1 != col2 and corr_matrix[col1][col2] > max_corr: max_corr = corr_matrix[col1][col2] columns = (col1, col2) return columns # Пример использования: import pandas as pd data = pd.DataFrame({ 'A': [1, 2, 3, 4], 'B': [2, 4, 6, 8], 'C': [1, 0, 1, 0], 'D': [10, 20, 30, 40] }) print(find_highest_correlation(data)) # Ожидаемый результат: ('B', 'D')

20 043

⚙️ Как обеспечить Data Quality терабайтов данных и зачем: опыт СИБУРа Статья посвящена опыту СИБУРа в создании DQ-сервиса для обеспечения качества данных. Рассматриваются задачи DQ, архитектура решения и универсальные подходы, применимые для анализа данных в крупных компаниях. Читать...

20 043

Ваша карьера в аналитике данных может выйти на новый уровень DWH — это основа качественной аналитики. Без правильно спроектированного хранилища данные хаотичны, отчеты несистемны, а решения принимаются вслепую. 📍 На открытом уроке 26 марта в 20:00 мск разберем, какие существуют подходы к построению хранилищ, как они влияют на скорость обработки данных и какие задачи решают. После урока вы: - Разберетесь в ключевых архитектурах DWH. - Научитесь выбирать подходящую под задачи бизнеса. - Поймете, как архитектура влияет на масштабируемость и производительность. Спикер Алексей Железной — Senior Data Engineer с большим опытом и широким технологическим стеком. ➡️ Регистрируйтесь и получите скидку на большое обучение «Data Warehouse Analyst»: https://vk.cc/cKdonV Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

20 043

📝 Подборка вакансий для мидлов Data Analyst • Python, R, Java, SQL, NoSQL • Уровень дохода не указан | от 2 лет Data Engineer (Middle) • Python, PostgreSQL, MongoDB, ClickHouse, AWS, Kafka, Spark • Уровень дохода не указан | от 2 лет Python разработчик (Трайб Data Office) • Python, HTML, JavaScript, CSS, Vue.js, Linux • Уровень дохода не указан | опыт не указан