Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

网络:Frontender's notes [ru]俄罗斯33 728 技术与应用6 731...

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语语言赛道中的是活跃参与者。目前社区聚集了 20 077 名订阅者，在 技术与应用 类别中位列第 6 731，并在 俄罗斯 地区排名第 33 728 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 20 077 名订阅者。

根据 11 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -38，过去 24 小时变化为 40，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 7.58%。内容发布后 24 小时内通常能获得 4.23% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 1 521 次浏览，首日通常累积 849 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 6。
主题关注点： 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

凭借高频更新（最新数据采集于 12 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

20 077

订阅者

+4024 小时

+457 天

-3830 天

1 521

帖子浏览量

~ 84924 小时

~ 99648 小时

7.58%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

20 077

⚡️Нет понимания как начать сильную карьеру в айти? На самом деле его нет у большинства соискателей, но среди них можно выделиться, если знать какие специалисты сейчас востребованы и какими навыками они должны обладать! Заходите на бесплатный эфир, где расскажут, как стать профессиональным дата-саентистом и иметь возможность выбирать офферы в 2026 году. Ведёт Мария Жарова — ML Engineer в Wildberries, до этого Альфа и Сбер, плюс преподаёт DS в ВШЭ и МИФИ. Что обещают разобрать: 🔶Что реально смотрят в DS-вакансиях, а что просто написано «на всякий случай» 🔶Как проходить отбор без коммерческого ML опыта 🔶Какие pet-projects нормально выглядят в 2026, а какие уже как Titanic в портфолио 🔶В прямом эфире соберут churn prediction кейс — ноутбук можно будет забрать себе 🔶Ну и зарплатные вилки junior / middle / senior тоже обсудят Мероприятия несет в себе реально прикладные знания, а всем зарегистрировавшимся дадут памятку компетенций DS от 📉📉📉📉📉📉— что реально стоит учить под первый оффер, а что пока можно не трогать. Эфир стартует уже совсем скоро 📈 Зарегистрироваться бесплатно

20 077

Кошмар вайбкодера ✖️ xCode Journal

20 077

ТВОЙ БУСТ В IT И AI Собрали с коллегами обновленную папку с каналами, которые реально прокачивают навыки и дают актуальные инструменты: + IT-направления: системный анализ, Python, JavaScript, frontend, тестирование + технологии и инструменты: всё, что ускоряет работу и рост в IT + AI для карьеры и бизнеса: как использовать нейросети, чтобы зарабатывать + обзор нейросетей: что сейчас работает и что стоит изучать + промты: готовые решения + логика создания своих подписаться🎁 https://t.me/addlist/uyDjlf_VhiNjNWNi 💌 записать свой канал в папку тут

20 077

Почему знание математики не гарантирует работу Неприятная правда для начинающих в Data Science:

Хорошая математика ≠ готовность к реальной работе.

Можно понимать: 👉 линейную алгебру 👉 статистику 👉 градиентный спуск 👉 вероятности И всё равно провалиться на практике. Почему так происходит Потому что работа Data Scientist — это не только формулы. Это ещё: 👉 грязные данные 👉 непонятные требования 👉 слабые baseline’ы 👉 странные бизнес-ограничения 👉 коммуникация с людьми

В реальности задача редко выглядит как в учебнике.

Математика помогает, но не заменяет практику Математика даёт понимание: 👉 почему модель работает 👉 где она может сломаться 👉 как читать метрики 👉 как не верить магии Но она не научит: 👉 чистить данные 👉 строить pipeline 👉 писать production-код 👉 делать нормальный train/test split 👉 объяснять результат бизнесу Главная ошибка новичков Они думают:

«Сначала выучу всю математику, потом начну проекты».

Проблема в том, что «вся математика» не заканчивается никогда.

Работу дают не за знание формул, а за способность решать задачи.

Что реально смотрят на собеседованиях Обычно хотят понять: 👉 можешь ли ты работать с данными 👉 понимаешь ли метрики 👉 умеешь ли делать baseline 👉 видишь ли leakage 👉 можешь ли объяснить решение 👉 есть ли у тебя проекты

Математика важна. Но сама по себе она не продаёт тебя как специалиста.

Что делать вместо бесконечной теории Лучший путь: 👉 учить математику по мере необходимости 👉 параллельно делать проекты 👉 разбирать ошибки моделей 👉 писать код руками 👉 учиться объяснять выводы простыми словами

Теория должна усиливать практику, а не заменять её.

Главный инсайт

Математика — это фундамент. Но дом строится не фундаментом одним.

В одном предложении

Чтобы получить работу в DS/ML, мало знать формулы — нужно уметь превращать данные в работающие решения.

20 077

ИИ-агенты уже внедряют в поддержку, продажи, аналитику и внутренние процессы. Но у многих всё упирается в сложную инфраструктуру и непонимание, с чего начать. 📆 20 мая в 18:00 МСК приглашаем на открытый урок курса «Разработка ИИ агентов». На занятии вы пошагово соберёте мини-агента: он примет сообщение из Telegram, передаст его в большую языковую модель, примет решение по сценарию и выполнит цепочку действий. Разберём, чем агент отличается от обычного чат-бота, как устроена минимальная архитектура и как получить рабочий результат без тяжёлой серверной части. 🧑‍💻 Также вы сможете познакомиться с преподавателем курса, увидеть формат обучения и задать вопросы. Зарегистрируйтесь, чтобы не пропустить: https://vk.cc/cXLnrA Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru, erid: 2VtzqwCoN6j

20 077

Repost from xCode Journal

💻 Гений создал открытую CLI-утилиту, чтобы следить за блокировками от РКН Она показывает, почему сайт не открывается — из-за проблем сети или из-за блокировок.

«Инструмент определяет, находится ли ваше соединение в зоне блокировки RKN/TSPU — и, что более полезно, какой именно тип блокировки (отравление DNS, сброс TCP, TLS DPI на SNI или страница‑заглушка от провайдера).»

✖️ xCode Journal

20 077

Когда логистическая регрессия лучше XGBoost В мире ML есть странный культ сложных моделей. Если задача табличная — многие сразу запускают: 👉 XGBoost 👉 LightGBM 👉 CatBoost А потом удивляются, что простая логистическая регрессия работает не хуже.

Иногда — даже лучше.

Почему все недооценивают Logistic Regression Потому что она: 👉 старая 👉 простая 👉 «не хайповая» Но у неё есть огромный плюс:

Она очень хорошо обобщает.

Когда Logistic Regression выигрывает 1. Мало данных Если у тебя: 👉 маленький датасет 👉 мало наблюдений 👉 мало signal

Бустинг легко переобучается.

Логистическая регрессия: 👉 проще 👉 стабильнее 👉 менее чувствительна к шуму 2. Линейная зависимость Если данные разделяются почти линейно:

Сложная модель просто не нужна.

XGBoost будет: 👉 строить сложные деревья 👉 искать несуществующие паттерны 3. Высокая размерность Особенно: 👉 NLP 👉 sparse features 👉 TF-IDF

Logistic Regression здесь очень сильна.

Почему: 👉 хорошо работает с разреженными данными 👉 быстро обучается 👉 эффективно регуляризуется 4. Нужна интерпретируемость Логистическая регрессия: 👉 прозрачна 👉 объяснима 👉 понятна бизнесу Можно сказать: 👉 какой признак влияет 👉 насколько влияет 👉 в какую сторону влияет

Для финтеха, медицины и скоринга это критично.

5. Ограничения по скорости Logistic Regression: 👉 быстро обучается 👉 быстро работает 👉 мало потребляет памяти

Иногда latency важнее +2% качества.

Где XGBoost всё-таки сильнее Когда: 👉 сложные нелинейные зависимости 👉 interaction effects 👉 много данных 👉 хороший feature engineering

Тогда бустинг почти всегда победит.

Самая частая ошибка Люди сравнивают: 👉 плохо настроенную Logistic Regression 👉 и хорошо настроенный XGBoost А потом говорят:

«Линейные модели умерли».

Нет. Часто baseline даже не пытались нормально сделать. Главный инсайт Сложная модель не делает тебя хорошим ML-инженером.

Умение понять, когда хватит простой модели — делает.

В одном предложении

Если задача простая, данных мало или нужна интерпретируемость — Logistic Regression может быть лучше XGBoost.

20 077

⁉️ Устал искать интересные каналы про Искусственный интеллект? 📁 СОХРАНИ СЕБЕ ЧТОБЫ НЕ ПОТЕРЯТЬ В этой папке собраны каналы по ИИ, которые помогают быстрее разобраться в сфере, находить идеи и экономить время на поиске информации. 😏 ЗАБИРАЙ ПАПКУ ТУТ ⏰ Папка действует 72 часа. 🤩 Организаторы: Green.Papka

20 077

Repost from xCode Journal

До собеса / перед собесом ✖️ xCode Journa

20 077

Меня недавно позвали в папку IT On и я согласился почти не раздумывая, потому что давно искал что-то похожее. Там собраны люди, которые реально шарят в своей теме: разработчики, продакты, основатели стартапов, эксперты по карьере в tech. Каждый пишет про своё и в сумме получается полная картина индустрии. Читаешь и чувствуешь что находишься внутри IT, а не наблюдаешь снаружи. Разница есть, проверено на себе. Добавляй папку себе, советую!

20 077

Repost from xCode Journal

🖥 Появился тул, который сам подбирает скиллы для вашего ИИ-агента Запускаешь npx autoskills, и он сканирует репозиторий: читает package.json и конфиги, определяет технологический стек и ставит нужные скиллы из проверенного списка. Короче, сильно экономит время на ручной настройке и поиске. ✖️ xCode Journal

20 077

Изучаете программирование, или хотите стать классным айтишником с высокой ЗП? Пока многие паникуют из-за бума ИИ, вы можете стремительно войти в сферу IT при помощи сборки "IT в деле" которую мы составили. Специально для вас разбили нашу сборку мини папки по конкретным тематикам:) Что внутри сборки: - Каналы о программировании и разработке: Python, CSS, HTML, Java и Swift - GameDev и каналы о QA тестироварии, создание игр, помощь для ваших проектов и реальный опыт от тестировщиков 💍 - Авторские каналы и вайбкодинг: IT & AI, простые заметки с проектов, работа с нейросетями , и как они реально влияют на индустрию 🔤 - Информационная безопасность: многое узнаете о работе хакеров и о том, как защитить себя в этом интернет-хаосе. 🔫 Для каждого здесь что-то найдётся! Выберите интересные вам каналы или подпишитесь на всю сборку, и найдите то, что нужно вам для следующего шага в IT.

20 077

Как бороться с переобучением в нейросетях Переобучение — это момент, когда модель: 👉 идеально знает train 👉 и плохо работает на новых данных

Она запоминает, а не обобщает.

Разберём, как с этим бороться на практике. 1. Больше данных Самый надёжный способ. Если данных мало: 👉 собирай новые 👉 делай data augmentation 👉 используй синтетические данные

Больше разнообразия = меньше шансов запомнить шум.

2. Regularization Добавляем штраф за сложность модели. Основные варианты: 👉 L2 (weight decay) 👉 L1

Меньше веса → проще модель → меньше overfitting.

3. Dropout Во время обучения случайные нейроны «выключаются». Что происходит: 👉 модель не может полагаться на конкретные связи 👉 учится быть более устойчивой Обычно используют: 👉 0.2 – 0.5 4. Early Stopping Следим за валидацией: 👉 train loss падает 👉 val loss сначала падает, потом растёт

Останавливаем обучение в момент роста val loss.

Это один из самых эффективных методов. 5. Упростить модель Иногда решение очевидное: 👉 меньше слоёв 👉 меньше параметров 👉 проще архитектура

Большая модель легче переобучается.

6. Data Augmentation Особенно важно для: CV: 👉 повороты 👉 шум 👉 кропы NLP: 👉 перефразирование 👉 замены

Модель видит больше вариантов одного и того же.

7. Batch Normalization Помогает: 👉 стабилизировать обучение 👉 немного снижает переобучение

Не основное решение, но усиливает остальные.

8. Правильная валидация Если плохой split — ты не заметишь проблему. Используй: 👉 train / val / test 👉 k-fold при малых данных

Иначе будешь оптимизировать иллюзию.

Главный инсайт Переобучение — это сигнал: 👉 либо мало данных 👉 либо модель слишком сложная 👉 либо обучение настроено неправильно В одном предложении

Чтобы уменьшить переобучение — добавь данных или убери сложность модели.

20 077

🤔Что происходит, когда AI выходит за пределы прототипа? 20 мая в 15:00 приглашаем на Inside AI Meetup от Wildberries & Russ. Там обсудят реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов. Среди спикеров эксперты Wildberries & Russ, MWS, Avito, Сбера, Альфа-Банка, red_mad_robot. Принять участие советуем senior ML/AI инженерам, MLE, DS, инженерам платформ и всем, кто строит или масштабирует AI-системы в продакшене. Митап пройдет в Москве + будет трансляция. Подробности и регистрация — на сайте.

20 077

Миграция фреймворков через AI. Где ломается наивный подход Принято считать, что миграция с одной библиотеки на другую - типичная задача для LLM. Открыл файл, попросил переписать с React на Vue, получил результат. На паре компонентов работает. На реальном проекте перестаёт работать к десятому файлу. 👉 одинаковые паттерны переписываются по-разному 👉 контекст между файлами теряется 👉 решения деградируют к пятой итерации 👉 тесты, которые зеленели, начинают падать Код выглядит мигрированным, но ведёт себя иначе. Что работает Детерминистический рефакторинг: LLM формулирует правила перехода на двух-трёх файлах, дальше OpenRewrite или ts-morph применяет их через AST. После каждого этапа компиляция и тесты. Бонусом ревью плана до применения и откатываемость. Это один из десятка приёмов, без которых AI-разработка на больших проектах разваливается. SPEC-разработка, AGENTS.md, SKILLS.md, контекст-инжиниринг, Plan Mode. Всё можно изучить в документации, собрать в систему самому - примерно год. Команда Naition научит этому за 12 недель на буткемпе с преподавателями из Google, Yandex Cloud, Сбера и других компаний. Формат: живые онлайн-встреч: 30 минут теории, час разбора кейса, полтора часа практики на своём коде. За 14 уроков вы научитесь: • Настраивать ИИ-окружение — RAG-системы, MCP, SPEC-разработка, агенты и контекст под свой стек. • Создавать фичи в разы быстрее, используя ИИ в каждом этапе — от планирования до внедрения. • Управлять полноценной командой ИИ-агентов — ваш продукт 24/7 создают бекэнд / фронтэнд разработчики, системные аналитики, DevOps и другие агенты. И не только! Записаться Старт 5 мая. По промокоду FRONTENDER — скидка 20%. Бонус для участников первых когорт: 3 месяца в закрытом клубе после обучения. Записаться Команда также собрала бесплатную дорожную карту из 40+ концептов со ссылками на источники. По сути оглавление того, что сейчас составляет базовую инженерную грамотность для работы с AI. Забрать роадмеп по ссылке

20 077

Repost from xCode Journal

❌ «Никакого кода вручную — такая политика» Так говорит айтишник Disney. Дело в том, что компания Disney сделала для своих программистов «панель мониторинга внедрения ИИ» с лидербордом. Чем больше дней подряд ты используешь Cursor или Claude, тем больше у тебя ачивок. Некоторые сотрудники говорят, что чувствуют давление «максимально использовать токены». ✖️ xCode Journal

20 077

На Stepik запустили годный курс по «Troubleshooting Docker и Kubernetes: поиск и устранение проблем» В программе только важные аспекты: — troubleshooting Docker и образов — диагностика сетевых проблем — настройка readiness/liveness probes — отладка pod’ов, деплоев и ingress — анализ логов контейнеров и кластера — разбор ошибок CrashLoopBackOff, OOMKilled, ImagePullBackOff и других Собеседования на DevOps/SRE сейчас всё чаще строятся вокруг реальных инцидентов. Данный курс фокусируется именно на таких сценариях и помогает в подготовке к практическим вопросам 48 часов доступен со скидкой 25% ↗️ Пройти курс на Stepik

20 077

Repost from xCode Journal

🤣 ИИ не дурак — прям так и не написал. Просто скопировал. 💥 xCode Journal

20 077

GPU в облаке: RTX 4090, A100, H100, 6000 Blackwell Рендеринг в Blender, CAD-модели и обучение LLM — задачи разные, но упираются в одно: нужный GPU не всегда стоит на рабочей машине. Облачная аренда позволяет взять подходящую карту на час или на длительность проекта, без покупки железа. В Cloud4Y доступна линейка NVIDIA под любые задачи: - RTX 4090 и 5090 — для рендера, моушна и инференса небольших моделей; - A100 (40/80 GB) и H100 (80 GB) — для обучения и инференса LLM; - RTX 6000 Blackwell — для нагрузок следующего поколения. CUDA, PyTorch и TensorFlow уже стоят, удалённый доступ — через RDP, Parsec, NICE DCV. ЦОД уровня Tier III в Москве, Стамбуле и Новосибирске, почасовой биллинг в рублях, инфраструктура соответствует ФЗ-152. Новым клиентам — скидка 20% на GPU NVIDIA, 30 дней бесплатного доступа юридическим лицам. Попробовать #реклама 16+ cloud4y.ru О рекламодателе

20 077

Repost from xCode Journal

🐱 GitHub покидают разрабы и опенсорс проекты Разработчик Митчелл Хашимото, создатель популярного эмулятора терминала Ghostty, переносит проект из-за проблем со стабильностью платформы.

«Я пользователь GitHub под номером 1299, присоединился в феврале 2008 года. Я заходил на GitHub почти каждый день в течение более 18 лет. Для меня никогда не было вопроса, куда размещать свои проекты: всегда GitHub. Мне очень грустно это говорить, но пришло время уходить», — пишет он.

✖️ xCode Journal