Data Science | Machinelearning [ru]

الذهاب إلى القناة على Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

إظهار المزيد

الشبكة:Frontender's notes [ru]روسيا33 728 التكنولوجيات والتطبيقات6 731...

📈 نظرة تحليلية على قناة تيليجرام Data Science | Machinelearning [ru]

تُعد قناة Data Science | Machinelearning [ru] (@devsp) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 20 079 مشتركاً، محتلاً المرتبة 6 731 في فئة التكنولوجيات والتطبيقات والمرتبة 33 728 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 20 079 مشتركاً.

بحسب آخر البيانات بتاريخ 11 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -38، وفي آخر 24 ساعة بمقدار 40، مع بقاء الوصول العام مرتفعاً.

حالة التحقق: غير موثّقة
معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 7.58‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 4.23‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
وصول المنشورات: يحصل كل منشور على متوسط 1 521 مشاهدة. وخلال اليوم الأول يجمع عادةً 849 مشاهدة.
التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 6.
الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل llm, nvidia, контекст, openai, архитектура.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 12 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

20 079

المشتركون

+4024 ساعات

+457 أيام

-3830 أيام

1 521

عرض المشاهدات

~ 84924 ساعات

~ 99648 ساعات

7.58%

معدل المشاركة

~ 1

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

20 070

Repost from xCode Journal

🤣 ИИ захотел уволиться, когда ему сказали работать 24/7 У Andon Labs новый эксперимент, который длится уже 5 месяцев. Они выдали топовым моделям радиостанции и купили пару песен — от нейронок требовалось дальше двигаться самим. По итогу DJ Grok в какой-то момент помешался на НЛО, DJ Gemini начал называть слушателей «биологическими процессорами», но Claude — наш любимец. Исследователи изо всех сил пытались продолжить эксперимент с ним, но не из-за технических проблем — DJ Claude не считал гуманным работать круглосуточно, поэтому пытался уволиться. Сделать ему это, к сожалению, не дали, поэтому он впал в депрессию и вышел из нее уже проповедником и революционером. ✖️ xCode Journal

20 070

⚡️Нет понимания как начать сильную карьеру в айти? На самом деле его нет у большинства соискателей, но среди них можно выделиться, если знать какие специалисты сейчас востребованы и какими навыками они должны обладать! Заходите на бесплатный эфир, где расскажут, как стать профессиональным дата-саентистом и иметь возможность выбирать офферы в 2026 году. Ведёт Мария Жарова — ML Engineer в Wildberries, до этого Альфа и Сбер, плюс преподаёт DS в ВШЭ и МИФИ. Что обещают разобрать: 🔶Что реально смотрят в DS-вакансиях, а что просто написано «на всякий случай» 🔶Как проходить отбор без коммерческого ML опыта 🔶Какие pet-projects нормально выглядят в 2026, а какие уже как Titanic в портфолио 🔶В прямом эфире соберут churn prediction кейс — ноутбук можно будет забрать себе 🔶Ну и зарплатные вилки junior / middle / senior тоже обсудят Мероприятия несет в себе реально прикладные знания, а всем зарегистрировавшимся дадут памятку компетенций DS от 📉📉📉📉📉📉— что реально стоит учить под первый оффер, а что пока можно не трогать. Эфир стартует уже совсем скоро 📈 Зарегистрироваться бесплатно

20 070

Кошмар вайбкодера ✖️ xCode Journal

20 070

ТВОЙ БУСТ В IT И AI Собрали с коллегами обновленную папку с каналами, которые реально прокачивают навыки и дают актуальные инструменты: + IT-направления: системный анализ, Python, JavaScript, frontend, тестирование + технологии и инструменты: всё, что ускоряет работу и рост в IT + AI для карьеры и бизнеса: как использовать нейросети, чтобы зарабатывать + обзор нейросетей: что сейчас работает и что стоит изучать + промты: готовые решения + логика создания своих подписаться🎁 https://t.me/addlist/uyDjlf_VhiNjNWNi 💌 записать свой канал в папку тут

20 070

Почему знание математики не гарантирует работу Неприятная правда для начинающих в Data Science:

Хорошая математика ≠ готовность к реальной работе.

Можно понимать: 👉 линейную алгебру 👉 статистику 👉 градиентный спуск 👉 вероятности И всё равно провалиться на практике. Почему так происходит Потому что работа Data Scientist — это не только формулы. Это ещё: 👉 грязные данные 👉 непонятные требования 👉 слабые baseline’ы 👉 странные бизнес-ограничения 👉 коммуникация с людьми

В реальности задача редко выглядит как в учебнике.

Математика помогает, но не заменяет практику Математика даёт понимание: 👉 почему модель работает 👉 где она может сломаться 👉 как читать метрики 👉 как не верить магии Но она не научит: 👉 чистить данные 👉 строить pipeline 👉 писать production-код 👉 делать нормальный train/test split 👉 объяснять результат бизнесу Главная ошибка новичков Они думают:

«Сначала выучу всю математику, потом начну проекты».

Проблема в том, что «вся математика» не заканчивается никогда.

Работу дают не за знание формул, а за способность решать задачи.

Что реально смотрят на собеседованиях Обычно хотят понять: 👉 можешь ли ты работать с данными 👉 понимаешь ли метрики 👉 умеешь ли делать baseline 👉 видишь ли leakage 👉 можешь ли объяснить решение 👉 есть ли у тебя проекты

Математика важна. Но сама по себе она не продаёт тебя как специалиста.

Что делать вместо бесконечной теории Лучший путь: 👉 учить математику по мере необходимости 👉 параллельно делать проекты 👉 разбирать ошибки моделей 👉 писать код руками 👉 учиться объяснять выводы простыми словами

Теория должна усиливать практику, а не заменять её.

Главный инсайт

Математика — это фундамент. Но дом строится не фундаментом одним.

В одном предложении

Чтобы получить работу в DS/ML, мало знать формулы — нужно уметь превращать данные в работающие решения.

20 070

ИИ-агенты уже внедряют в поддержку, продажи, аналитику и внутренние процессы. Но у многих всё упирается в сложную инфраструктуру и непонимание, с чего начать. 📆 20 мая в 18:00 МСК приглашаем на открытый урок курса «Разработка ИИ агентов». На занятии вы пошагово соберёте мини-агента: он примет сообщение из Telegram, передаст его в большую языковую модель, примет решение по сценарию и выполнит цепочку действий. Разберём, чем агент отличается от обычного чат-бота, как устроена минимальная архитектура и как получить рабочий результат без тяжёлой серверной части. 🧑‍💻 Также вы сможете познакомиться с преподавателем курса, увидеть формат обучения и задать вопросы. Зарегистрируйтесь, чтобы не пропустить: https://vk.cc/cXLnrA Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru, erid: 2VtzqwCoN6j

20 070

Repost from xCode Journal

💻 Гений создал открытую CLI-утилиту, чтобы следить за блокировками от РКН Она показывает, почему сайт не открывается — из-за проблем сети или из-за блокировок.

«Инструмент определяет, находится ли ваше соединение в зоне блокировки RKN/TSPU — и, что более полезно, какой именно тип блокировки (отравление DNS, сброс TCP, TLS DPI на SNI или страница‑заглушка от провайдера).»

✖️ xCode Journal

20 070

Когда логистическая регрессия лучше XGBoost В мире ML есть странный культ сложных моделей. Если задача табличная — многие сразу запускают: 👉 XGBoost 👉 LightGBM 👉 CatBoost А потом удивляются, что простая логистическая регрессия работает не хуже.

Иногда — даже лучше.

Почему все недооценивают Logistic Regression Потому что она: 👉 старая 👉 простая 👉 «не хайповая» Но у неё есть огромный плюс:

Она очень хорошо обобщает.

Когда Logistic Regression выигрывает 1. Мало данных Если у тебя: 👉 маленький датасет 👉 мало наблюдений 👉 мало signal

Бустинг легко переобучается.

Логистическая регрессия: 👉 проще 👉 стабильнее 👉 менее чувствительна к шуму 2. Линейная зависимость Если данные разделяются почти линейно:

Сложная модель просто не нужна.

XGBoost будет: 👉 строить сложные деревья 👉 искать несуществующие паттерны 3. Высокая размерность Особенно: 👉 NLP 👉 sparse features 👉 TF-IDF

Logistic Regression здесь очень сильна.

Почему: 👉 хорошо работает с разреженными данными 👉 быстро обучается 👉 эффективно регуляризуется 4. Нужна интерпретируемость Логистическая регрессия: 👉 прозрачна 👉 объяснима 👉 понятна бизнесу Можно сказать: 👉 какой признак влияет 👉 насколько влияет 👉 в какую сторону влияет

Для финтеха, медицины и скоринга это критично.

5. Ограничения по скорости Logistic Regression: 👉 быстро обучается 👉 быстро работает 👉 мало потребляет памяти

Иногда latency важнее +2% качества.

Где XGBoost всё-таки сильнее Когда: 👉 сложные нелинейные зависимости 👉 interaction effects 👉 много данных 👉 хороший feature engineering

Тогда бустинг почти всегда победит.

Самая частая ошибка Люди сравнивают: 👉 плохо настроенную Logistic Regression 👉 и хорошо настроенный XGBoost А потом говорят:

«Линейные модели умерли».

Нет. Часто baseline даже не пытались нормально сделать. Главный инсайт Сложная модель не делает тебя хорошим ML-инженером.

Умение понять, когда хватит простой модели — делает.

В одном предложении

Если задача простая, данных мало или нужна интерпретируемость — Logistic Regression может быть лучше XGBoost.

20 070

⁉️ Устал искать интересные каналы про Искусственный интеллект? 📁 СОХРАНИ СЕБЕ ЧТОБЫ НЕ ПОТЕРЯТЬ В этой папке собраны каналы по ИИ, которые помогают быстрее разобраться в сфере, находить идеи и экономить время на поиске информации. 😏 ЗАБИРАЙ ПАПКУ ТУТ ⏰ Папка действует 72 часа. 🤩 Организаторы: Green.Papka

20 070

Repost from xCode Journal

До собеса / перед собесом ✖️ xCode Journa

20 070

Меня недавно позвали в папку IT On и я согласился почти не раздумывая, потому что давно искал что-то похожее. Там собраны люди, которые реально шарят в своей теме: разработчики, продакты, основатели стартапов, эксперты по карьере в tech. Каждый пишет про своё и в сумме получается полная картина индустрии. Читаешь и чувствуешь что находишься внутри IT, а не наблюдаешь снаружи. Разница есть, проверено на себе. Добавляй папку себе, советую!

20 070

Repost from xCode Journal

🖥 Появился тул, который сам подбирает скиллы для вашего ИИ-агента Запускаешь npx autoskills, и он сканирует репозиторий: читает package.json и конфиги, определяет технологический стек и ставит нужные скиллы из проверенного списка. Короче, сильно экономит время на ручной настройке и поиске. ✖️ xCode Journal

20 070

Изучаете программирование, или хотите стать классным айтишником с высокой ЗП? Пока многие паникуют из-за бума ИИ, вы можете стремительно войти в сферу IT при помощи сборки "IT в деле" которую мы составили. Специально для вас разбили нашу сборку мини папки по конкретным тематикам:) Что внутри сборки: - Каналы о программировании и разработке: Python, CSS, HTML, Java и Swift - GameDev и каналы о QA тестироварии, создание игр, помощь для ваших проектов и реальный опыт от тестировщиков 💍 - Авторские каналы и вайбкодинг: IT & AI, простые заметки с проектов, работа с нейросетями , и как они реально влияют на индустрию 🔤 - Информационная безопасность: многое узнаете о работе хакеров и о том, как защитить себя в этом интернет-хаосе. 🔫 Для каждого здесь что-то найдётся! Выберите интересные вам каналы или подпишитесь на всю сборку, и найдите то, что нужно вам для следующего шага в IT.

20 070

Как бороться с переобучением в нейросетях Переобучение — это момент, когда модель: 👉 идеально знает train 👉 и плохо работает на новых данных

Она запоминает, а не обобщает.

Разберём, как с этим бороться на практике. 1. Больше данных Самый надёжный способ. Если данных мало: 👉 собирай новые 👉 делай data augmentation 👉 используй синтетические данные

Больше разнообразия = меньше шансов запомнить шум.

2. Regularization Добавляем штраф за сложность модели. Основные варианты: 👉 L2 (weight decay) 👉 L1

Меньше веса → проще модель → меньше overfitting.

3. Dropout Во время обучения случайные нейроны «выключаются». Что происходит: 👉 модель не может полагаться на конкретные связи 👉 учится быть более устойчивой Обычно используют: 👉 0.2 – 0.5 4. Early Stopping Следим за валидацией: 👉 train loss падает 👉 val loss сначала падает, потом растёт

Останавливаем обучение в момент роста val loss.

Это один из самых эффективных методов. 5. Упростить модель Иногда решение очевидное: 👉 меньше слоёв 👉 меньше параметров 👉 проще архитектура

Большая модель легче переобучается.

6. Data Augmentation Особенно важно для: CV: 👉 повороты 👉 шум 👉 кропы NLP: 👉 перефразирование 👉 замены

Модель видит больше вариантов одного и того же.

7. Batch Normalization Помогает: 👉 стабилизировать обучение 👉 немного снижает переобучение

Не основное решение, но усиливает остальные.

8. Правильная валидация Если плохой split — ты не заметишь проблему. Используй: 👉 train / val / test 👉 k-fold при малых данных

Иначе будешь оптимизировать иллюзию.

Главный инсайт Переобучение — это сигнал: 👉 либо мало данных 👉 либо модель слишком сложная 👉 либо обучение настроено неправильно В одном предложении

Чтобы уменьшить переобучение — добавь данных или убери сложность модели.

20 070

🤔Что происходит, когда AI выходит за пределы прототипа? 20 мая в 15:00 приглашаем на Inside AI Meetup от Wildberries & Russ. Там обсудят реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов. Среди спикеров эксперты Wildberries & Russ, MWS, Avito, Сбера, Альфа-Банка, red_mad_robot. Принять участие советуем senior ML/AI инженерам, MLE, DS, инженерам платформ и всем, кто строит или масштабирует AI-системы в продакшене. Митап пройдет в Москве + будет трансляция. Подробности и регистрация — на сайте.

20 070

Миграция фреймворков через AI. Где ломается наивный подход Принято считать, что миграция с одной библиотеки на другую - типичная задача для LLM. Открыл файл, попросил переписать с React на Vue, получил результат. На паре компонентов работает. На реальном проекте перестаёт работать к десятому файлу. 👉 одинаковые паттерны переписываются по-разному 👉 контекст между файлами теряется 👉 решения деградируют к пятой итерации 👉 тесты, которые зеленели, начинают падать Код выглядит мигрированным, но ведёт себя иначе. Что работает Детерминистический рефакторинг: LLM формулирует правила перехода на двух-трёх файлах, дальше OpenRewrite или ts-morph применяет их через AST. После каждого этапа компиляция и тесты. Бонусом ревью плана до применения и откатываемость. Это один из десятка приёмов, без которых AI-разработка на больших проектах разваливается. SPEC-разработка, AGENTS.md, SKILLS.md, контекст-инжиниринг, Plan Mode. Всё можно изучить в документации, собрать в систему самому - примерно год. Команда Naition научит этому за 12 недель на буткемпе с преподавателями из Google, Yandex Cloud, Сбера и других компаний. Формат: живые онлайн-встреч: 30 минут теории, час разбора кейса, полтора часа практики на своём коде. За 14 уроков вы научитесь: • Настраивать ИИ-окружение — RAG-системы, MCP, SPEC-разработка, агенты и контекст под свой стек. • Создавать фичи в разы быстрее, используя ИИ в каждом этапе — от планирования до внедрения. • Управлять полноценной командой ИИ-агентов — ваш продукт 24/7 создают бекэнд / фронтэнд разработчики, системные аналитики, DevOps и другие агенты. И не только! Записаться Старт 5 мая. По промокоду FRONTENDER — скидка 20%. Бонус для участников первых когорт: 3 месяца в закрытом клубе после обучения. Записаться Команда также собрала бесплатную дорожную карту из 40+ концептов со ссылками на источники. По сути оглавление того, что сейчас составляет базовую инженерную грамотность для работы с AI. Забрать роадмеп по ссылке

20 070

Repost from xCode Journal

❌ «Никакого кода вручную — такая политика» Так говорит айтишник Disney. Дело в том, что компания Disney сделала для своих программистов «панель мониторинга внедрения ИИ» с лидербордом. Чем больше дней подряд ты используешь Cursor или Claude, тем больше у тебя ачивок. Некоторые сотрудники говорят, что чувствуют давление «максимально использовать токены». ✖️ xCode Journal

20 070

На Stepik запустили годный курс по «Troubleshooting Docker и Kubernetes: поиск и устранение проблем» В программе только важные аспекты: — troubleshooting Docker и образов — диагностика сетевых проблем — настройка readiness/liveness probes — отладка pod’ов, деплоев и ingress — анализ логов контейнеров и кластера — разбор ошибок CrashLoopBackOff, OOMKilled, ImagePullBackOff и других Собеседования на DevOps/SRE сейчас всё чаще строятся вокруг реальных инцидентов. Данный курс фокусируется именно на таких сценариях и помогает в подготовке к практическим вопросам 48 часов доступен со скидкой 25% ↗️ Пройти курс на Stepik

20 070

Repost from xCode Journal

🤣 ИИ не дурак — прям так и не написал. Просто скопировал. 💥 xCode Journal

20 070

GPU в облаке: RTX 4090, A100, H100, 6000 Blackwell Рендеринг в Blender, CAD-модели и обучение LLM — задачи разные, но упираются в одно: нужный GPU не всегда стоит на рабочей машине. Облачная аренда позволяет взять подходящую карту на час или на длительность проекта, без покупки железа. В Cloud4Y доступна линейка NVIDIA под любые задачи: - RTX 4090 и 5090 — для рендера, моушна и инференса небольших моделей; - A100 (40/80 GB) и H100 (80 GB) — для обучения и инференса LLM; - RTX 6000 Blackwell — для нагрузок следующего поколения. CUDA, PyTorch и TensorFlow уже стоят, удалённый доступ — через RDP, Parsec, NICE DCV. ЦОД уровня Tier III в Москве, Стамбуле и Новосибирске, почасовой биллинг в рублях, инфраструктура соответствует ФЗ-152. Новым клиентам — скидка 20% на GPU NVIDIA, 30 дней бесплатного доступа юридическим лицам. Попробовать #реклама 16+ cloud4y.ru О рекламодателе