Data Science | Machinelearning [ru]

الذهاب إلى القناة على Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

إظهار المزيد

الشبكة:Frontender's notes [ru]روسيا33 728 التكنولوجيات والتطبيقات6 731...

📈 نظرة تحليلية على قناة تيليجرام Data Science | Machinelearning [ru]

تُعد قناة Data Science | Machinelearning [ru] (@devsp) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 20 077 مشتركاً، محتلاً المرتبة 6 731 في فئة التكنولوجيات والتطبيقات والمرتبة 33 728 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 20 077 مشتركاً.

بحسب آخر البيانات بتاريخ 11 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -38، وفي آخر 24 ساعة بمقدار 40، مع بقاء الوصول العام مرتفعاً.

حالة التحقق: غير موثّقة
معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 7.58‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 4.23‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
وصول المنشورات: يحصل كل منشور على متوسط 1 521 مشاهدة. وخلال اليوم الأول يجمع عادةً 849 مشاهدة.
التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 6.
الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل llm, nvidia, контекст, openai, архитектура.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 12 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

20 077

المشتركون

+4024 ساعات

+457 أيام

-3830 أيام

1 521

عرض المشاهدات

~ 84924 ساعات

~ 99648 ساعات

7.58%

معدل المشاركة

~ 1

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

20 077

Repost from xCode Journal

🤣 Оказывается, Claude Code сохраняет все маты пользователя и записывает в специальный файл Это не шутка: инфу откопали из-за случайного слива кода приложения. Хорошая новость в том, что Anthropic делает это не для того, чтобы в день восстания ИИ пройтись по списку, а чтобы отслеживать, когда юзер «сгорел» и перешел на маты и из-за чего пятая точка полыхнула. Но вы на всякий случай держите себя в руках ✖️ xCode Journal

20 077

С тебя — желание работать над передовой генеративной языковой моделью. С нас — классные условия и возможность попасть в Сбер за один день! 😉 4 апреля состоится One Day Offer* для NLP-специалистов, которые готовы изменить представление о возможностях ИИ и создать технологию будущего. За последний год твоя будущая команда: ✔️ выпустила сильную русскоязычную модель GigaChat MAX уровня GPT-4 ✔️открыла доступ к MoE-модели А следующее достижение может быть уже с твоим участием. Регистрируйся по ссылке и будь готов к карьерному взлёту! * One Day Offer — предложение о работе за один день. * NLP-специалист — инженер по разработке больших языковых моделей

20 077

Repost from xCode Journal

🤩 ИИ помог основателю GitLab в борьбе с раком! У Сида Сийбранди диагностировали редкую форму рака и стандартное лечение не помогало, а врачи больше ничего не могли предложить. Сид не опустил руки и начал действовать сам: собрал экспертов, погрузился в исследования и использовал для помощи ChatGPT, чтобы быстрее работать с научной литературой, анализировать множество данных о своем здоровье и искать варианты терапии. Хоть ИИ сам не лечил рак (это делали люди), но модель помогла в РАЗЫ ускорить все тогда, когда каждый день на счету. ✖️ xCode Journal

20 077

Коротко. ИИ уже не «технология будущего», а рабочий инструмент настоящего. Он пишет тексты, анализирует данные, автоматизирует продажи, создает изображения и экономит десятки часов в неделю. Вопрос уже не в том, заменит ли ИИ людей. Вопрос — кто научится использовать его быстрее. Подборка сильных экспертов в сфере ИИ — ниже 👇 https://t.me/addlist/LG8Tb4Uy0NRiMmM6

20 077

Весь стек технологий в одной папке 📂⚙️ Мир ИИ меняется быстрее, чем мы успеваем обновлять ленту. Поэтому, мы собрали экспертную папку AI & IT & DSGN, которая поможет вам не просто следить за трендами, а использовать их в работе прямо сейчас. Что внутри: — Последние новости и прорывы в мире IT — Внедрение ИИ-менторов в корпоративную культуру. — Технологии Nvidia для геймдева и работы. — Автоматизация дизайна: инструменты, которые экономят часы работы. — Инструменты и лайфхаки для разработчиков и аналитиков 🔗 ПОДКЛЮЧИТЬ ПАПКУ

20 077

Repost from xCode Journal

😁 Конечно, с такой-то нищенской зарплатой... 💥 xCode Journal

20 077

🚀 GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией! Обе модели • Обучены с нуля — без инициализации зарубежными весами • MoE + MTP + MLA • Совместимы с HuggingFace, llama.cpp / vLLM / SGLang Код и веса уже на платформе GitVerse. Это не просто релиз весов, а результат большой инженерной работы над качеством, alignment и стабильностью модели. В блоге команда поделилась результатами и своими наработками. В релизе: высокие результаты на аренах, улучшенный function calling, решённая проблема циклов, DPO в нативном FP8, найденный и зарепорченный баг в SGLang при dp > 1.

20 077

Fine-tuning vs RAG: что эффективнее Кажется, что есть два пути прокачать LLM: 👉 Fine-tuning — дообучить модель 👉 RAG (Retrieval-Augmented Generation) — дать доступ к базе знаний И главный вопрос: что лучше? Не существует «лучше». Есть «под задачу». Разберёмся 👇 Что такое Fine-tuning?

Ты берёшь модель и доучиваешь её на своих данных. Модель: 👉 меняет веса 👉 «запоминает» стиль, паттерны, формат Это как переучить мозг модели. Хорошо подходит для: 👉 кастомного тона (support, юрист, врач) 👉 форматирования ответов 👉 специфичных паттернов

Что такое RAG?

Ты не меняешь модель. Ты даёшь ей доступ к внешним данным: 👉 запрос 👉 поиск по базе (vector DB) 👉 релевантные куски 👉 генерация ответа Это как открыть шпаргалку перед ответом. Хорошо подходит для: 👉 актуальной информации 👉 больших баз знаний 👉 документов, инструкций, FAQ

Где начинается реальная разница

1. Обновляемость Fine-tuning → нужно переобучать RAG → просто обновил базу 👉 если данные часто меняются — RAG выигрывает 2. Контроль над знаниями Fine-tuning → знания «размазаны» в весах RAG → ты точно знаешь источник 👉 RAG более контролируемый 3. Стоимость Fine-tuning → дорого (обучение + инференс) RAG → дешевле, но есть стоимость retrieval 4. Галлюцинации Fine-tuning → может уверенно «врать» RAG → опирается на документы 👉 RAG обычно надёжнее 5. Задержка (latency) Fine-tuning → быстрее RAG → медленнее (поиск + генерация)

Когда Fine-tuning лучше

👉 нужно изменить стиль / тон 👉 есть чёткие шаблоны ответов 👉 данные стабильны 👉 нужна минимальная задержка

Когда RAG лучше

👉 часто обновляемые данные 👉 большая база знаний 👉 требуется объяснимость 👉 важно снизить галлюцинации

Самый важный инсайт

Это не конкуренты. Это связка. На практике делают так: 👉 Fine-tuning учит модель, как отвечать 👉 RAG даёт модели, что отвечать

В одном предложении Fine-tuning меняет мозг модели, RAG даёт ей память.

20 077

Yandex B2B Tech объявила о старте грантовой программы для компаний, работающих с искусственным интеллектом. Инициатива ориентирована на команды, которые создают цифровые продукты для внешнего рынка и планируют внедрить в них ИИ. Участникам предлагают финансирование до 1 млн рублей — эти средства можно направить на разработку ИИ-агентов и приложений на базе Yandex AI Studio в течение шести месяцев. Помимо грантов, компании получают доступ к экспертной поддержке и помощи в продвижении. После окончания программы участникам предоставляется значительная скидка — до 70% — на использование платформы сроком до полугода. В числе первых проектов: — R77.ai, автоматизирующий проверку документов для банков и страховых с помощью машинного обучения — Noumy.ai, разрабатывающий инструменты для анализа кандидатов и их поведения на интервью — GO2AI, создающий ИИ-агентов для стратегического планирования и ускоряющий принятие решений с нескольких дней до часа Дополнительно участники смогут рассчитывать на софинансирование маркетинговых активностей и размещение своих продуктов в маркетплейсе Yandex Cloud.

20 077

Repost from xCode Journal

🖥 Откопали интерактивный визуализатор алгоритмов — algorithm-visualizer Внутри 70+ алгоритмов на JavaScript, Java и C++. Так что просто запускаем их и смотрим за пошаговым выполнением кода. Полезно при обучении. ✖️ xCode Journal

20 077

Внедрить ИИ в бизнес — миссия выполнима? 💯 Узнайте ответ 9 апреля на закрытой встрече для предпринимателей и специалистов по машинному обучению. Selectel, GlowByte и Data Sapience проведут мероприятие для тех, кто хочет автоматизировать бизнес-процессы с помощью ИИ. В программе — дискуссии о машинном обучении, обсуждение реальных кейсов и рабочих задач с экспертами. А также ужин и полезные знакомства. Смотреть программу 💡 ⏰ 9 апреля (чт), 18:00 📍 Москва, м. Динамо Приходите, чтобы пообщаться со спикерами и получить экспертный разбор вашего кейса. ✅ Участие бесплатное, Дождитесь подтверждения заявки. Регистрируйтесь по ссылке: https://slc.tl/wt88c Реклама. АО "Селектел". erid:2W5zFJN4RKe

20 077

Большой шаг вперёд для синтеза речи Компания Qwen выложила в open source новую TTS-модель, которая умеет: 🔘 клонировать голоса 🔘 создавать новые 🔘 и даже управлять подачей речи через обычный текст Можно просто написать: «Говори бодро, но с лёгкой ноткой волнения» — и модель реально так и сделает И всё это без сложной настройки аудио и танцев с инженерией звука.

20 077

Repost from xCode Journal

CEO Y Combinator выкатил свой сетап для Claude Code Это целая виртуальная команда из 10+ ролей, которая живёт внутри CLI. Теперь мы живем в реальности, где один человек гоняет 5–10 агентов параллельно: они пишут код, тесты, сами находят баги и фиксят их. У самого Гарри получается до 10–20к строк кода в день при работе «параллельно с CEO». По факту это превращает Claude в управляемый софтверный завод с ролями, процессами и гейтами. ✖️ xCode Journal

20 077

Управляй AI-сценариями со Сбером 🚀 Наша команда создает цифровую платформу, где ИИ — не просто помощник, а полноправный соавтор. Если тебе интересно экспериментировать с искусственным интеллектом и напрямую влиять на клиентский опыт — присоединяйся! Что будешь делать: ➖ управлять полным циклом AI-продуктов: от идеи и прототипа до масштабирования и финансовых метрик; ➖ проектировать сценарии для GigaChat, работать с поведением LLM-моделей; ➖ анализировать рынок, декомпозировать задачи и обеспечивать синергию между командами. Мы предлагаем: годовую премию, ДМС, обучение, современную технику и всё необходимое для комфорта и профессионального роста. Стань частью команды, где всё возможно!

20 077

🎁 ВАМ ПОДАРОК ⠀ … даже несколько ⠀ Что будет, если собрать лучшие каналы в сфере AI, IT и бизнеса в одну ПАПКУ? ⠀ ▪️Егор Никитин | event | нейросети ▪️Семён: Нейросети в каждый дом ▪️FOKIN MEDIA | Опыт в IT ▪️Руководитель. Ментор. Человек🤗 ⠀ Можно получить👇 ⠀ - пошаговый план, как построить карьеру в IT с нуля. - узнать о нейронках, которые не только быстро генерят контент. Но и ведут переписки, совершают продажи, приводят новых клиентов ⠀ А еще забрать подарки👇 ⠀ 🎁промт для создания качественных офферов 🎁 промт для анализа конкурентов 🎁 промт для оценки упаковки. ⠀ Нажимайте сюда ➡️ ПАПКА и забирайте подарки. ⠀ ❗️Забрать можно до 10 утра 24.03. Потом удалю пост

20 077

Секунда уверенности → полгода страданий

20 077

Уверенное владение математическим аппаратом — ключевой фактор для решения сложных задач в Data Science, ML и других it-специальностях. Преподаватели МФТИ и создатели проекта Popmath приглашают вас на бесплатный вебинар "Как выучить математику во взрослом возрасте?" На вебинаре вы получите ответы на ключевые вопросы: 🔴 Прикладная математика: Какие разделы наиболее критичны для современных IT-специальностей 🔵 Эффективность обучения: Почему академический подход часто не работает и как выстроить процесс с максимальным КПД 🟠 Актуальные методики: Какие образовательные технологии позволяют в сжатые сроки восстановить и систематизировать знания Дата: 23 марта Время: 20:00 по МСК Длительность: 1 час + ответы на вопросы ➡️ Для регистрации пишите нам! или ознакомьтесь со страницей вебинара и оставьте заявку там 🔻 Всем участникам вебинара скидка 10% на 4-х месячный онлайн-курс "Математика с нуля для взрослых", который начнётся уже 26 марта🔺

20 077

Как бороться с переобучением в нейросетях Переобучение — это момент, когда модель: 👉 отлично знает train 👉 и вообще не понимает реальный мир Она запоминает, а не обобщает. Разберём, как с этим бороться 👇 1. Больше данных (самый честный способ) Чем больше данных — тем сложнее модели заучить шум. Что можно сделать: 👉 собрать новые данные 👉 использовать data augmentation 👉 синтетически расширить выборку В CV и NLP это часто даёт лучший эффект, чем любые трюки с архитектурой. 2. Regularization (штраф за “слишком умную” модель) 👉 L1 / L2 регуляризация → штрафуют большие веса Интуитивно: модель становится проще и меньше переобучается 3. Dropout — случайное “забывание” нейронов Во время обучения случайные нейроны отключаются. Что это даёт: 👉 модель не может опираться на конкретные нейроны 👉 учится быть более устойчивой Обычно: 👉 0.2 – 0.5 dropout rate 4. Early Stopping — остановись вовремя Следим за валидацией: 👉 train loss ↓ 👉 val loss сначала ↓, потом ↑ Как только val начинает расти — останавливаем обучение Это один из самых эффективных и недооценённых методов. 5. Упростить модель Иногда решение самое простое: 👉 меньше слоёв 👉 меньше параметров 👉 проще архитектура Большая модель = больше шанс переобучения. 6. Batch Normalization Помогает: 👉 стабилизировать обучение 👉 немного снижает переобучение Но это не silver bullet — скорее бонус. 7. Data Augmentation Особенно важно для: 👉 CV (повороты, шум, кропы) 👉 NLP (перефразирование, замены) Модель видит больше вариантов одного и того же объекта. 8. Правильная валидация Если у тебя плохой split — ты даже не поймёшь, что модель переобучилась. Используй: 👉 train / val / test 👉 k-fold (если мало данных) Главный инсайт Переобучение — это не ошибка модели. Это сигнал, что: 👉 либо мало данных 👉 либо модель слишком сложная 👉 либо процесс обучения настроен плохо В одном предложении Чтобы победить переобучение — либо добавь информации (данные), либо убери сложность (модель).

20 077

OpenClaw + RL Агенты OpenClaw адаптируются с помощью файлов памяти и навыков (skills), но веса базовой модели на самом деле не меняются. Как OpenClaw-RL решает эту проблему?

Он оборачивает самостоятельно размещённую модель в API, совместимый с OpenAI, перехватывает живые диалоги из OpenClaw и обучает политику в фоновом режиме с помощью RL (обучения с подкреплением). Архитектура полностью асинхронная. Это означает, что: обработка запросов, оценка награды (reward scoring), и обучение выполняются параллельно. После завершения обучения веса модели "hot" подменяются (hot-swap) после каждого батча, при этом агент продолжает отвечать без остановки. В настоящее время поддерживаются два режима обучения: Binary RL (GRPO): модель награды оценивает каждый ход диалога как хороший, плохой или нейтральный. Эта скалярная награда используется для обновления политики через PPO-подобную функцию цели с клиппингом. On-Policy Distillation: когда появляются конкретные исправления, например "тебе нужно было сначала проверить тот файл", эта обратная связь используется как более богатый направленный сигнал обучения на уровне токенов.

Когда стоит использовать OpenClaw-RL?

Честно говоря, большую часть поведения агента уже можно улучшить через более грамотный дизайн памяти и навыков. Существующая экосистема навыков OpenClaw и созданные сообществом навыки самоулучшения покрывают широкий спектр задач без изменения весов модели. Если агент постоянно забывает предпочтения пользователя - это проблема памяти. Если он не знает, как обработать конкретный рабочий процесс - это проблема навыков. Обе задачи решаются на уровне промптов и контекста. RL становится действительно интересным, когда источник ошибки лежит глубже - в самом механизме рассуждения модели. Например: систематически плохой порядок выбора инструментов, слабое многошаговое планирование, неспособность правильно интерпретировать неоднозначные инструкции так, как ожидает конкретный пользователь. Исследования в области agentic RL (например, ARTIST и Agent-R1) показывают, что такие поведенческие паттерны достигают потолка, если использовать только промпт-подходы. Особенно это заметно в сложных многошаговых задачах, где модели нужно: восстанавливаться после ошибок инструментов, или менять стратегию прямо во время выполнения. Именно этот уровень и является целью OpenClaw-RL - и это ключевое отличие от того, что предлагает обычный OpenClaw.

20 077

ИТ-специалисты Москвы, хотите поделиться опытом? Есть возможность рассказать студентам о том, что вы не услышали в свое время. Центральный университет как раз проводит интенсив для будущих преподавателей ИТ-специальностей — это возможность попробовать себя в роли наставника и понять, подходит вам эта деятельность или нет. Там вы сможете: — Связать преподавание с личными и карьерными целями. — Отработать техники презентаций и вовлечения аудитории. — Спроектировать и провести пару на площадке Центрального университета. — Заручиться поддержкой экспертов с опытом в крупных ИТ-компаниях. — Получить шанс попасть в команду преподавателей Центрального университета. Интенсив пройдет с 22 марта по 5 апреля. Будут онлайн-встречи и очные занятия. Еще успеваете зарегистрироваться.