Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Show more📈 Analytical overview of Telegram channel Machinelearning
Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 295 804 subscribers, ranking 332 in the Technologies & Applications category and 1 276 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 295 804 subscribers.
According to the latest data from 22 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -6 276 over the last 30 days and by -223 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 8.09%. Within the first 24 hours after publication, content typically collects 5.69% reactions from the total number of subscribers.
- Post reach: On average, each post receives 23 927 views. Within the first day, a publication typically gains 16 831 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 193.
- Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
Thanks to the high frequency of updates (latest data received on 23 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
Build a Large Language Model From Scratch" о тенденциях и проблемах современных методов обучения LLM через призму RL.
В мире LLM последние месяцы стали переломными. Релизы GPT-4.5 и Llama 4, вопреки ожиданиям, не вызвали ажиотажа — все потому, что эти модели остались «классическими», без продвинутых методов обучения для рассуждений. Их конкуренты - xAI и Anthropic уже добавили кнопки «расширенного мышления», а OpenAI представила o3 — модель, где упор сделан на стратегическое применение вычислений через обучение с подкреплением. Становится ясно: масштабирование данных и параметров почти исчерпало себя, и будущее за RL.
Основной инструмент RLHF (обучение с подкреплением на основе человеческой обратной связи) давно используется для настройки LLM под предпочтения людей. Но для задач, требующих логики, этого недостаточно.
Здесь на сцену выходит GRPO — модификация алгоритма PPO, которая экономит ресурсы, убирая «критика» (модель оценки вознаграждения). Так создавалась DeepSeek-R1-Zero, ее обучали вообще без этапа SFT, используя только автоматические проверки ответов. Если математическая задача решена верно, модель получает «плюс», если нет — «минус». Такой подход не только дешевле, но и снижает риск «обмана» модели (reward hacking).
Но и RL — не панацея. Исследования показывают, что PPO и GRPO неявно поощряют длинные ответы, даже если те ошибочны. Например, при отрицательном вознаграждении штраф распределяется по токенам, и модель учится растягивать текст, чтобы смягчить наказание.
Решения уже есть: одни команды вводят штрафы за длину, другие меняют расчет преимуществ. А модель L1 от Kaggle и вовсе позволяет пользователям задавать желаемую длину ответа, балансируя между точностью и затратами.
Способность к рассуждениям может возникать и без RL. DeepSeek V3 демонстрирует мыслительные «озарения», хотя ее не обучали специально. Этот факт всерьез ставит под вопрос исключительную роль RL — возможно, все дело в данных, где уже есть цепочки логических шагов.
Тем не менее, RL усиливает эти способности: модели начинают самокорректироваться, использовать внешние инструменты (калькуляторы, поиск) и даже переносить навыки между доменами — от математики до медицины.
Некоторые заявления о прогрессе оказались преувеличены: улучшения на мелких моделях часто нестабильны, а результаты зависят от случайных факторов вроде выбора сида. Кроме того, RL требует внушительных ресурсов (o3 от OpenAI потратила при обучении в 10 раз больше вычислений, чем предыдущая версия)
В итоге, RL остается ключевым направлением, но важно избегать «эйфории». Сочетание RL с автоматической проверкой ответов, контроль длины и гибридные подходы (как в DeepSeek-R1) — вот что приближает нас к моделям, которые не просто генерируют текст, а действительно думают.
🔜 Читать статью в оригинале
@ai_machinelearning_big_data
#AI #ML #LLM #RLMACHINELEARNING
→ Есть билет для студентов и преподавателей вузов — в два раза дешевле персонального
→ Можно попросить руководство приобрести корпоративный билет
Бонус: в соседних залах пройдет Python-конференция PiterPy. Участники IML смогут послушать доклады PiterPy бесплатно.
За подробностями и билетамиFirst‑Last‑Frame»: достаточно задать начальный и конечный кадры, чтобы сгенерировать полноценный плавный плавный ролик.
✔️ Главное
🟢 Открытые код и веса.
🟢Полный контроль над сюжетом и композицией видео.
🟢 Точное следование инструкциям: модель умеет очень чётко.
«понимать» промпты и визуальные референсы.
🟢Плавные переходы с учётом физики: кадры переходят друг в друга без рывков, с реалистичной трактовкой законов движения и освещения.
🟢 Качество 720 p: готовый не требует дополнительной пост‑обработки.
🔜GitHub: https://github.com/Wan-Video/Wan2.1
🔜Hugging Face: https://huggingface.co/Wan-AI/Wan2.1-FLF2V-14B-720P
🔜Modelscope: https://modelscope.cn/models/Wan-AI/Wan2.1-FLF2V-14B-720P
@ai_machinelearning_big_data
#wan #AIGC #alart1️⃣ Shared GPU — вы можете разделять GPU-ресурсы и потреблять то количество vRAM (видеопамяти), которое необходимо для эффективной работы самой модели без задержек. Можно динамически перераспределять ресурсы в зависимости от текущих потребностей. 2️⃣ Простота и гибкость управления сервисом дают возможность, как запускать модели как напрямую из Hugging Face, так и запускать собственные образы со своим окружением. 3️⃣ Высокая степень адаптации и рациональное использование доступных ресурсов: на одной видеокарте можно одновременно запускать несколько моделей. 4️⃣ Режим скайлирования — тарификация за использование модели начинается только в момент обращения к ней.Evolution ML Inference подойдет для тех, кто разрабатывает AI- и ML-решения и хочет быстро и с минимальными затратами запустить собственную ML-модель. Это полностью управляемый сервис — пользователь только настраивает конфигурацию, модель и тип масштабирования. Cloud․ru предоставляет доступ к мощным графическим процессорам, а также выполняет полное администрирование и обслуживание инфраструктуры.
O(1) по длине видео.
Эти метрики делают FramePack одним из самых практичных решений для генерации видео даже на слабом железе.
🔜Project Page:https://lllyasviel.github.io/frame_pack_gitpage/
🔜Paper:https://lllyasviel.github.io/frame_pack_gitpage/pack.pdf
🔜Code:https://github.com/lllyasviel/FramePack
@ai_machinelearning_big_data
Available now! Telegram Research 2025 — the year's key insights 
