fa
Feedback
Love. Death. Transformers.

Love. Death. Transformers.

رفتن به کانال در Telegram

❤️☠️🤗 Указанные действия не являются ресерчем, поскольку: а) Мы не ученые; б) Оно работает. @transformerslovedeatch по всем вопросам Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.

نمایش بیشتر

📈 تحلیل کانال تلگرام Love. Death. Transformers.

کانال Love. Death. Transformers. (@lovedeathtransformers) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 24 459 مشترک است و جایگاه 5 503 را در دسته فناوری و برنامه‌ها و رتبه 27 160 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 24 459 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 28 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر 46 و در ۲۴ ساعت گذشته برابر 6 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

  • وضعیت تأیید: تأیید نشده
  • نرخ تعامل (ER): میانگین تعامل مخاطب 40.25% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 22.81% واکنش نسبت به کل مشترکان کسب می‌کند.
  • دسترسی پست‌ها: هر پست به طور میانگین 9 844 بازدید دریافت می‌کند. در اولین روز معمولاً 5 579 بازدید جمع‌آوری می‌شود.
  • واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 114 است.
  • علایق موضوعی: محتوا بر موضوعات کلیدی مانند сиська, llm, параметр, округление, fp32 تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
❤️☠️🤗 Указанные действия не являются ресерчем, поскольку: а) Мы не ученые; б) Оно работает. @transformerslovedeatch по всем вопросам Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 29 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

24 459
مشترکین
+624 ساعت
+47 روز
+4630 روز
آرشیو پست ها
Единственная причина заходить в линкед
Единственная причина заходить в линкед

https://youtu.be/jbK80BswgBg?si=eOj0XrHQ7a39Bra4 Друзья, вдруг вам нечего смотреть этим вечером, можете посмотреть как два не молодых человека шутят про мл

<статья которую я писал в период лечения тоски> - все методы дают очень похожие результаты в плане метрик - а дают ли одинаковый ландшафт весов? - нет: sft, rft, dft, offilne grpo учат +- одно и тоже - dpo, grpo, dapo(вариант grpo) учат одно разное и не похожее между сабой - эффект переносится вне зависимости от lr и seed huggingface.co/spaces/AlexWortega/same-data-different-losses ебаните лайков я нейрослопил с любовью бложик репостните: https://x.com/justALEXWORTEGA/status/2068790635570561429?s=20

&lt;статья которую я писал в период лечения тоски&gt; - все методы дают очень похожие результаты в плане метрик - а дают ли о
<статья которую я писал в период лечения тоски> - все методы дают очень похожие результаты в плане метрик - а дают ли одинаковый ландшафт весов? - нет: sft, rft, dft, offilne grpo учат +- одно и тоже - dpo, grpo, dapo(вариант grpo) учат одно разное и не похожее между сабой - эффект переносится вне зависимости от lr и seed huggingface.co/spaces/AlexWortega/same-data-different-losses

<статья которую я писал в период лечения тоски> - все методы дают очень похожие результаты в плане метрик - а дают ли одинаковый ландшафт весов? - нет: sft, rft, dft, offilne grpo учат +- одно и тоже - dpo, grpo, dapo(вариант grpo) учат одно разное и не похожее между сабой - эффект переносится вне зависимости от lr и seed huggingface.co/spaces/AlexWortega/same-data-different-losses

Запилил интерактивный блог по нашей статье с ICML 2026 MechInterp Workshop — Weight-Space Geometry of Offline Reasoning Training.     Вопрос простой. Берём один базовый Qwen3-4B, одни и те же математические роллауты — и обучаем шестью разными лоссами: SFT, RFT, DFT, RIFT, Offline GRPO, DPO. Данные идентичные. Они учат одно и то же или реально разное?   Оказывается, выбор лосса оставляет отпечаток прямо в весах: SFT / RFT / RIFT почти колинеарны (cosine ≥ 0.97) — это буквально одно направление, просто по-разному взвешенная cross-entropy; DFT уезжает в сторону сильнее всех, хотя данные те же;Offline GRPO сидит в том же бассейне, что и SFT, но переписывает поздние слои; DPO живёт в почти ортогональном подпространстве, ловит барьер по mode connectivity, схлопывает CKA в поздних слоях — и при этом даёт лучшую точность, на LR в 10× меньше;   ▎ — а online RL геометрически не похож вообще ни на один offline-лосс. Колинеарность offline-методов — отчасти артефакт обучения на одних и тех же фиксированных роллаутах.   ▎   ▎ И главное — это не статичный PDF. Кликаешь по матрице косинусов, тащишь слайдер по 36 слоям, смотришь, как метрики едут вживую. Всё считается на клиенте из опубликованных чисел, бэкенда нет.   ▎   ▎ Покрутить: huggingface.co/spaces/AlexWortega/same-data-different-losses

ладно я готов признать что онлайн рл не хуйня
ладно я готов признать что онлайн рл не хуйня

photo content

Вот бы задонатили на a6000pro домой

убейте людей которые не собирают блядский nightly vllm для своих еба моделей в докеры

Наша статья принята на ICML, а это значит, что надо было сделать постер. Хочется сделать его быстро и качественно, поэтому не
Наша статья принята на ICML, а это значит, что надо было сделать постер. Хочется сделать его быстро и качественно, поэтому не долго думая я решила, что ебаться с этим мы не хотим. Хотим, чтобы это делал Claude когда он уже будет делать все мои дела пока я пью пиво??? Я отсмотрела все инструменты в интернете для создания постеров автоматизировано и решила запихнуть все фичи в один универсальный скилл. Так родился скилл для генерации постеров, который универесально может вам сгенерить постер для любой конференции по их требованиям к формату и люой вашей идее дизайна Как это работает: 💛устанавливаете скилл из моей репы https://github.com/zj-karina/conference-poster 💛клод интервьюирует вас на предмет какая конференция или воркшоп вас интересует и какая статья. Можете это все закинуть ему ссылками. Он найдет все за вас 💛после у вас есть выбор в каком стиле сделать ваш постер и при желании можно дать ключик к fal.ai, чтобы получился например такой стиль как у нашего постера с my little pony Кст суть статьи следующая. Кучу offline RL лоссов для дистилляции ризонинга (RFT, RIFT, DFT, Offline GRPO, DPO) сравнивают почти всегда только по accuracy на бенчах. Но никто не смотрит, что они реально делают с весами. Учат одни и те же цепи ризонинга с разной скоростью или это вообще разные вычисления? Резы: 💛SFT, RFT, RIFT это один и тот же апдейт DFT внезапно выбивается сильнее всех 💛Offline GRPO единственный reward-сигнал, который реально добавляет ортогональную компоненту 💛DPO это вообще другой алгоритм, и геометрически, и по точности

хочу serverless сервить 30б, какой нынче способ лучше?

Repost from N/a
Новый видос! https://www.youtube.com/watch?v=u0Y0fRci_5o Локальные LLM: инфра и безопасность Евгений Новиков x Xecut Hackerspace В комментах слайды: оригинал .md и готовая к просмотру .html

Meta has reportedly moved 30% to 50% of engineers on core teams into data-labeling roles for AI training.
Meta has reportedly moved 30% to 50% of engineers on core teams into data-labeling roles for AI training.

Repost from Zhovner Hub
FlipCTL наш графический фреймворк для встраиваемых Линукс систем Выкладываю черновик поста на русском, до того как его переведут или отредактируют. Чтобы никто не доебался, что текст сгенерирован AI. TL;DR * Все GUI на кибердеках говно — потому что никто не хочет разрабатывать пиксель-перфект интерфейсы * Мы хотим сделать нормальный пацанский HMI (Human Machine Interface) для хакерских кибердеров. Называется FlipCTL * Это будет софт + отдельная железа с экраном и кнопками от Flipper One * Его можно будет использовать на Flippe One а так же прикрутить к любом одноплатнику типа Raspberry Pi Дискас: https://blog.flipper.net/p/424ce402-df71-417b-80ec-74f35493f041/

Repost from commit history
В начале апреля я выступал на AI Engineer Europe – и на днях вышло видео моего доклада! имхо: AI Engineer — сейчас одна из лу
В начале апреля я выступал на AI Engineer Europe – и на днях вышло видео моего доклада! имхо: AI Engineer — сейчас одна из лучших конференций по прикладному AI. Еще у них есть YouTube-канал, на 500к+ подписчиков, куда выкладывают видео выступлений. Там много классных записей! видео доклада: https://youtu.be/wcUJWP6WpGM Я рассказывал про лидерборд SWE-rebench — динамический бенчмарк со свежими SWE-задачами с GitHub: https://swe-rebench.com/ Если бы мне нужно было выделить главные выводы, я бы выбрал эти: > Динамические бенчмарки помогают держать задачи свежими и снижают контаминацию. > Для запуска SWE-эвалов нужны не только GPU: вам также понадобится масштабируемая инфраструктура исполнения для сэндбоксов. > Хорошие задачи должны быть решаемыми, но при этом достаточно сложными и показывать значимую разницу между моделями. > Высококачественные верифицируемые эвалы могут стать основой для будущих датасетов для RL-обучения. P.S. Вышло забавно: на превью у них всегда лицо спикера. И для моей сессии они просто апскейлнули кусок кадра из видео — и получилась довольно вольная интерпретация моей внешности из низкого разрешения! (можете сравнить с фотографиями в профиле)

Короче я собрал qwen35b a3 с рро и я первый раз в жизни увидел чтобы PPO докидывало нормально(reward был верифицируемый) Эта
Короче я собрал qwen35b a3 с рро и я первый раз в жизни увидел чтобы PPO докидывало нормально(reward был верифицируемый) Эта штука на karpathy autoresearch для parametr golf лучше чем glm5.2 и qwen350b и генерит идеи похожие на опус Модель: https://huggingface.co/AlexWortega/SIQ-1-35B Демо чтобы гонять на zero gpu и радоваться: https://huggingface.co/spaces/AlexWortega/hermes-agent-zerogpu

авторы статей по квантам вы как там все хорошо
авторы статей по квантам вы как там все хорошо

photo content