epsilon correct

الذهاب إلى القناة على Telegram

Машинное обучение, графы, языковые модели. Чуток про карьеру исследователя в FAANG, путь PhD и щепотка полезной математики. Связаться с автором: @deltaincorrect. Рекламы в канале нет.

8 073

المشتركون

-124 ساعات

+127 أيام

+4130 أيام

4 974

عرض المشاهدات

لا توجد بيانات24 ساعات

لا توجد بيانات48 ساعات

61.62%

معدل المشاركة

لا توجد بيانات

المشاركات في اليوم

Ads index

beta

جاري تحميل البيانات...

القنوات المماثلة

Сегодня родился Бенедикт Киберксюш

قنوات أخرى

الإشارات الواردة والصادرة

---

جذب المشتركين

يوليو '26

+16

في 0 قنوات

يونيو '26

+157

في 0 قنوات

Get PRO

مايو '26

+148

في 0 قنوات

Get PRO

أبريل '26

+218

في 5 قنوات

Get PRO

مارس '26

+111

في 0 قنوات

Get PRO

فبراير '26

+256

في 2 قنوات

Get PRO

يناير '26

+171

في 3 قنوات

Get PRO

ديسمبر '25

+109

في 5 قنوات

Get PRO

نوفمبر '25

+152

في 2 قنوات

Get PRO

أكتوبر '25

+106

في 3 قنوات

Get PRO

سبتمبر '25

+148

في 3 قنوات

Get PRO

أغسطس '25

+156

في 6 قنوات

Get PRO

يوليو '25

+147

في 2 قنوات

Get PRO

يونيو '25

+214

في 5 قنوات

Get PRO

مايو '25

+159

في 5 قنوات

Get PRO

أبريل '25

+213

في 3 قنوات

Get PRO

مارس '25

+521

في 10 قنوات

Get PRO

فبراير '25

+541

في 10 قنوات

Get PRO

يناير '25

+150

في 6 قنوات

Get PRO

ديسمبر '24

+381

في 9 قنوات

Get PRO

نوفمبر '24

+152

في 3 قنوات

Get PRO

أكتوبر '24

+388

في 10 قنوات

Get PRO

سبتمبر '24

+2 489

في 19 قنوات

Get PRO

أغسطس '24

+198

في 10 قنوات

Get PRO

يوليو '24

+232

في 4 قنوات

Get PRO

يونيو '24

+76

في 0 قنوات

Get PRO

مايو '24

+85

في 4 قنوات

Get PRO

أبريل '24

+138

في 1 قنوات

Get PRO

مارس '24

+185

في 8 قنوات

Get PRO

فبراير '24

+105

في 3 قنوات

Get PRO

يناير '24

+119

في 1 قنوات

Get PRO

ديسمبر '23

+408

في 3 قنوات

Get PRO

نوفمبر '23

+52

في 0 قنوات

Get PRO

أكتوبر '23

+165

في 3 قنوات

Get PRO

سبتمبر '23

+106

في 0 قنوات

Get PRO

أغسطس '23

+140

في 0 قنوات

Get PRO

يوليو '23

+1 495

في 0 قنوات

التاريخ	نمو المشتركين	الإشارات	القنوات
04 يوليو	+3
03 يوليو	+2
02 يوليو	+6
01 يوليو	+5

منشورات القناة

Мечта всех, кто хотел кожаночку как у Дженсена Хуанга – на следующем Sotheby's можно будет купить подписанную им куртку Tom Ford. Средства пойдут на благотворительность, ориентировочная цена – 40-60k$, хотя зачастую у аукционных домов не всё хорошо с оценкой спроса, и куртка может уйти за сильно больше какому-нибудь сотруднику фронтирной лабы.

2	Пока я откисаю в Корее от очередного сезона исхода дорогих коллег [1, 2, 3, и др.] перед ICML, наша с читателями любимая Лилиан Вэн – авторка топ-1 блога по диплёрнингу – написала первый за почти два года пост про историю и развитие науки об оценке правил масштабирования (scaling laws) языковых моделей. Почему "правил", а не "законов" – чтобы не создавать ощущения универсальности самих законов: всех необходимых факторов для по-настоящему точных предсказательных правил для конкретных архитектур, моделей, данных, оптимизаторов и других факторов, на них влияющих. Особого почтения заслуживает упоминание статьи Lovelace et al., где в первый раз в академическом мире разбираются, как влияют повторения данных на scaling laws. Так что у кого знания остановились на шиншилле – бежим освежать знания, чтобы фронтир толкался предсказуемо и безопасно.	3 190
3	Проверяемся, запомнили ли вас ллмки на intheweights.com Гпт 5.5 меня задизреспектила 😭	5 004
4	MTP спекулятивный декодинг в Gemma 4: ускоряемся в два раза без потери качества 🥳 В нашу дорогую гемму наконец завезли спекулятивный декодинг, когда более маленькая модель предсказывает токены, которые могут верифицироваться большой моделью параллельно, существенно ускоряя инференс для локальных юзкейзов. Попробовать можно через HuggingFace transformers, остальные движки тоже скоро будут поддерживать. блогпост, технический блог	0
5	Продолжаем геммапропаганду. В прошлом году у NVIDIA вышла неплохая статья о том, как ловить людей, которые доливают тест в трейн. CoDeC – нормализованный показатель перплексии, где для тестсета бенчмарка считают изменения в перплексии с дополнительными примерами из того же бенчмарка. Для неконтаминированных моделек мы ожидаем, что дополнительные примеры не будут сбивать модель с толку, а в лучшем случае помогут. С другой стороны, если модель запомнила текст из теста, дополнительные примеры собьют её с толку и уверенность модели в ответе упадёт. Шкала нормализована от 0 до 100, где ~80% значит, что примеры из теста модель видела буквально, ~40% – в перефразированном виде. Товарищ с твиттера посчитал CoDeC для Gemma 4 и сравнил с Qwen 3.5 – почему-то у наших китайских коллег модель почти запоминает примеры из теста.	0
6	WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распознавание цифр со всего 28 размеченными примерами и ~50к неразмеченными, распознавание формы фигур, или восстановление перемешанных фрагментов изображений. Gemma 4 31B оказалась самой сильной открытой моделью на этом бенчмарке, опередив GLM 5 (MoE на 700B) и GPT-OSS с хорошим отрывом, показав результат на уровне с О3 или Gemini 2.5 Pro.	0

عرض جميع المنشورات