en
Feedback
epsilon correct

epsilon correct

Open in Telegram

Машинное обучение, графы, языковые модели. Чуток про карьеру исследователя в FAANG, путь PhD и щепотка полезной математики. Связаться с автором: @deltaincorrect. Рекламы в канале нет.

Show more
8 063
Subscribers
+324 hours
+247 days
+5230 days
Attracting Subscribers
June '26
June '26
+102
in 0 channels
May '26
+148
in 0 channels
Get PRO
April '26
+218
in 5 channels
Get PRO
March '26
+111
in 0 channels
Get PRO
February '26
+256
in 2 channels
Get PRO
January '26
+171
in 3 channels
Get PRO
December '25
+109
in 5 channels
Get PRO
November '25
+152
in 2 channels
Get PRO
October '25
+106
in 3 channels
Get PRO
September '25
+148
in 3 channels
Get PRO
August '25
+156
in 6 channels
Get PRO
July '25
+147
in 2 channels
Get PRO
June '25
+214
in 5 channels
Get PRO
May '25
+159
in 5 channels
Get PRO
April '25
+213
in 3 channels
Get PRO
March '25
+521
in 10 channels
Get PRO
February '25
+541
in 10 channels
Get PRO
January '25
+150
in 6 channels
Get PRO
December '24
+381
in 9 channels
Get PRO
November '24
+152
in 3 channels
Get PRO
October '24
+388
in 10 channels
Get PRO
September '24
+2 489
in 19 channels
Get PRO
August '24
+198
in 10 channels
Get PRO
July '24
+232
in 4 channels
Get PRO
June '24
+76
in 0 channels
Get PRO
May '24
+85
in 4 channels
Get PRO
April '24
+138
in 1 channels
Get PRO
March '24
+185
in 8 channels
Get PRO
February '24
+105
in 3 channels
Get PRO
January '24
+119
in 1 channels
Get PRO
December '23
+408
in 3 channels
Get PRO
November '23
+52
in 0 channels
Get PRO
October '23
+165
in 3 channels
Get PRO
September '23
+106
in 0 channels
Get PRO
August '23
+140
in 0 channels
Get PRO
July '23
+1 495
in 0 channels
Date
Subscriber Growth
Mentions
Channels
18 June0
17 June+6
16 June+6
15 June+8
14 June+6
13 June+5
12 June+18
11 June+3
10 June+6
09 June+3
08 June+6
07 June+1
06 June+4
05 June+8
04 June+8
03 June+1
02 June+4
01 June+9
Channel Posts
MTP спекулятивный декодинг в Gemma 4: ускоряемся в два раза без потери качества 🥳 В нашу дорогую гемму наконец завезли спеку
MTP спекулятивный декодинг в Gemma 4: ускоряемся в два раза без потери качества 🥳 В нашу дорогую гемму наконец завезли спекулятивный декодинг, когда более маленькая модель предсказывает токены, которые могут верифицироваться большой моделью параллельно, существенно ускоряя инференс для локальных юзкейзов. Попробовать можно через HuggingFace transformers, остальные движки тоже скоро будут поддерживать. блогпост, технический блог

2
Продолжаем геммапропаганду. В прошлом году у NVIDIA вышла неплохая статья о том, как ловить людей, которые доливают тест в тр
Продолжаем геммапропаганду. В прошлом году у NVIDIA вышла неплохая статья о том, как ловить людей, которые доливают тест в трейн. CoDeC – нормализованный показатель перплексии, где для тестсета бенчмарка считают изменения в перплексии с дополнительными примерами из того же бенчмарка. Для неконтаминированных моделек мы ожидаем, что дополнительные примеры не будут сбивать модель с толку, а в лучшем случае помогут. С другой стороны, если модель запомнила текст из теста, дополнительные примеры собьют её с толку и уверенность модели в ответе упадёт. Шкала нормализована от 0 до 100, где ~80% значит, что примеры из теста модель видела буквально, ~40% – в перефразированном виде. Товарищ с твиттера посчитал CoDeC для Gemma 4 и сравнил с Qwen 3.5 – почему-то у наших китайских коллег модель почти запоминает примеры из теста.
9 430
3
WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распозна
WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распознавание цифр со всего 28 размеченными примерами и ~50к неразмеченными, распознавание формы фигур, или восстановление перемешанных фрагментов изображений. Gemma 4 31B оказалась самой сильной открытой моделью на этом бенчмарке, опередив GLM 5 (MoE на 700B) и GPT-OSS с хорошим отрывом, показав результат на уровне с О3 или Gemini 2.5 Pro.
7 787
4
Мои любимые artificial analysis выложили своё независимое тестирование Gemma 4 (твит, страница с результатами), по результата
Мои любимые artificial analysis выложили своё независимое тестирование Gemma 4 (твит, страница с результатами), по результатам вышло хуже квенов из-за просадки на 𝜏²-bench, ну и ладно с ним. В этой версии мне довелось поработать над околонаучными бенчмарками и работой с длинным контекстом, а там мы наступаем на пятки китайским моделям на порядок больше вроде GLM 5 или DS 3.2.
7 983
5
Gemma 4 blogpost | huggingface 4 размера: E2B, E4b (бывшие Gemma 3n/Gemini Nano); 26A4B, 31B Dense
Gemma 4 blogpost | huggingface 4 размера: E2B, E4b (бывшие Gemma 3n/Gemini Nano); 26A4B, 31B Dense
12 382