es
Feedback
epsilon correct

epsilon correct

Ir al canal en Telegram

Машинное обучение, графы, языковые модели. Чуток про карьеру исследователя в FAANG, путь PhD и щепотка полезной математики. Связаться с автором: @deltaincorrect. Рекламы в канале нет.

Mostrar más
8 058
Suscriptores
Sin datos24 horas
+67 días
+2430 días
Atraer Suscriptores
junio '26
junio '26
+70
en 0 canales
mayo '26
+148
en 0 canales
Get PRO
abril '26
+218
en 5 canales
Get PRO
marzo '26
+111
en 0 canales
Get PRO
febrero '26
+256
en 2 canales
Get PRO
enero '26
+171
en 3 canales
Get PRO
diciembre '25
+109
en 5 canales
Get PRO
noviembre '25
+152
en 2 canales
Get PRO
octubre '25
+106
en 3 canales
Get PRO
septiembre '25
+148
en 3 canales
Get PRO
agosto '25
+156
en 6 canales
Get PRO
julio '25
+147
en 2 canales
Get PRO
junio '25
+214
en 5 canales
Get PRO
mayo '25
+159
en 5 canales
Get PRO
abril '25
+213
en 3 canales
Get PRO
marzo '25
+521
en 10 canales
Get PRO
febrero '25
+541
en 10 canales
Get PRO
enero '25
+150
en 6 canales
Get PRO
diciembre '24
+381
en 9 canales
Get PRO
noviembre '24
+152
en 3 canales
Get PRO
octubre '24
+388
en 10 canales
Get PRO
septiembre '24
+2 489
en 19 canales
Get PRO
agosto '24
+198
en 10 canales
Get PRO
julio '24
+232
en 4 canales
Get PRO
junio '24
+76
en 0 canales
Get PRO
mayo '24
+85
en 4 canales
Get PRO
abril '24
+138
en 1 canales
Get PRO
marzo '24
+185
en 8 canales
Get PRO
febrero '24
+105
en 3 canales
Get PRO
enero '24
+119
en 1 canales
Get PRO
diciembre '23
+408
en 3 canales
Get PRO
noviembre '23
+52
en 0 canales
Get PRO
octubre '23
+165
en 3 canales
Get PRO
septiembre '23
+106
en 0 canales
Get PRO
agosto '23
+140
en 0 canales
Get PRO
julio '23
+1 495
en 0 canales
Fecha
Crecimiento de Suscriptores
Menciones
Canales
12 junio+17
11 junio+3
10 junio+6
09 junio+3
08 junio+6
07 junio+1
06 junio+4
05 junio+8
04 junio+8
03 junio+1
02 junio+4
01 junio+9
Publicaciones del Canal
MTP спекулятивный декодинг в Gemma 4: ускоряемся в два раза без потери качества 🥳 В нашу дорогую гемму наконец завезли спеку
MTP спекулятивный декодинг в Gemma 4: ускоряемся в два раза без потери качества 🥳 В нашу дорогую гемму наконец завезли спекулятивный декодинг, когда более маленькая модель предсказывает токены, которые могут верифицироваться большой моделью параллельно, существенно ускоряя инференс для локальных юзкейзов. Попробовать можно через HuggingFace transformers, остальные движки тоже скоро будут поддерживать. блогпост, технический блог

2
Продолжаем геммапропаганду. В прошлом году у NVIDIA вышла неплохая статья о том, как ловить людей, которые доливают тест в тр
Продолжаем геммапропаганду. В прошлом году у NVIDIA вышла неплохая статья о том, как ловить людей, которые доливают тест в трейн. CoDeC – нормализованный показатель перплексии, где для тестсета бенчмарка считают изменения в перплексии с дополнительными примерами из того же бенчмарка. Для неконтаминированных моделек мы ожидаем, что дополнительные примеры не будут сбивать модель с толку, а в лучшем случае помогут. С другой стороны, если модель запомнила текст из теста, дополнительные примеры собьют её с толку и уверенность модели в ответе упадёт. Шкала нормализована от 0 до 100, где ~80% значит, что примеры из теста модель видела буквально, ~40% – в перефразированном виде. Товарищ с твиттера посчитал CoDeC для Gemma 4 и сравнил с Qwen 3.5 – почему-то у наших китайских коллег модель почти запоминает примеры из теста.
0
3
WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распозна
WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распознавание цифр со всего 28 размеченными примерами и ~50к неразмеченными, распознавание формы фигур, или восстановление перемешанных фрагментов изображений. Gemma 4 31B оказалась самой сильной открытой моделью на этом бенчмарке, опередив GLM 5 (MoE на 700B) и GPT-OSS с хорошим отрывом, показав результат на уровне с О3 или Gemini 2.5 Pro.
0
4
Мои любимые artificial analysis выложили своё независимое тестирование Gemma 4 (твит, страница с результатами), по результата
Мои любимые artificial analysis выложили своё независимое тестирование Gemma 4 (твит, страница с результатами), по результатам вышло хуже квенов из-за просадки на 𝜏²-bench, ну и ладно с ним. В этой версии мне довелось поработать над околонаучными бенчмарками и работой с длинным контекстом, а там мы наступаем на пятки китайским моделям на порядок больше вроде GLM 5 или DS 3.2.
0
5
Gemma 4 blogpost | huggingface 4 размера: E2B, E4b (бывшие Gemma 3n/Gemini Nano); 26A4B, 31B Dense
Gemma 4 blogpost | huggingface 4 размера: E2B, E4b (бывшие Gemma 3n/Gemini Nano); 26A4B, 31B Dense
0