ch
Feedback
epsilon correct

epsilon correct

前往频道在 Telegram

Машинное обучение, графы, языковые модели. Чуток про карьеру исследователя в FAANG, путь PhD и щепотка полезной математики. Связаться с автором: @deltaincorrect. Рекламы в канале нет.

显示更多
8 043
订阅者
+324 小时
+117
+2930
吸引订阅者
六月 '26
六月 '26
+51
在0个频道中
五月 '26
+148
在0个频道中
Get PRO
四月 '26
+218
在5个频道中
Get PRO
三月 '26
+111
在0个频道中
Get PRO
二月 '26
+256
在2个频道中
Get PRO
一月 '26
+171
在3个频道中
Get PRO
十二月 '25
+109
在5个频道中
Get PRO
十一月 '25
+152
在2个频道中
Get PRO
十月 '25
+106
在3个频道中
Get PRO
九月 '25
+148
在3个频道中
Get PRO
八月 '25
+156
在6个频道中
Get PRO
七月 '25
+147
在2个频道中
Get PRO
六月 '25
+214
在5个频道中
Get PRO
五月 '25
+159
在5个频道中
Get PRO
四月 '25
+213
在3个频道中
Get PRO
三月 '25
+521
在10个频道中
Get PRO
二月 '25
+541
在10个频道中
Get PRO
一月 '25
+150
在6个频道中
Get PRO
十二月 '24
+381
在9个频道中
Get PRO
十一月 '24
+152
在3个频道中
Get PRO
十月 '24
+388
在10个频道中
Get PRO
九月 '24
+2 489
在19个频道中
Get PRO
八月 '24
+198
在10个频道中
Get PRO
七月 '24
+232
在4个频道中
Get PRO
六月 '24
+76
在0个频道中
Get PRO
五月 '24
+85
在4个频道中
Get PRO
四月 '24
+138
在1个频道中
Get PRO
三月 '24
+185
在8个频道中
Get PRO
二月 '24
+105
在3个频道中
Get PRO
一月 '24
+119
在1个频道中
Get PRO
十二月 '23
+408
在3个频道中
Get PRO
十一月 '23
+52
在0个频道中
Get PRO
十月 '23
+165
在3个频道中
Get PRO
九月 '23
+106
在0个频道中
Get PRO
八月 '23
+140
在0个频道中
Get PRO
七月 '23
+1 495
在0个频道中
日期
订阅者增长
提及
频道
11 六月+1
10 六月+6
09 六月+3
08 六月+6
07 六月+1
06 六月+4
05 六月+8
04 六月+8
03 六月+1
02 六月+4
01 六月+9
频道帖子
MTP спекулятивный декодинг в Gemma 4: ускоряемся в два раза без потери качества 🥳 В нашу дорогую гемму наконец завезли спеку
MTP спекулятивный декодинг в Gemma 4: ускоряемся в два раза без потери качества 🥳 В нашу дорогую гемму наконец завезли спекулятивный декодинг, когда более маленькая модель предсказывает токены, которые могут верифицироваться большой моделью параллельно, существенно ускоряя инференс для локальных юзкейзов. Попробовать можно через HuggingFace transformers, остальные движки тоже скоро будут поддерживать. блогпост, технический блог

2
Продолжаем геммапропаганду. В прошлом году у NVIDIA вышла неплохая статья о том, как ловить людей, которые доливают тест в тр
Продолжаем геммапропаганду. В прошлом году у NVIDIA вышла неплохая статья о том, как ловить людей, которые доливают тест в трейн. CoDeC – нормализованный показатель перплексии, где для тестсета бенчмарка считают изменения в перплексии с дополнительными примерами из того же бенчмарка. Для неконтаминированных моделек мы ожидаем, что дополнительные примеры не будут сбивать модель с толку, а в лучшем случае помогут. С другой стороны, если модель запомнила текст из теста, дополнительные примеры собьют её с толку и уверенность модели в ответе упадёт. Шкала нормализована от 0 до 100, где ~80% значит, что примеры из теста модель видела буквально, ~40% – в перефразированном виде. Товарищ с твиттера посчитал CoDeC для Gemma 4 и сравнил с Qwen 3.5 – почему-то у наших китайских коллег модель почти запоминает примеры из теста.
0
3
WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распозна
WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распознавание цифр со всего 28 размеченными примерами и ~50к неразмеченными, распознавание формы фигур, или восстановление перемешанных фрагментов изображений. Gemma 4 31B оказалась самой сильной открытой моделью на этом бенчмарке, опередив GLM 5 (MoE на 700B) и GPT-OSS с хорошим отрывом, показав результат на уровне с О3 или Gemini 2.5 Pro.
0
4
Мои любимые artificial analysis выложили своё независимое тестирование Gemma 4 (твит, страница с результатами), по результата
Мои любимые artificial analysis выложили своё независимое тестирование Gemma 4 (твит, страница с результатами), по результатам вышло хуже квенов из-за просадки на 𝜏²-bench, ну и ладно с ним. В этой версии мне довелось поработать над околонаучными бенчмарками и работой с длинным контекстом, а там мы наступаем на пятки китайским моделям на порядок больше вроде GLM 5 или DS 3.2.
0
5
Gemma 4 blogpost | huggingface 4 размера: E2B, E4b (бывшие Gemma 3n/Gemini Nano); 26A4B, 31B Dense
Gemma 4 blogpost | huggingface 4 размера: E2B, E4b (бывшие Gemma 3n/Gemini Nano); 26A4B, 31B Dense
0