epsilon correct
Kanalga Telegram’da o‘tish
Машинное обучение, графы, языковые модели. Чуток про карьеру исследователя в FAANG, путь PhD и щепотка полезной математики. Связаться с автором: @deltaincorrect. Рекламы в канале нет.
Ko'proq ko'rsatish8 061
Obunachilar
+824 soatlar
+157 kunlar
+4730 kunlar
Ma'lumot yuklanmoqda...
O'xshash kanallar
Taglar buluti
Kirish va chiqish esdaliklari
---
---
---
---
---
---
Obunachilarni jalb qilish
Iyun '26
Iyun '26
+94
0 kanalda
May '26
+148
0 kanalda
Get PRO
Aprel '26
+218
5 kanalda
Get PRO
Mart '26
+111
0 kanalda
Get PRO
Fevral '26
+256
2 kanalda
Get PRO
Yanvar '26
+171
3 kanalda
Get PRO
Dekabr '25
+109
5 kanalda
Get PRO
Noyabr '25
+152
2 kanalda
Get PRO
Oktabr '25
+106
3 kanalda
Get PRO
Sentabr '25
+148
3 kanalda
Get PRO
Avgust '25
+156
6 kanalda
Get PRO
Iyul '25
+147
2 kanalda
Get PRO
Iyun '25
+214
5 kanalda
Get PRO
May '25
+159
5 kanalda
Get PRO
Aprel '25
+213
3 kanalda
Get PRO
Mart '25
+521
10 kanalda
Get PRO
Fevral '25
+541
10 kanalda
Get PRO
Yanvar '25
+150
6 kanalda
Get PRO
Dekabr '24
+381
9 kanalda
Get PRO
Noyabr '24
+152
3 kanalda
Get PRO
Oktabr '24
+388
10 kanalda
Get PRO
Sentabr '24
+2 489
19 kanalda
Get PRO
Avgust '24
+198
10 kanalda
Get PRO
Iyul '24
+232
4 kanalda
Get PRO
Iyun '24
+76
0 kanalda
Get PRO
May '24
+85
4 kanalda
Get PRO
Aprel '24
+138
1 kanalda
Get PRO
Mart '24
+185
8 kanalda
Get PRO
Fevral '24
+105
3 kanalda
Get PRO
Yanvar '24
+119
1 kanalda
Get PRO
Dekabr '23
+408
3 kanalda
Get PRO
Noyabr '23
+52
0 kanalda
Get PRO
Oktabr '23
+165
3 kanalda
Get PRO
Sentabr '23
+106
0 kanalda
Get PRO
Avgust '23
+140
0 kanalda
Get PRO
Iyul '23
+1 495
0 kanalda
| Sana | Obunachilarni jalb qilish | Esdaliklar | Kanallar | |
| 16 Iyun | +4 | |||
| 15 Iyun | +8 | |||
| 14 Iyun | +6 | |||
| 13 Iyun | +5 | |||
| 12 Iyun | +18 | |||
| 11 Iyun | +3 | |||
| 10 Iyun | +6 | |||
| 09 Iyun | +3 | |||
| 08 Iyun | +6 | |||
| 07 Iyun | +1 | |||
| 06 Iyun | +4 | |||
| 05 Iyun | +8 | |||
| 04 Iyun | +8 | |||
| 03 Iyun | +1 | |||
| 02 Iyun | +4 | |||
| 01 Iyun | +9 |
Kanal postlari
MTP спекулятивный декодинг в Gemma 4: ускоряемся в два раза без потери качества 🥳
В нашу дорогую гемму наконец завезли спекулятивный декодинг, когда более маленькая модель предсказывает токены, которые могут верифицироваться большой моделью параллельно, существенно ускоряя инференс для локальных юзкейзов.
Попробовать можно через HuggingFace transformers, остальные движки тоже скоро будут поддерживать.
блогпост, технический блог
| 2 | Продолжаем геммапропаганду. В прошлом году у NVIDIA вышла неплохая статья о том, как ловить людей, которые доливают тест в трейн. CoDeC – нормализованный показатель перплексии, где для тестсета бенчмарка считают изменения в перплексии с дополнительными примерами из того же бенчмарка. Для неконтаминированных моделек мы ожидаем, что дополнительные примеры не будут сбивать модель с толку, а в лучшем случае помогут. С другой стороны, если модель запомнила текст из теста, дополнительные примеры собьют её с толку и уверенность модели в ответе упадёт. Шкала нормализована от 0 до 100, где ~80% значит, что примеры из теста модель видела буквально, ~40% – в перефразированном виде. Товарищ с твиттера посчитал CoDeC для Gemma 4 и сравнил с Qwen 3.5 – почему-то у наших китайских коллег модель почти запоминает примеры из теста. | 0 |
| 3 | WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распознавание цифр со всего 28 размеченными примерами и ~50к неразмеченными, распознавание формы фигур, или восстановление перемешанных фрагментов изображений.
Gemma 4 31B оказалась самой сильной открытой моделью на этом бенчмарке, опередив GLM 5 (MoE на 700B) и GPT-OSS с хорошим отрывом, показав результат на уровне с О3 или Gemini 2.5 Pro. | 0 |
| 4 | Мои любимые artificial analysis выложили своё независимое тестирование Gemma 4 (твит, страница с результатами), по результатам вышло хуже квенов из-за просадки на 𝜏²-bench, ну и ладно с ним.
В этой версии мне довелось поработать над околонаучными бенчмарками и работой с длинным контекстом, а там мы наступаем на пятки китайским моделям на порядок больше вроде GLM 5 или DS 3.2. | 0 |
| 5 | Gemma 4
blogpost | huggingface
4 размера: E2B, E4b (бывшие Gemma 3n/Gemini Nano); 26A4B, 31B Dense | 0 |
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
