epsilon correct
رفتن به کانال در Telegram
Машинное обучение, графы, языковые модели. Чуток про карьеру исследователя в FAANG, путь PhD и щепотка полезной математики. Связаться с автором: @deltaincorrect. Рекламы в канале нет.
نمایش بیشتر8 043
مشترکین
+324 ساعت
+117 روز
+2930 روز
در حال بارگیری داده...
کانالهای مشابه
ابر برچسبها
اشارات ورودی و خروجی
---
---
---
---
---
---
جذب مشترکین
ژوئن '26
ژوئن '26
+51
در 0 کانالها
مه '26
+148
در 0 کانالها
Get PRO
آوریل '26
+218
در 5 کانالها
Get PRO
مارس '26
+111
در 0 کانالها
Get PRO
فوریه '26
+256
در 2 کانالها
Get PRO
ژانویه '26
+171
در 3 کانالها
Get PRO
دسامبر '25
+109
در 5 کانالها
Get PRO
نوامبر '25
+152
در 2 کانالها
Get PRO
اکتبر '25
+106
در 3 کانالها
Get PRO
سپتامبر '25
+148
در 3 کانالها
Get PRO
اوت '25
+156
در 6 کانالها
Get PRO
ژوئیه '25
+147
در 2 کانالها
Get PRO
ژوئن '25
+214
در 5 کانالها
Get PRO
مه '25
+159
در 5 کانالها
Get PRO
آوریل '25
+213
در 3 کانالها
Get PRO
مارس '25
+521
در 10 کانالها
Get PRO
فوریه '25
+541
در 10 کانالها
Get PRO
ژانویه '25
+150
در 6 کانالها
Get PRO
دسامبر '24
+381
در 9 کانالها
Get PRO
نوامبر '24
+152
در 3 کانالها
Get PRO
اکتبر '24
+388
در 10 کانالها
Get PRO
سپتامبر '24
+2 489
در 19 کانالها
Get PRO
اوت '24
+198
در 10 کانالها
Get PRO
ژوئیه '24
+232
در 4 کانالها
Get PRO
ژوئن '24
+76
در 0 کانالها
Get PRO
مه '24
+85
در 4 کانالها
Get PRO
آوریل '24
+138
در 1 کانالها
Get PRO
مارس '24
+185
در 8 کانالها
Get PRO
فوریه '24
+105
در 3 کانالها
Get PRO
ژانویه '24
+119
در 1 کانالها
Get PRO
دسامبر '23
+408
در 3 کانالها
Get PRO
نوامبر '23
+52
در 0 کانالها
Get PRO
اکتبر '23
+165
در 3 کانالها
Get PRO
سپتامبر '23
+106
در 0 کانالها
Get PRO
اوت '23
+140
در 0 کانالها
Get PRO
ژوئیه '23
+1 495
در 0 کانالها
| تاریخ | رشد مشترکین | اشارات | کانالها | |
| 11 ژوئن | +1 | |||
| 10 ژوئن | +6 | |||
| 09 ژوئن | +3 | |||
| 08 ژوئن | +6 | |||
| 07 ژوئن | +1 | |||
| 06 ژوئن | +4 | |||
| 05 ژوئن | +8 | |||
| 04 ژوئن | +8 | |||
| 03 ژوئن | +1 | |||
| 02 ژوئن | +4 | |||
| 01 ژوئن | +9 |
پستهای کانال
MTP спекулятивный декодинг в Gemma 4: ускоряемся в два раза без потери качества 🥳
В нашу дорогую гемму наконец завезли спекулятивный декодинг, когда более маленькая модель предсказывает токены, которые могут верифицироваться большой моделью параллельно, существенно ускоряя инференс для локальных юзкейзов.
Попробовать можно через HuggingFace transformers, остальные движки тоже скоро будут поддерживать.
блогпост, технический блог
| 2 | Продолжаем геммапропаганду. В прошлом году у NVIDIA вышла неплохая статья о том, как ловить людей, которые доливают тест в трейн. CoDeC – нормализованный показатель перплексии, где для тестсета бенчмарка считают изменения в перплексии с дополнительными примерами из того же бенчмарка. Для неконтаминированных моделек мы ожидаем, что дополнительные примеры не будут сбивать модель с толку, а в лучшем случае помогут. С другой стороны, если модель запомнила текст из теста, дополнительные примеры собьют её с толку и уверенность модели в ответе упадёт. Шкала нормализована от 0 до 100, где ~80% значит, что примеры из теста модель видела буквально, ~40% – в перефразированном виде. Товарищ с твиттера посчитал CoDeC для Gemma 4 и сравнил с Qwen 3.5 – почему-то у наших китайских коллег модель почти запоминает примеры из теста. | 0 |
| 3 | WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распознавание цифр со всего 28 размеченными примерами и ~50к неразмеченными, распознавание формы фигур, или восстановление перемешанных фрагментов изображений.
Gemma 4 31B оказалась самой сильной открытой моделью на этом бенчмарке, опередив GLM 5 (MoE на 700B) и GPT-OSS с хорошим отрывом, показав результат на уровне с О3 или Gemini 2.5 Pro. | 0 |
| 4 | Мои любимые artificial analysis выложили своё независимое тестирование Gemma 4 (твит, страница с результатами), по результатам вышло хуже квенов из-за просадки на 𝜏²-bench, ну и ладно с ним.
В этой версии мне довелось поработать над околонаучными бенчмарками и работой с длинным контекстом, а там мы наступаем на пятки китайским моделям на порядок больше вроде GLM 5 или DS 3.2. | 0 |
| 5 | Gemma 4
blogpost | huggingface
4 размера: E2B, E4b (бывшие Gemma 3n/Gemini Nano); 26A4B, 31B Dense | 0 |
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
