fa
Feedback
Just links

Just links

رفتن به کانال در Telegram

That's just link aggregator of everything I consider interesting, especially DL and topological condensed matter physics. @EvgeniyZh

نمایش بیشتر
6 777
مشترکین
+424 ساعت
+127 روز
+1930 روز

در حال بارگیری داده...

جذب مشترکین
ژوئن '26
ژوئن '26
+37
در 1 کانال‌ها
مه '26
+106
در 0 کانال‌ها
Get PRO
آوریل '26
+155
در 1 کانال‌ها
Get PRO
مارس '26
+232
در 9 کانال‌ها
Get PRO
فوریه '26
+132
در 4 کانال‌ها
Get PRO
ژانویه '26
+105
در 3 کانال‌ها
Get PRO
دسامبر '25
+129
در 2 کانال‌ها
Get PRO
نوامبر '25
+136
در 2 کانال‌ها
Get PRO
اکتبر '25
+147
در 4 کانال‌ها
Get PRO
سپتامبر '25
+138
در 3 کانال‌ها
Get PRO
اوت '25
+143
در 1 کانال‌ها
Get PRO
ژوئیه '25
+137
در 4 کانال‌ها
Get PRO
ژوئن '25
+190
در 1 کانال‌ها
Get PRO
مه '25
+218
در 3 کانال‌ها
Get PRO
آوریل '25
+293
در 0 کانال‌ها
Get PRO
مارس '25
+259
در 0 کانال‌ها
Get PRO
فوریه '25
+401
در 3 کانال‌ها
Get PRO
ژانویه '25
+259
در 7 کانال‌ها
Get PRO
دسامبر '24
+184
در 1 کانال‌ها
Get PRO
نوامبر '24
+105
در 2 کانال‌ها
Get PRO
اکتبر '24
+123
در 1 کانال‌ها
Get PRO
سپتامبر '24
+128
در 2 کانال‌ها
Get PRO
اوت '24
+186
در 2 کانال‌ها
Get PRO
ژوئیه '24
+793
در 6 کانال‌ها
Get PRO
ژوئن '24
+131
در 4 کانال‌ها
Get PRO
مه '24
+146
در 4 کانال‌ها
Get PRO
آوریل '24
+96
در 0 کانال‌ها
Get PRO
مارس '24
+145
در 1 کانال‌ها
Get PRO
فوریه '24
+139
در 4 کانال‌ها
Get PRO
ژانویه '24
+406
در 6 کانال‌ها
Get PRO
دسامبر '23
+189
در 3 کانال‌ها
Get PRO
نوامبر '23
+98
در 5 کانال‌ها
Get PRO
اکتبر '23
+56
در 3 کانال‌ها
Get PRO
سپتامبر '23
+126
در 0 کانال‌ها
Get PRO
اوت '23
+94
در 0 کانال‌ها
Get PRO
ژوئیه '23
+159
در 0 کانال‌ها
Get PRO
ژوئن '23
+160
در 0 کانال‌ها
Get PRO
مه '23
+1 583
در 0 کانال‌ها
Get PRO
آوریل '23
+100
در 0 کانال‌ها
Get PRO
مارس '23
+102
در 0 کانال‌ها
Get PRO
فوریه '23
+37
در 0 کانال‌ها
Get PRO
ژانویه '23
+39
در 0 کانال‌ها
Get PRO
دسامبر '22
+54
در 0 کانال‌ها
Get PRO
نوامبر '22
+46
در 0 کانال‌ها
Get PRO
اکتبر '22
+32
در 0 کانال‌ها
Get PRO
سپتامبر '22
+19
در 0 کانال‌ها
Get PRO
اوت '22
+84
در 0 کانال‌ها
Get PRO
ژوئیه '22
+98
در 0 کانال‌ها
Get PRO
ژوئن '22
+117
در 0 کانال‌ها
Get PRO
مه '22
+122
در 0 کانال‌ها
Get PRO
آوریل '22
+43
در 0 کانال‌ها
Get PRO
مارس '22
+49
در 0 کانال‌ها
Get PRO
فوریه '22
+36
در 0 کانال‌ها
Get PRO
ژانویه '22
+28
در 0 کانال‌ها
Get PRO
دسامبر '21
+126
در 0 کانال‌ها
Get PRO
نوامبر '21
+43
در 0 کانال‌ها
Get PRO
اکتبر '21
+52
در 0 کانال‌ها
Get PRO
سپتامبر '21
+74
در 0 کانال‌ها
Get PRO
اوت '21
+41
در 0 کانال‌ها
Get PRO
ژوئیه '21
+49
در 0 کانال‌ها
Get PRO
ژوئن '21
+33
در 0 کانال‌ها
Get PRO
مه '21
+37
در 0 کانال‌ها
Get PRO
آوریل '21
+83
در 0 کانال‌ها
Get PRO
مارس '21
+50
در 0 کانال‌ها
Get PRO
فوریه '21
+27
در 0 کانال‌ها
Get PRO
ژانویه '21
+68
در 0 کانال‌ها
Get PRO
دسامبر '20
+1 316
در 0 کانال‌ها
تاریخ
رشد مشترکین
اشارات
کانال‌ها
15 ژوئن+1
14 ژوئن+4
13 ژوئن+3
12 ژوئن+3
11 ژوئن+2
10 ژوئن+2
09 ژوئن+7
08 ژوئن+1
07 ژوئن+1
06 ژوئن+4
05 ژوئن+2
04 ژوئن+2
03 ژوئن+1
02 ژوئن+1
01 ژوئن+3
پست‌های کانال
2
https://github.com/eth-sri/proof-council/blob/main/ProofCouncil.pdf
958
3
Oasis 3 The Interactive World Model for Physical AI https://decart.ai/oasis?trk=feed_main-feed-card-text
1 078
4
https://www.ecdsa.fail/
1 300
5
First Proof Second Batch https://1stproof.org/assets/docs/report.pdf
1 229
6
Handbook of Error-Correcting Codes https://arxiv.org/abs/2606.11484
1 221
7
The Invisible Hand of Physics: When Video Diffusion Models Know More Than They Show https://arxiv.org/abs/2606.05328
1 341
8
SWE-Marathon https://www.swe-marathon.org/
1 541
9
Oxygen-centred planar orbitals in the electronic structure and spin-density-wave reconstruction of multilayer nickelates https://www.nature.com/articles/s41567-026-03286-4
1 371
10
Efficiently Reconstructing Dynamic Scenes One D4RT at a Time https://arxiv.org/abs/2512.08924
1 337
11
NitroGen: An Open Foundation Model for Generalist Gaming Agents https://arxiv.org/abs/2601.02427
1 264
12
Agents' Last Exam https://agenthle.org/leaderboard
1 493
13
Engineering Quantum Criticality in the Integer Quantum Hall Regime through a Screening Layer https://arxiv.org/abs/2605.30129
1 397
14
LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks https://arxiv.org/abs/2606.03303
1 498
15
Прочитал интересную (и применимую) статью Rethinking Early Stopping: Refine, Then Calibrate. Часто в курсах по машинному обучению говорят, что ошибку системы можно разложить на bias, variance, noise. На некоторых редких курсах даже учат, как это считать и что с этим делать дальше. Попробуем посмотреть на эту проблему с другой стороны. В задачах вероятностной классификации loss для proper scoring rules можно разложить на: calibration и refinement. Калибровка — мы сказали, что вероятность 80%. Сколько из взятых образцов будут принадлежать к классу 1? (Считать это можно через ECE — Expected Calibration Error). Refinement — насколько хорошо модель разделяет классы. Допустим, модель выдала скор 0.9, все образцы оказались класса 1, а все, что ниже — класса 0. Модель откалибрована так себе, но разделяет классно. Собственно, если бы модель была откалибрована, мы могли бы выбирать отсечку вероятностно через саму вероятность. Легко представить и обратную ситуацию: модель прекрасно откалибрована, но разделяет плохо. Например, модель, которая всегда предсказывает вероятность 50% для честной монетки, идеально откалибрована, но её разделяющая способность минимальна. Из чего делаем вывод, что в какой-то момент улучшение функции потерь, из тех что относятся к семейству proper scoring functions, может происходить лишь за счет улучшения калибровки или даже ухудшать разделение, но за счет большого по величине улучшения калибровки выдавать лучший скор. Это плохо. Калибровку часто можно существенно поправить потом post-hoc методами, поэтому остановка обучения по лоссу на валидации может привести к ситуации, что мы взяли далеко не лучший чекпойнт. Что делать? Сохранить несколько чекпойнтов модели. Откалибровать каждый из них одинаковым методом. Только после этого сравнивать их по loss. В таком случае для каждого чекпойнта мы отдельно минимизируем доступную calibration error выбранным post-hoc методом (ссылка на запись вебинара), а разница в loss начинает лучше отражать именно качество разделения классов. Соответственно, мы выбираем модель с лучшей разделяющей способностью, а не ту, которая случайно оказалась лучше откалибрована на данном этапе обучения. Проверили на датасетах для computer vision и 196 табличных датасетах — так и оказалось, победа. Может ли это хотя бы частично объяснять эффекты вроде grokking или double descent? Там мы тоже наблюдаем нетривиальную динамику loss во времени. Возможно, на ранних этапах обучения модель в основном улучшает калибровку, затем временно жертвует ей ради построения более качественной разделяющей поверхности, а потом начинает улучшать уже обе составляющие одновременно. #ArticleReview
1 295
16
Scalable Concurrent Queues for GPU https://arxiv.org/abs/2606.01693
1 307
17
EUDAIMONIA: Evaluating Undesirable Dynamics in AI https://arxiv.org/abs/2605.30654
1 484
18
Ideogram 4: Open image model at the forefront of design https://github.com/ideogram-oss/ideogram4
1 665
19
20 Second Parity Lifetime in an InAs–Pb Tetron Device https://quantum.scene7.com/is/content/quantum/Majorana-2-Tech-Paperpdf
1 692
20
PokerSkill: LLMs Can Play Expert-Level Poker without Training or Solvers https://arxiv.org/abs/2605.30094
2 316