Время Валеры
Мне платят за то, что я говорю другим людям что им делать. Автор книги https://www.manning.com/books/machine-learning-system-design https://venheads.io https://www.linkedin.com/in/venheads
Показати більше📈 Аналітичний огляд Telegram-каналу Время Валеры
Канал Время Валеры (@cryptovalerii) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 30 146 підписників, посідаючи 4 559 місце в категорії Технології та додатки та 21 867 місце у регіоні Росія.
📊 Показники аудиторії та динаміка
З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 30 146 підписників.
За останніми даними від 08 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на 43, а за останні 24 години на 7, загальне охоплення залишається високим.
- Статус верифікації: Не верифікований
- Рівень залученості (ER): Середній показник залученості аудиторії становить 58.38%. Протягом перших 24 годин після публікації контент зазвичай збирає 28.32% реакцій від загальної кількості підписників.
- Охоплення публікацій: В середньому кожен допис отримує 17 599 переглядів. Протягом першої доби публікація в середньому набирає 8 537 переглядів.
- Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 284.
- Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як engineer, claude, стартап, архитектура, many.
📝 Опис та контентна політика
Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Мне платят за то, что я говорю другим людям что им делать.
Автор книги https://www.manning.com/books/machine-learning-system-design
https://venheads.io
https://www.linkedin.com/in/venheads”
Завдяки високій частоті оновлень (останні дані отримано 09 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.
If the future is AI-centric, do we still need humans? Consider a simple model of investment and return for a human. Traditionally, the more work experience accumulated (i.e., investment), the stronger the capability, and the greater the return. This leads to a monotonically increasing curve. This is why big tech companies have ladders: the job level generally goes up with years of service and experience. Now it is different. Ladders have become meaningless, and past experience is irrelevant. Human value has shifted from being evaluated by “the quantity and quality of labor produced by the individual” to “whether one can improve AI’s capabilities.” The equation now becomes: Human + AI > AI output.Еще из интересного, твиттере есть обсуждение его статьи — “Provable Scaling Laws of Feature Emergence from Learning Dynamics of Grokking”, где он пытается математически смоделировать тонкую грань между меморизацией и генерализацией в контексте grokking: когда сначала модель как будто переобучается и просто запоминает train set, а потом внезапно начинает действительно обобщать (delayed generalization). Сделано это пока на игрушечном датасете, но сама идея интересная: автор раскладывает обучение на несколько фаз — lazy learning → feature learning → interactive feature learning — и показывает, как из режима “модель тупо меморизирует” можно перейти к настоящей генерализации. И тут в дискуссию врывается другой мужик со своей работой “Grokking and Generalization Collapse: Insights from HTSR theory” и говорит: “подождите, мы вообще нашли два разных типа memorization”. — Pre-grokking memorization — до генерализации. — Anti-grokking — после генерализации, если тренировать очень долго (~10^6 steps), когда модель снова скатывается в memorization и происходит generalization collapse. Причём они интерпретируют это почти как spin-glass фазу: train accuracy идеальный, а generalization начинает деградировать. Но Tian и тут не потерялся (работу то уже потерял) и ответил довольно красиво: мол, это идеально укладывается в его energy landscape. Если данных мало, модель сидит прямо на границе между memorization и generalization. Причём memorization optimum может быть энергетически выгоднее. И тогда: — большой learning rate / шумный gradient / маленький batch size могут выбить модель из generalization basin обратно в memorization; — а маленький learning rate может, наоборот, удержать её в локальном optimum генерализации. То есть получается уже почти практическая инструкция по достижению grokking: — weight decay нужен не просто “для регуляризации”, а чтобы после initial overfitting вообще появился сигнал для feature learning; — LR и gradient noise определяют, удержится ли модель в basin генерализации; — слишком долгое обучение может привести к anti-grokking и collapse генерализации. Самое интересное во всей этой истории — memorization и generalization начинают рассматривать не как два противоположных состояния, а как конкурирующие локальные минимумы, между которыми модель может перескакивать в зависимости от динамики оптимизации.
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
