Время Валеры
Мне платят за то, что я говорю другим людям что им делать. Автор книги https://www.manning.com/books/machine-learning-system-design https://venheads.io https://www.linkedin.com/in/venheads
إظهار المزيد📈 نظرة تحليلية على قناة تيليجرام Время Валеры
تُعد قناة Время Валеры (@cryptovalerii) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 30 146 مشتركاً، محتلاً المرتبة 4 559 في فئة التكنولوجيات والتطبيقات والمرتبة 21 867 في منطقة روسيا.
📊 مؤشرات الجمهور والحراك
منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 30 146 مشتركاً.
بحسب آخر البيانات بتاريخ 08 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار 43، وفي آخر 24 ساعة بمقدار 7، مع بقاء الوصول العام مرتفعاً.
- حالة التحقق: غير موثّقة
- معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 58.38%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 28.32% من ردود الفعل نسبةً إلى إجمالي المشتركين.
- وصول المنشورات: يحصل كل منشور على متوسط 17 599 مشاهدة. وخلال اليوم الأول يجمع عادةً 8 537 مشاهدة.
- التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 284.
- الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل engineer, claude, стартап, архитектура, many.
📝 الوصف وسياسة المحتوى
يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Мне платят за то, что я говорю другим людям что им делать.
Автор книги https://www.manning.com/books/machine-learning-system-design
https://venheads.io
https://www.linkedin.com/in/venheads”
بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 09 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.
If the future is AI-centric, do we still need humans? Consider a simple model of investment and return for a human. Traditionally, the more work experience accumulated (i.e., investment), the stronger the capability, and the greater the return. This leads to a monotonically increasing curve. This is why big tech companies have ladders: the job level generally goes up with years of service and experience. Now it is different. Ladders have become meaningless, and past experience is irrelevant. Human value has shifted from being evaluated by “the quantity and quality of labor produced by the individual” to “whether one can improve AI’s capabilities.” The equation now becomes: Human + AI > AI output.Еще из интересного, твиттере есть обсуждение его статьи — “Provable Scaling Laws of Feature Emergence from Learning Dynamics of Grokking”, где он пытается математически смоделировать тонкую грань между меморизацией и генерализацией в контексте grokking: когда сначала модель как будто переобучается и просто запоминает train set, а потом внезапно начинает действительно обобщать (delayed generalization). Сделано это пока на игрушечном датасете, но сама идея интересная: автор раскладывает обучение на несколько фаз — lazy learning → feature learning → interactive feature learning — и показывает, как из режима “модель тупо меморизирует” можно перейти к настоящей генерализации. И тут в дискуссию врывается другой мужик со своей работой “Grokking and Generalization Collapse: Insights from HTSR theory” и говорит: “подождите, мы вообще нашли два разных типа memorization”. — Pre-grokking memorization — до генерализации. — Anti-grokking — после генерализации, если тренировать очень долго (~10^6 steps), когда модель снова скатывается в memorization и происходит generalization collapse. Причём они интерпретируют это почти как spin-glass фазу: train accuracy идеальный, а generalization начинает деградировать. Но Tian и тут не потерялся (работу то уже потерял) и ответил довольно красиво: мол, это идеально укладывается в его energy landscape. Если данных мало, модель сидит прямо на границе между memorization и generalization. Причём memorization optimum может быть энергетически выгоднее. И тогда: — большой learning rate / шумный gradient / маленький batch size могут выбить модель из generalization basin обратно в memorization; — а маленький learning rate может, наоборот, удержать её в локальном optimum генерализации. То есть получается уже почти практическая инструкция по достижению grokking: — weight decay нужен не просто “для регуляризации”, а чтобы после initial overfitting вообще появился сигнал для feature learning; — LR и gradient noise определяют, удержится ли модель в basin генерализации; — слишком долгое обучение может привести к anti-grokking и collapse генерализации. Самое интересное во всей этой истории — memorization и generalization начинают рассматривать не как два противоположных состояния, а как конкурирующие локальные минимумы, между которыми модель может перескакивать в зависимости от динамики оптимизации.
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
