Data Secrets
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN
إظهار المزيد📈 نظرة تحليلية على قناة تيليجرام Data Secrets
تُعد قناة Data Secrets (@data_secrets) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 90 794 مشتركاً، محتلاً المرتبة 1 406 في فئة التكنولوجيات والتطبيقات والمرتبة 6 168 في منطقة روسيا.
📊 مؤشرات الجمهور والحراك
منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 90 794 مشتركاً.
بحسب آخر البيانات بتاريخ 30 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار 572، وفي آخر 24 ساعة بمقدار 8، مع بقاء الوصول العام مرتفعاً.
- حالة التحقق: موثّقة (مؤكدة رسمياً من تيليجرام)
- معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 26.18%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 19.14% من ردود الفعل نسبةً إلى إجمالي المشتركين.
- وصول المنشورات: يحصل كل منشور على متوسط 23 775 مشاهدة. وخلال اليوم الأول يجمع عادةً 17 377 مشاهدة.
- التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 311.
- الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل claude, openai, контекст, стартап, llm.
📝 الوصف وسياسة المحتوى
يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Главный по машинному обучению
Сотрудничество: @veron_28
РКН: clck.ru/3FY3GN”
بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 01 يوليو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.
"Уменьшая размер нашей команды, мы уменьшаем время для принятия решений и увеличиваем влияние каждого сотрудника, - написал Александр Ванг в записке для коллег.Есть одно утешение для уволенных сотрудников: Meta активно поощрает бывших коллег устраиваться в другие подразделения. Хочется ли им оставаться в компании после такого увольнения – уже другой вопрос.
🤖 Agent-as-Judge — универсальный «судья», способный оценивать ИИ-тексты. 🧠 Human-centered AI Assistant — персонализированный ассистент на основе GigaChat, имитирующий поведение людей и способный предугадать их предпочтения. Бонус: Участникам предоставляются токены для API + возможность получить дополнительно 1 млн токенов! 💾 GigaMemory — механизм долговременной памяти для LLM, помогающий ассистенту запоминать и использовать важные факты в диалоге.Не упусти возможность не только прокачать свои скиллы, получить заветную строчку в списке своих достижений и выиграть солидный приз, но и заявить о себе на AI Journey — главной международной конференции по ИИ в России! ➡️ Соревнование заканчивается уже 30 октября. Спеши зарегистрироваться по ссылке.
Мне достаточно сильно понравилась новая статья про DeepSeek-OCR. Там есть нюансы с датасетом и прочим, но это неважно. Для меня гораздо интереснее (особенно как для CV-инженера, временно притворяющегося NLP-специалистом) вопрос о том, не лучше ли подавать в LLM не текст, а пиксели. Может быть, текстовые токены вообще неудачный и расточительный вариант для инпута? Может, правильнее было бы, если все входы для LLM всегда были изображениями. Даже если у нас чисто текстовый ввод, можно ведь просто отрендерить его и подать как картинку. Получается: – Более высокая степень сжатия информации → короче контекстные окна, выше эффективность. – Более универсальный поток данных → не только текст, но и жирный шрифт, цвет, произвольные изображения и другие визуальные элементы. – Можно использовать bidirectional attention по умолчанию, а не авторегрессию, и это гораздо мощнее. – Можно выкинуть токенизатор! Я уже не раз говорил, насколько ненавижу токенайзеры. Они уродливы, тащат за собой весь ужас Unicode, исторического мусора и даже проблемы безопасности. Токенизация должна умереть. OCR это лишь одна из полезных vision2text задач. Получается, что любую text2text задачу можно превратить в vision2text. Но не наоборот. Теперь мне приходится сдерживать соблазн сделать версию nanochat, которая принимает на вход только изображенияНаш разбор статьи читайте здесь
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
