Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
إظهار المزيد📈 نظرة تحليلية على قناة تيليجرام Machinelearning
تُعد قناة Machinelearning (@ai_machinelearning_big_data) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 298 105 مشتركاً، محتلاً المرتبة 323 في فئة التكنولوجيات والتطبيقات والمرتبة 1 260 في منطقة روسيا.
📊 مؤشرات الجمهور والحراك
منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 298 105 مشتركاً.
بحسب آخر البيانات بتاريخ 11 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -7 224، وفي آخر 24 ساعة بمقدار -206، مع بقاء الوصول العام مرتفعاً.
- حالة التحقق: غير موثّقة
- معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 7.69%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 5.95% من ردود الفعل نسبةً إلى إجمالي المشتركين.
- وصول المنشورات: يحصل كل منشور على متوسط 22 918 مشاهدة. وخلال اليوم الأول يجمع عادةً 17 745 مشاهدة.
- التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 176.
- الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل openai, claude, api, gemini, контекст.
📝 الوصف وسياسة المحتوى
يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 12 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.
Чтобы ИИ приносил конкретные результаты, важно понимать ограничения своей ИТ-инфраструктуры. Спецпроект российского разработчика ПО поможет пройти практический путь к ИИ: от первичной оценки готовности инфраструктуры — до конкретных решений и рекомендаций экспертов, которые внедряют ИИ в продакшн.Вы можете выбрать любую из следующих активностей или все: Чек-лист готовности инфраструктуры к ИИ • определите свой уровень инфраструктуры • получите подробные рекомендации по каждому из этапов Серия вебинаров • как стартовать ИИ без типовых ошибок • где считать экономику • архитектура production-ИИ • реальная стоимость «своей платформы» Персональный аудит • разбор вашей инфраструктуры с экспертами Orion soft • рекомендации под конкретные AI/ML-сценарии • практические шаги внедрения Подробнее #ai #ml
Диффузионные модели плохо справляются с текстом, в процессе генерации буквы для них ничем не отличаются от любой другой текстуры, нет встроенного представления о символах как о дискретных единицах со стабильной формой. С кириллицей ситуация усугубляется дисбалансом обучающих данных: в открытых датасетах её доля минимальна, а доступные примеры с русским текстом в большинстве низкого качества - их прямое добавление в претрейн просаживает эстетику и общее качество генерации.🟡 Технические изменения 🟠 Собственный датасет пар «изображение - текст» с разметкой глифов: 30 млн примеров в претрейн и около 100 тыс. в файнтюн, отобранных по качеству и визуальной эстетике. Ключевой фокус - на разнообразии символов и токенов, без этого модель хорошо писала бы только частотные буквы. 🟠 Переход с UNet на Diffusion Transformer - трансформерная архитектура лучше работает с пространственными связями между удалёнными участками картинки, что критично для длинных надписей. 🟠 Замена текстового энкодера на LLM для более точного понимания семантики и контекста запроса. 🟠 Обучение на русскоязычных промптах вместо схемы с переводом с английского. 🟡 Результаты внутренних замеров 🟢 Кириллический текст - фразы 7–9 слов корректно генерируются в большинстве случаев (предыдущая версия с ними практически не справлялась) 🟢 Общее качество — доля генераций без визуальных искажений выросла на треть 🟢 Локальная айдентика - 85% корректных генераций, на уровне топовых индустриальных решений
По доле успешных генераций кириллического текста Alice AI ART показывает лучшие результаты среди российских моделей. Команда также рекомендует приёмы промптинга для получения заявленного роста качества генерации — заключать текст в кавычки, сложные слова писать заглавными, длинные фразы разбивать на части с явным указанием расположения.https://admin.kod.ru/alisa-ai-russkiy-tekst-na-kartinkah-prompty/ @ai_machinelearning_big_data #news #ai #ml
Если капитальные затраты распределить на срок службы оборудования, совокупная стоимость владения составляет примерно $8,5 млрд в год.Около 60% этой суммы (порядка $5 млрд) приходится на серверы. Расходы на их фоне невелики: даже электроэнергия, крупнейшая операционная статья, по оценке обойдется в $600 млн в год. Авторы оговариваются, что это упрощённая финмодель, а не оценка конкретного объекта. Расчёт описывает гипотетический ЦОД крупного американского оператора облачной инфраструктуры на оборудовании NVIDIA GB200 NVL72.
Реальные издержки могут заметно отличаться в зависимости от выбора серверов, проектирования, расположения, схемы финансирования и стратегии энергоснабжения.Главная неопределённость расчётов связана со сроком службы IT-оборудования. Базовый сценарий исходит из 5 лет для серверов и сетевой инфраструктуры и 14 лет для здания. При сроке в 3 года годовая стоимость владения возрастает примерно до $12–13 млрд, при 7 - снижается до $7 млрд.
Оценка опирается на статистику государственного энергорегулятора США, показатели энергоэффективности Lawrence Berkeley Lab, стоимость серверов по выкладкам SemiAnalysis, строительные индексы Turner & Townsend и ряд других источников. Модель предполагает полное питание от энергосети и не учитывает собственную генерацию, налоговые льготы оценены приблизительно.Обновлённый расчёт даёт стоимость владения $8,5 млн на мегаватт в год против прежних $10,8 млн. Снижение авторы объясняют переходом на новое оборудование и пересмотром части исходных данных. @ai_machinelearning_big_data #news #ai #ml
Raindrop - стартап из 9 человек, основанный в 2023 году, который позиционирует себя одним из первых, кто оформил мониторинг для ИИ-агентов как отдельный продуктовый класс.При использовании Workshop модель получает прямой доступ к трассировкам выполнения, читает их, пишет оценочные тесты и правит код, замыкая цикл самовосстановления. Если агент в проде отклоняется от ожидаемого поведения, разработчик вызывает кодинг-агента прямо в терминале. Тот читает трассу через Workshop, пишет оценку под падающий сценарий, правит код и перезапускает прогон.
Цикл повторяется автоматически, пока не пройдут все проверки.Workshop работает локально и стримит данные в реальном времени. Каждый токен, вызов инструмента и шаг рассуждения попадает в интерфейс по мере выполнения, без поллинга. Есть режим воспроизведение, который берёт трассу из продакшена и прогоняет её через ваш экземпляр агента, запущенный локально. Заявлена поддержка TypeScript, Python, Go и Rust, а также фреймворков Vercel AI SDK, OpenAI Agents SDK, Anthropic SDK, Claude Agent SDK, LangChain, LangGraph, CrewAI, Mastra, Pydantic AI и DSPy. 📌 Лицензирование: MIT License 🟡Документация 🖥GitHub @ai_machinelearning_big_data #AI #ML #Agents #Workshop #RaindropAI
xai-org/x-algorithm опубликован код системы, которая питает For You feed: от подбора кандидатов на показ до финального ранжирования постов. Внутри два основных источника контента:
- посты от аккаунтов, на которые вы подписаны
- посты из глобального корпуса, найденные через ML-retrieval
Дальше всё прогоняется через Phoenix - transformer-модель на базе архитектуры Grok. Она оценивает вероятности действий пользователя: лайк, реплай, репост, клик и другие сигналы. После этого система собирает итоговый score и решает, что именно попадёт в ленту.
Можно посмотреть, какие сигналы действительно влияют на рекомендации, как устроен ranking pipeline и где платформа фильтрует контент перед показом.
GitHub: https://github.com/xai-org/x-algorithm
@ai_machinelearning_big_dataAdaption основан в 2025 году бывшими руководителями направлений в Cohere. Компания строит то, что называет adaptable intelligence: системы, которые подстраиваются под конкретную задачу. Среди инвесторов Adaption: Emergence Capital, Mozilla Ventures и Threshold Ventures. AutoScientist - третий продукт компании. До него вышли Adaptive Data, платформа подготовки и оптимизации датасетов для дообучения, и Forge, инструмент для превращения неструктурированных документов в готовые для тренировки наборы данных. AutoScientist надстраивается над Adaptive Data, замыкая связку «данные - модель». Четвёртое направление, Adaptive Interfaces, система обратной связи от пользователей, компания заявила, но пока не выпустила.AutoScientist закрывает типовые причины провала файн-тюнинга: катастрофическое забывание, переобучение на маленьких датасетах и конфликтующие сигналы тренировки. Для разработчиков это путь от идеи до собственной дообученной модели за несколько часов вместо недель, а для специалистов без профильного образования - доступ к тренировке моделей, а не только к промптингу. Внутреннее тестирование на 8 отраслевых бенчмарках подтвердило успех алгоритма над конфигурациями, которые создавали штатные инженеры Adaption.
Исследователи задавали конфигурации, зная тип модели, домен и размер датасета. AutoScientist получал ту же информацию и мог дообучаться на ограниченном наборе прошлых запусков.При работе с архитектурами на базе Together AI и датасетами от 5 до 100 тысяч примеров AutoScientist увеличил показатель успешных дообучений с 48% до 64%. Система показала стабильный результат во всех протестированных доменах и избежала чувствительности к конкретным вертикалям данных. Сейчас платформа доступна бесплатно в рамках 30-дневного ознакомительного периода.
В дальнейшем Adaption обещает представить технологию адаптации в реальном времени, которая позволит корректировать поведение моделей без классического цикла тренировки.@ai_machinelearning_big_data #news #ai #ml
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
