Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Ko'proq ko'rsatish📈 Telegram kanali Machinelearning analitikasi
Machinelearning (@ai_machinelearning_big_data) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 297 383 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 324-o'rinni va Rossiya mintaqasida 1 261-o'rinni egallagan.
📊 Auditoriya ko‘rsatkichlari va dinamika
невідомо sanasidan buyon loyiha tez o‘sib, 297 383 obunachiga ega bo‘ldi.
14 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -6 744 ga, so‘nggi 24 soatda esa -170 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.
- Tasdiqlash holati: Tasdiqlanmagan
- Jalb etish (ER): Auditoriya o‘rtacha 8.03% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.69% ini tashkil etuvchi reaksiyalarni to‘playdi.
- Post qamrovi: Har bir post o‘rtacha 23 912 marta ko‘riladi; birinchi sutkada odatda 16 939 ta ko‘rish yig‘iladi.
- Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 186 ta reaksiya keladi.
- Tematik yo‘nalishlar: Kontent openai, claude, api, gemini, контекст kabi asosiy mavzularga jamlangan.
📝 Tavsif va kontent siyosati
Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
Yuqori yangilanish chastotasi (oxirgi ma’lumot 15 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.
n точек на плоскости. Нужно понять, сколько пар точек могут находиться ровно на расстоянии 1 друг от друга.
Долгое время считалось, что почти оптимальный ответ дают конструкции, похожие на квадратную решётку. Модель OpenAI показала, что это неверно.
Она построила бесконечное семейство конфигураций, где таких пар получается заметно больше, чем ожидалось. То есть была опровергнута не мелкая техническая деталь, а известная гипотеза, вокруг которой десятилетиями строились оценки.
Модель связала задачу о точках на плоскости с алгебраической теорией чисел.
В доказательстве используются решётки Минковского (способ превратить числа из алгебраической теории чисел в точки в обычном евклидовом пространстве), элементы нормы один и pro-3 башни числовых полей. Это инструменты из другой части математики, и именно их перенос в геометрию дал результат.
Нога Алон из Принстона отметил, что ответ оказался неожиданным, а применённые методы выглядят элегантно и нетривиально.
При этом доказательство не даёт нового «чисто геометрического» метода, на который многие надеялись. Гипотеза опровергнута, но сама структура задачи стала ещё интереснее.
Задачу сформулировал ИИ, решение сгенерировала внутренняя модель OpenAI, первичная проверка тоже прошла через автоматический ИИ-пайплайн. После этого люди проверили детали, улучшили изложение и довели работу до публикации.
Модель сама нашла неочевидную связь между разными областями математики и получила результат по открытой задаче высокого уровня.
Оригинал: https://openai.com/index/model-disproves-discrete-geometry-conjecture/
@ai_machinelearning_big_dataРазмер батча - один из двух ключевых параметров метода. Оптимальное значение растёт вместе с размером модели: для 270 млн параметров оно лежало в диапазоне от 3 до 8 токенов, а для 10 млрд равнялось 16Оставшуюся часть обучения модель переводят на обычный режим предсказания следующего токена. По словам Nous Research, готовая модель на инференсе ничем не отличается от обученной стандартным способом - архитектура, оптимизатор, токенизатор или набор данных не изменяются. Метод протестили на моделях 4-х размеров: 270 млн, 600 млн и 3 млрд параметров, а также на 10 миллиардной MoE. В самом крупном эксперименте модель с TST достигла более низкого значения лосса, чем сопоставимая по вычислениям базовая модель, примерно за 40% времени и показала лучшие результаты на тестах HellaSwag, ARC и MMLU. 🟡Ограничения TST расходует обучающие данные быстрее обычного, поскольку модель переваривает больше текста. Если обучающих данных мало, метод становится контрпродуктивным. 🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Pertrain #TST #NousResearch
Вам не обязательно интересоваться ИИ. Какую бы карьеру вы ни выбрали, ИИ всё равно будет ее частью.И зал раздался свистом. Студенты воспринимают это так:
Вам придётся конкурировать с машинами за вашу первую работу.Но с другой стороны, они находятся в лучшей позиции, чем предшественники и могут использовать мощные ИИ-инструменты уже на самом старте своей карьеры.
mcp.bfl.ai и позволяет создавать и редактировать изображения в чат-клиентах, поддерживающих этот протокол. Заявлена совместимость с Claude, Cursor, Codex, Windsurf и другими MCP-клиентами.
MCP-сервер предоставляет несколько инструментов: генерацию до 8 изображений параллельно, создание вариаций на основе предыдущего результата, просмотр истории запросов и проверку остатка средств на счёте.
Нужную модель клиент выбирает автоматически в зависимости от запроса. Доступно несколько моделей линейки FLUX.2: от быстрой Klein до топовой Мax. По умолчанию используется Flux2 Pro.
Оплата, согласно документации, производится напрямую BFL: счёт выставляется той организации, которая была выбрана при авторизации.
Актуальные тарифы - на странице bfl.ai/pricing.
@ai_machinelearning_big_data
#news #ai #mlЧтобы ИИ приносил конкретные результаты, важно понимать ограничения своей ИТ-инфраструктуры. Спецпроект российского разработчика ПО поможет пройти практический путь к ИИ: от первичной оценки готовности инфраструктуры — до конкретных решений и рекомендаций экспертов, которые внедряют ИИ в продакшн.Вы можете выбрать любую из следующих активностей или все: Чек-лист готовности инфраструктуры к ИИ • определите свой уровень инфраструктуры • получите подробные рекомендации по каждому из этапов Серия вебинаров • как стартовать ИИ без типовых ошибок • где считать экономику • архитектура production-ИИ • реальная стоимость «своей платформы» Персональный аудит • разбор вашей инфраструктуры с экспертами Orion soft • рекомендации под конкретные AI/ML-сценарии • практические шаги внедрения Подробнее #ai #ml
Диффузионные модели плохо справляются с текстом, в процессе генерации буквы для них ничем не отличаются от любой другой текстуры, нет встроенного представления о символах как о дискретных единицах со стабильной формой. С кириллицей ситуация усугубляется дисбалансом обучающих данных: в открытых датасетах её доля минимальна, а доступные примеры с русским текстом в большинстве низкого качества - их прямое добавление в претрейн просаживает эстетику и общее качество генерации.🟡 Технические изменения 🟠 Собственный датасет пар «изображение - текст» с разметкой глифов: 30 млн примеров в претрейн и около 100 тыс. в файнтюн, отобранных по качеству и визуальной эстетике. Ключевой фокус - на разнообразии символов и токенов, без этого модель хорошо писала бы только частотные буквы. 🟠 Переход с UNet на Diffusion Transformer - трансформерная архитектура лучше работает с пространственными связями между удалёнными участками картинки, что критично для длинных надписей. 🟠 Замена текстового энкодера на LLM для более точного понимания семантики и контекста запроса. 🟠 Обучение на русскоязычных промптах вместо схемы с переводом с английского. 🟡 Результаты внутренних замеров 🟢 Кириллический текст - фразы 7–9 слов корректно генерируются в большинстве случаев (предыдущая версия с ними практически не справлялась) 🟢 Общее качество — доля генераций без визуальных искажений выросла на треть 🟢 Локальная айдентика - 85% корректных генераций, на уровне топовых индустриальных решений
По доле успешных генераций кириллического текста Alice AI ART показывает лучшие результаты среди российских моделей. Команда также рекомендует приёмы промптинга для получения заявленного роста качества генерации — заключать текст в кавычки, сложные слова писать заглавными, длинные фразы разбивать на части с явным указанием расположения.https://admin.kod.ru/alisa-ai-russkiy-tekst-na-kartinkah-prompty/ @ai_machinelearning_big_data #news #ai #ml
Если капитальные затраты распределить на срок службы оборудования, совокупная стоимость владения составляет примерно $8,5 млрд в год.Около 60% этой суммы (порядка $5 млрд) приходится на серверы. Расходы на их фоне невелики: даже электроэнергия, крупнейшая операционная статья, по оценке обойдется в $600 млн в год. Авторы оговариваются, что это упрощённая финмодель, а не оценка конкретного объекта. Расчёт описывает гипотетический ЦОД крупного американского оператора облачной инфраструктуры на оборудовании NVIDIA GB200 NVL72.
Реальные издержки могут заметно отличаться в зависимости от выбора серверов, проектирования, расположения, схемы финансирования и стратегии энергоснабжения.Главная неопределённость расчётов связана со сроком службы IT-оборудования. Базовый сценарий исходит из 5 лет для серверов и сетевой инфраструктуры и 14 лет для здания. При сроке в 3 года годовая стоимость владения возрастает примерно до $12–13 млрд, при 7 - снижается до $7 млрд.
Оценка опирается на статистику государственного энергорегулятора США, показатели энергоэффективности Lawrence Berkeley Lab, стоимость серверов по выкладкам SemiAnalysis, строительные индексы Turner & Townsend и ряд других источников. Модель предполагает полное питание от энергосети и не учитывает собственную генерацию, налоговые льготы оценены приблизительно.Обновлённый расчёт даёт стоимость владения $8,5 млн на мегаватт в год против прежних $10,8 млн. Снижение авторы объясняют переходом на новое оборудование и пересмотром части исходных данных. @ai_machinelearning_big_data #news #ai #ml
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
