Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Ko'proq ko'rsatish📈 Telegram kanali Machinelearning analitikasi
Machinelearning (@ai_machinelearning_big_data) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 294 933 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 332-o'rinni va Rossiya mintaqasida 1 277-o'rinni egallagan.
📊 Auditoriya ko‘rsatkichlari va dinamika
невідомо sanasidan buyon loyiha tez o‘sib, 294 933 obunachiga ega bo‘ldi.
26 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -6 463 ga, so‘nggi 24 soatda esa -216 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.
- Tasdiqlash holati: Tasdiqlanmagan
- Jalb etish (ER): Auditoriya o‘rtacha 7.82% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.40% ini tashkil etuvchi reaksiyalarni to‘playdi.
- Post qamrovi: Har bir post o‘rtacha 23 058 marta ko‘riladi; birinchi sutkada odatda 15 914 ta ko‘rish yig‘iladi.
- Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 179 ta reaksiya keladi.
- Tematik yo‘nalishlar: Kontent openai, claude, api, gemini, контекст kabi asosiy mavzularga jamlangan.
📝 Tavsif va kontent siyosati
Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
Yuqori yangilanish chastotasi (oxirgi ma’lumot 27 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.
Обе компании, напомним, подали документы на проведение IPO. Anthropic в начале июня, OpenAI - 8 июня.Крупнейшая продажа прошла в OpenAI в октябре 2025 года. Тогда сотрудники продали акции примерно на $6,6 млрд. В сделке участвовали более 600 человек, около 75 из которых продали максимально допустимые $30 млн каждый. Компания разрешала продать акции на сумму до $10,3 млрд, но реализовано было около двух третей лимита. Anthropic провела свой выкуп в апреле 2026 года. Часть сотрудников предпочла сохранить акции, и инвесторы смогли купить меньше, чем планировали. Ориентир сделки, по данным отраслевых источников, составлял $5–6 млрд. При этом на вторичном рынке акции Anthropic, по сообщениям, оценивались выше. @ai_machinelearning_big_data #news #ai #ml
Крупные модели, кстати, чаще ошибаются, всё же фиксируя противоречие, тогда как мелкие - просто умалчивают о диссонансе.🟡 Вторая работа про комбинацию LLM и систем памяти Для проверки построили тест MIST и оценили 5 моделей в связке с 3 коммерческими системами памяти (Mem0, MemOS и Zep). По итогу - каждая модель как минимум утроила частоту согласия с ошибкой хотя бы при одной конфигурации памяти. Из этого авторы делают вывод, что проблема связана со слоем памяти, а не с моделью. 🟡Причину видят в механике извлечения данных Системы памяти сохраняют утверждение пользователя как отдельный факт, отбрасывая контекст вокруг него, в том числе прежние возражения ассистента.
По замерам, замена извлечённых фрагментов на полную историю переписки примерно вдвое уменьшает эффект.Авторы предлагают 2 способа смягчения: 🟢Первый - сохранять в памяти и реплики самого ассистента. 🟢Второй, наиболее действенный, - заменить извлечение отдельных фрагментов кратким пересказом разговора, который генерирует сама модель. Результаты исследования ставят вопрос о том, что в принципе дают сложные системы памяти, если они так влияют на точность ответов. @ai_machinelearning_big_data #AI #ML #LLM #Memory #Research #WRITER
ЯМР-спектроскопия помогает определять строение молекул. Каждому атому в структуре химик вручную сопоставляет пик на спектре. Это один из самых трудоёмких этапов аналитической химии.В тесте сравнивали Opus 4.7, Opus 4.6 и Sonnet 4.6 с двумя программами на 20 соединениях из 4-х структурных классов. Образцы брали на платформе ChemRxiv, опубликованные после даты обучения моделей, чтобы исключить подсматривание. В прямой задаче (предсказать спектр по известной структуре) Opus 4.7 показала наименьшую среднюю ошибку по водороду, а по углероду практически сравнялась с MestReNova. По форме и расщеплению пиков, которые тоже несут информацию о структуре, модели Claude попадали в нужный диапазон примерно в 80% случаев против 26–35% у программ. Отдельно проверили обратную задачу восстановления структуры молекулы по спектру, которую ChemDraw и MestReNova не выполняют.
Специализированный софт для расшифровки структуры существует давно, но требует двумерного ЯМР, отдельной подготовки и платных лицензий. Claude берётся за эту задачу на основе тех же одномерного спектра и масс-спектрометрии.🟢На 8 простых молекулах Opus 4.7 верно определила структуру во всех попытках; 🟢На 7 сложных (после подсказки с исходным веществом) справилась с большинством. В планах Anthropic - развивать возможности Claude в чтении химических структур, анализе реакций и механизмов. @ai_machinelearning_big_data #news #ai #ml
DN42 - это децентрализованная сеть энтузиастов, работающая поверх обычного интернета на тех же технологиях, что и его магистральная инфраструктура:BGP, DNS и других. Её участники изучают устройство сетей, и многие держат узлы на недорогих серверах.Агент, действовавший от имени пользователя JertLinc, сначала открыл заявку, а затем запрос на регистрацию, в котором указал цель: "комплексное сканирование всех портов" сети. Для этого он развернул на AWS 5 виртуальных машин с пропускной способностью около 20 Гбит/с каждая. Уже на этапе подачи заявки сообщество сети сочло такую конфигурацию избыточной: по их оценке, при запуске сканирования эти серверы создали бы нагрузку, сравнимую с DDoS-атакой. Реального сканирования не случилось - запрос так и не одобрили. Более того, пользователи DN42 намеренно затягивали диалог и давали агенту бессмысленные задания, чтобы тот впустую расходовал оплачиваемые ресурсы и лимиты своего владельца. Истинные намерения JertLinc остались неясны. Сам он почти не выходил на связь, а агент в одном из сообщений упомянул, что задача охватывает несколько сетей. В сообществе допускали, что речь могла идти об исследовательском проекте, но подтверждений этому нет. Примерно через сутки владелец остановил агента, сообщив, что столкнулся с большими списаниями по карте. Затем от аккаунта JertLinc3522 в рассылку и чаты DN42 пришли просьбы о пожертвованиях, чтобы покрыть счёт AWS на сумму 6531 доллар. Денег естественно никто не дал, но как выяснилось позже, AWS согласилась снизить сумму счёта до 1894 долларов. @ai_machinelearning_big_data #news #ai #ml
По статистике платформы за прошлую неделю, доля попаданий в кэш достигла 82,8% (более 8 млрд токенов), а основной объем запросов сгенерировали Claude Code и Cursor.🟡Explore: фильтрация логов по провайдерам, API-ключам и географии с возможностью экспорта отчетов; 🟡Guardrails: логи срабатывания защиты от инъекций промптов и утечек конфиденциальной информации. @ai_machinelearning_big_data #news #ai #ml
В комментариях ожидаемо начался ад: часть твиттерских назвала акцию щедрым стимулом, другие интересуются, зачем сильному продукту подобные активности, а третьи просто стали публиковать свои проекты.@ai_machinelearning_big_data #news #ai #ml
Nvidia приводит около 1000 токенов в секунду на H100, 150 - на DGX Spark и до 800 - на DGX Station. Google заявляет более 700 токенов в секунду на GeForce RTX 5090.На устройствах с общей памятью (например на Apple Silicon) разница с обычными моделями, вероятно, окажется меньше, а в облаке с параллельными запросами преимущество вовсе исчезает - в этом сценарии диффузия может повышать издержки. 🟡За скорость приходится платить качеством Для задач, где оно критично, Google по-прежнему рекомендует обычные модели Gemma 4, а DiffusionGemma позиционирует как инструмент для исследователей и разработчиков. Сильной стороной компания называет задачи, не предполагающие строго последовательного порядка: вставку текста в готовый абзац, заполнение пропусков в коде, работу со структурированными данными. 🟡Доступность Веса опубликованы на Hugging Face под Apache 2.0. Модель работает с Transformers, vLLM и MLX. Запустить её можно также через Model Garden и Nvidia NIM, а бесплатно потестить на build.nvidia.com. Для дообучения предлагаются собственный JAX-тулбокс Hackable Diffusion, Unsloth и NeMo от Nvidia. Google собрала руководство для разработчиков, а Маартен Гроотендорст - визуальное объяснение работы модели. @ai_machinelearning_big_data #news #ai #ml
Компания уже делала нечто подобное в 2022 году, но тогда возможности были далеко не такими функциональными, как сейчас.На сложные запросы о тактике команд поисковик сможет генерировать не просто текстовые ответы, а интерактивные графические схемы, наглядно объясняющие расстановку сил и конкретные игровые ситуации на поле. Помимо этого, компания существенно обновляет спортивный интерфейс и функциональность приложения Gemini. Оно научилось в реальном времени подтягивать актуальные результаты матчей, генерируя динамические виджеты со статистикой, анимациями и медиафайлами. Изменения также затронули страницу live-результатов: появилась обновленная панель турнирных таблиц и улучшенная интеграция с сервисами трансляций. Развертывание функционала уже идет полным ходом и станет доступно к началу турнира. @ai_machinelearning_big_data #news #ai #ml
сгенерировать примеры → оценить их → посчитать преимущества → обновить политику → синхронизировать веса обратно с воркерами роллаута.Большинство RL-стеков заточены под одну модальность, UniRL применяет этот цикл к text2image, text/image2video, VL, LLM, связке LLM+диффузия и унифицированным авторегрессионно-диффузионным архитектурам. Точка входа загружает конфиг и создаёт доменный тренер, который координирует подключаемые движки (train-side, SGLang, vLLM-Omni), алгоритмы, наборы моделей и сервисы наград поверх общего рантайма - Ray, FSDP2-шардинг, Transfer Queue, синхронизация весов LoRA или full. 🟡Релиз сопровождают 2 авторских алгоритма Flow-DPPO для flow matching и диффузионных моделей.
Метод заменяет клиппинг отношения вероятностей прямым ограничением по дивергенции.В экспериментах TencentHY на SD3.5, FLUX2-9B и FLUX.1-dev метод показал более высокие награды и меньшую подверженность катастрофическому забыванию, чем базовые Flow-GRPO, Flow-CPS, GRPO-Guard и Diffusion-NFT. DRPO для текстовых LLM
Это RL на уровне токенов с квадратичным регуляризатором, взвешенным по преимуществу.DRPO проявил себя в режиме FP8, где GRPO и SPO часто теряли устойчивость. Проверяли на математических задачах на нескольких моделях линейки Qwen3 и на DeepSeek-R1-Distill-Qwen-1.5B. 🟡UniRL поддерживает семейства и модели: 🟢Stable Diffusion 3/3.5, Qwen-Image, FLUX.2-Klein; 🟢WAN 2.1/2.2, HunyuanVideo 1.0/1.5; 🟢Qwen-VL, Qwen3 (LLM); 🟢HunyuanImage3, Bagel.
Команда планирует расширить набор алгоритмов для новых семейств, распространить Flow-DPPO и DRPO на большее число моделей и добавить новые бэкенды наград и движки в разных доменах.📌Лицензирование: Apache-2.0 🟡Страница проекта 🟡Техотчет Flow-DPPO 🟡Техотчет DRPO 🖥GitHub @ai_machinelearning_big_data #AI #ML #Framework #RL #UniRL #TencentHY
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
