en
Feedback
Машинное обучение RU

Машинное обучение RU

Open in Telegram

Все о машинном обучении админ - @workakkk @data_analysis_ml - анализ даннных @ai_machinelearning_big_data - Machine learning @itchannels_telegram -лучшие ит-каналы @pythonl - Python @pythonlbooks- python 📚 @datascienceiot - 📚 РКН: clck.ru/3FmrUw

Show more

📈 Analytical overview of Telegram channel Машинное обучение RU

Channel Машинное обучение RU (@machinelearning_ru) in the Russian language segment is an active participant. Currently, the community unites 18 056 subscribers, ranking 7 335 in the Technologies & Applications category and 37 116 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 18 056 subscribers.

According to the latest data from 02 July, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -2 over the last 30 days and by 3 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 11.03%. Within the first 24 hours after publication, content typically collects 4.77% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 1 992 views. Within the first day, a publication typically gains 861 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 8.
  • Thematic interests: Content is focused on key topics such as github, llm, openai, параметр, архитектура.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Все о машинном обучении админ - @workakkk @data_analysis_ml - анализ даннных @ai_machinelearning_big_data - Machine learning @itchannels_telegram -лучшие ит-каналы @pythonl - Python @pythonlbooks- python 📚 @datascienceiot - 📚 РКН: clck.ru/...

Thanks to the high frequency of updates (latest data received on 03 July, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

18 056
Subscribers
+324 hours
-57 days
-230 days
Attracting Subscribers
July '26
July '26
+8
in 0 channels
June '26
+100
in 6 channels
Get PRO
May '26
+96
in 2 channels
Get PRO
April '26
+186
in 3 channels
Get PRO
March '26
+415
in 4 channels
Get PRO
February '26
+213
in 2 channels
Get PRO
January '26
+155
in 1 channels
Get PRO
December '25
+109
in 1 channels
Get PRO
November '25
+273
in 3 channels
Get PRO
October '25
+170
in 1 channels
Get PRO
September '25
+244
in 5 channels
Get PRO
August '25
+222
in 6 channels
Get PRO
July '25
+422
in 50 channels
Get PRO
June '25
+243
in 6 channels
Get PRO
May '25
+104
in 2 channels
Get PRO
April '25
+153
in 1 channels
Get PRO
March '25
+132
in 7 channels
Get PRO
February '25
+211
in 5 channels
Get PRO
January '25
+379
in 8 channels
Get PRO
December '24
+397
in 6 channels
Get PRO
November '24
+336
in 3 channels
Get PRO
October '24
+613
in 10 channels
Get PRO
September '24
+523
in 5 channels
Get PRO
August '24
+509
in 2 channels
Get PRO
July '24
+524
in 3 channels
Get PRO
June '24
+573
in 8 channels
Get PRO
May '24
+788
in 36 channels
Get PRO
April '24
+732
in 45 channels
Get PRO
March '24
+788
in 27 channels
Get PRO
February '24
+1 150
in 3 channels
Get PRO
January '24
+1 351
in 42 channels
Get PRO
December '23
+645
in 41 channels
Get PRO
November '23
+195
in 2 channels
Get PRO
October '23
+695
in 2 channels
Get PRO
September '23
+710
in 0 channels
Get PRO
August '23
+618
in 0 channels
Get PRO
July '23
+790
in 0 channels
Get PRO
June '23
+1 130
in 0 channels
Get PRO
May '23
+561
in 0 channels
Get PRO
April '23
+167
in 0 channels
Get PRO
March '23
+690
in 0 channels
Get PRO
February '23
+230
in 0 channels
Get PRO
January '23
+116
in 0 channels
Get PRO
December '22
+76
in 0 channels
Get PRO
November '22
+110
in 0 channels
Get PRO
October '22
+280
in 0 channels
Get PRO
September '22
+380
in 0 channels
Get PRO
August '22
+211
in 0 channels
Get PRO
July '22
+231
in 0 channels
Get PRO
June '22
+269
in 0 channels
Get PRO
May '22
+491
in 0 channels
Get PRO
April '22
+754
in 0 channels
Get PRO
March '22
+634
in 0 channels
Get PRO
February '22
+137
in 0 channels
Get PRO
January '22
+302
in 0 channels
Get PRO
December '21
+450
in 0 channels
Get PRO
November '21
+969
in 0 channels
Get PRO
October '21
+115
in 0 channels
Get PRO
September '21
+117
in 0 channels
Get PRO
August '21
+251
in 0 channels
Get PRO
July '21
+366
in 0 channels
Get PRO
June '21
+887
in 0 channels
Get PRO
May '21
+1 235
in 0 channels
Get PRO
April '21
+717
in 0 channels
Get PRO
March '21
+117
in 0 channels
Get PRO
February '21
+345
in 0 channels
Get PRO
January '21
+569
in 0 channels
Get PRO
December '20
+423
in 0 channels
Date
Subscriber Growth
Mentions
Channels
02 July+5
01 July+3
Channel Posts
AutoMem ускоряет long-horizon агентов в 2–4 раза Новая работа предлагает обучать память агента как отдельный cognitive skill.
AutoMem ускоряет long-horizon агентов в 2–4 раза Новая работа предлагает обучать память агента как отдельный cognitive skill. Идея в том, что агент должен не просто складывать всё в контекст, а учиться: • что сохранять • как кодировать информацию • когда доставать нужные данные • как менять структуру памяти после опыта AutoMem использует два цикла: LLM пересобирает memory structure по прошлым траекториям, а затем улучшает её через удачные решения. На Crafter, MiniHack и NetHack авторы показывают, что одна только оптимизация памяти уже даёт сильный прирост и местами приближает агентов к frontier-моделям. Почему это важно: long-horizon задачи часто ломаются не из-за слабого reasoning, а из-за плохой памяти. Агент забывает контекст, хранит мусор или не может достать нужный факт вовремя. AutoMem пытается решить именно этот bottleneck без полного переобучения под каждую задачу. Потенциально полезно для игровых агентов, робототехники и автономных workflow. arxiv.org/abs/2607.01224

2
🧠 Генеративный ИИ развивается настолько быстро, что за новыми моделями легко потерять из виду более важный вопрос: как вообщ
🧠 Генеративный ИИ развивается настолько быстро, что за новыми моделями легко потерять из виду более важный вопрос: как вообще сегодня устроен рынок AI и куда движется индустрия? 16 июля в 12:00 (МСК) Yandex Cloud проведет бесплатный вебинар «Взгляд на рынок ИИ: от глобальных трендов к российской практике». Обсудят: • какие технологические тренды сегодня определяют развитие AI; • чем российский рынок отличается от мирового; • как аналитики оценивают рынок ИИ и почему их прогнозы сильно расходятся; • как компании внедряют GenAI и какие сценарии уже приносят бизнес-результат. Среди спикеров — эксперты Yandex Cloud, Yandex AI Studio, «Яков и Партнёры» и инвестиционного сообщества. 🔗 Регистрация
625
3
Anthropic, по данным СМИ, ведёт ранние переговоры с Samsung о производстве собственного кастомного AI-чипа. The Information п
Anthropic, по данным СМИ, ведёт ранние переговоры с Samsung о производстве собственного кастомного AI-чипа. The Information пишет, что создатели Claude пока определяют, что именно должен делать этот процессор, насколько мощным он должен быть и как он будет встраиваться в серверы или кластеры. Сейчас Anthropic уже использует AWS Trainium, Google TPU и Nvidia GPU, и эти решения останутся ключевыми. Но собственный чип дал бы компании ещё один рычаг, пока стоимость запуска моделей, мощности дата-центров, поставки памяти и энергопотребление становятся стратегическими ограничениями. Для Samsung это шанс получить клиентом AI-гаганта для своего 2-нм техпроцесса и advanced packaging. https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip
667
4
💵 GFusion: как мы обучали диффузионную LLM в GigaChat «А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?» Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base. Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source. Почему это интересно? Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно. В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов. Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа. Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации. Цикл обучения включал: 🔘адаптацию AR-модели к диффузионной генерации; 🔘постепенное увеличение размера блока; 🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM; 🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации. Результаты: 🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B. 🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%. 🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации. 🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM. 🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте. 💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime. ➡️Подробности — в статье на Habr. ➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B ➡️GitVerse
566
5
⚡️ Claude Sonnet 5 обходится дороже за задачу: примерно на 15% дороже Opus 4.8 и почти в 2 раза дороже Sonnet 4.6, хотя цена
⚡️ Claude Sonnet 5 обходится дороже за задачу: примерно на 15% дороже Opus 4.8 и почти в 2 раза дороже Sonnet 4.6, хотя цена за токен у него ниже, чем у Opus. Причина в том, что для выполнения похожей benchmark-задачи он использует больше токенов. Проще говоря: Sonnet 5 сильнее «думает» и больше пишет, поэтому итоговый счёт выходит выше, даже если каждый токен дешевле. Промо-цены пока меняют картину. До 31 августа 2026 Sonnet 5 стоит $2 за 1M input-токенов и $10 за 1M output-токенов. С 1 сентября 2026 цена вернётся к $3 / $15. https://x.com/ArtificialAnlys/status/2072062595482456431
1 215
6
Как AI меняет промышленность и что интересного произошло в технологиях за последние полгода? Всё важное – в одном специальном
Как AI меняет промышленность и что интересного произошло в технологиях за последние полгода? Всё важное – в одном специальном эпизоде шоу «404 секунды» Ведущий Антон Черноусов из Yandex Cloud и гость — Вячеслав Захаров из «Газпром нефти» — разобрали применение AI в разных областях жизни. Уже сегодня голосовые помощники помогают детям с домашкой, аватары близких общаются с семьей после смерти, дизайнеры могут предложить не один, а 30 вариантов интерьера за одну встречу, а на главных кинофестивалях показывают созданные нейросетями фильмы. Ощутимое влияние искусственный интеллект оказывает и на бизнес, и на промышленность, и на всех нас. Посмотреть шоу можно на YouTube и ВК Послушать аудио-версию на Яндекс Музыке
1 224
7
Anthropic выкатила Claude Sonnet 5 - мощнейший «агентный» Sonnet в линейке. Главная идея: модель теперь лучше планирует, поль
Anthropic выкатила Claude Sonnet 5 - мощнейший «агентный» Sonnet в линейке. Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля. По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами. Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API. Цена для разработчиков до 31 августа 2026: • $2 за 1 млн input tokens • $10 за 1 млн output tokens Потом стандартная цена: • $3 за input • $15 за output Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection. По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны. https://www.anthropic.com/news/claude-sonnet-5
999
8
🎥 Вебинар: Архитектурные паттерны AI-агентов: как проектировать автономные решения для бизнес-задач На уроке рассмотрим: • К
🎥 Вебинар: Архитектурные паттерны AI-агентов: как проектировать автономные решения для бизнес-задач На уроке рассмотрим: • Как создавать архитектуру автономных AI-агентов, способных принимать решения и выполнять задачи; • Какие архитектурные паттерны применяются при проектировании агентных решений; • Как использовать агентные циклы, такие как ReAct и Plan-and-Execute, в прикладных сценариях; • Как спроектировать AI-архитектуру для автоматизации бизнес-процесса на практическом примере. После занятия вы будете знать: • Как проектировать архитектуру AI-агентов под реальные бизнес-задачи; • Как документировать и проверять архитектурные решения на разных уровнях детализации; • Как применять профессиональные подходы и инструменты для разработки AI-решений; ⚠ Открытый урок проходит в преддверии старта курса «ИИ-архитектор». 👉 Для участия зарегистрируйтесь: https://otus.pw/YnP8/?erid=2W5zFGWJS3s Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
1 092
9
🎥 Вебинар: Архитектурные паттерны AI-агентов: как проектировать автономные решения для бизнес-задач На уроке рассмотрим: • К
🎥 Вебинар: Архитектурные паттерны AI-агентов: как проектировать автономные решения для бизнес-задач На уроке рассмотрим: • Как создавать архитектуру автономных AI-агентов, способных принимать решения и выполнять задачи; • Какие архитектурные паттерны применяются при проектировании агентных решений; • Как использовать агентные циклы, такие как ReAct и Plan-and-Execute, в прикладных сценариях; • Как спроектировать AI-архитектуру для автоматизации бизнес-процесса на практическом примере. После занятия вы будете знать: • Как проектировать архитектуру AI-агентов под реальные бизнес-задачи; • Как документировать и проверять архитектурные решения на разных уровнях детализации; • Как применять профессиональные подходы и инструменты для разработки AI-решений; ⚠ Открытый урок проходит в преддверии старта курса «ИИ-архитектор». 👉 Для участия зарегистрируйтесь: https://otus.pw/YnP8/?erid=2W5zFGWJS3s Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
1 081
10
Apple, как сообщается, лоббирует администрацию Трампа, чтобы ей разрешили покупать memory chips у CXMT - китайского производи
Apple, как сообщается, лоббирует администрацию Трампа, чтобы ей разрешили покупать memory chips у CXMT - китайского производителя чипов, который находится в чёрном списке Pentagon Chinese Military Company. FT пишет, что Apple обратилась в Министерство торговли США больше месяца назад, после того как рост цен на память вынудил компанию поднять цены на MacBook и iPad. Этот шаг стёр $263 млрд рыночной стоимости Apple. Юридически Apple не запрещено покупать чипы у CXMT. Список Пентагона в основном создаёт репутационный риск, если только Министерство торговли позже не внесёт CXMT в Entity List. CXMT - национальный DRAM-чемпион Китая. Сейчас Apple зависит от Micron, Samsung и SK Hynix. Apple заявляет, что цены на память стали «неустойчивыми». https://www.ft.com/content/d72a25e2-7bde-4aa9-bd8d-0c4f3d6cb2cb?syn-25a6b1a6=1
1 834
11
✔️ Японский разработчик выложил в open source drop-in замену NumPy, которая работает на GPU. Она называется CuPy. Меняете одн
✔️ Японский разработчик выложил в open source drop-in замену NumPy, которая работает на GPU. Она называется CuPy. Меняете одну строку: import numpy as np → import cupy as cp И тот же код может работать до 100 раз быстрее на CUDA. → работает с существующим NumPy/SciPy-кодом → без переписывания логики → без нового синтаксиса → также поддерживает AMD ROCm 100% open source. https://github.com/Hannibal046/Awesome-LLM
1 858
12
✔️ На OpenRouter появилась Fugu Ultra OpenRouter добавил возможность запуска мультиагентной системы Fugu Ultra, которая по сл
✔️ На OpenRouter появилась Fugu Ultra OpenRouter добавил возможность запуска мультиагентной системы Fugu Ultra, которая по словам Sakana Ai обошла Fable 5 в кодинге на бенчмарках. Это специализированная LLM для маршрутизации и координации задач между GPT-5.5, Gemini 3.1 Pro и Claude Opus 4.8. Fugu Ultra поддерживает окно контекста в 1 млн токенов, вызов внешних инструментов и мультимодальность. Максимальная длина генерации - 128 тысяч токенов. Биллинг формируется из базового тарифа маршрутизатора ($5 за 1 млн токенов ввода и $30 за вывод) и суммарной стоимости задействованных моделей. Для контроля расходов можно самостоятельно ограничивать глубину рассуждений и лимиты токенов через настройки API. @ai_machinelearning_big_data #news #ai #ml
1 207
13
Хочется разобраться в машинном обучении, но страшно сразу покупать большой курс? Это нормально. У Яндекс Практикума есть бесп
Хочется разобраться в машинном обучении, но страшно сразу покупать большой курс? Это нормально. У Яндекс Практикума есть бесплатная вводная часть курса «ML-инженер» — можно спокойно познакомиться с профессией, решить первые задачи по ML и понять, насколько вам вообще подходит это направление. Если решите идти дальше, на основном курсе вас ждёт: ● обучение от основ до внедрения ML-моделей; ● 18+ проектов для портфолио; ● карьерная поддержка при выходе на рынок; ● дополнительный модуль по современным AI-инструментам. 🎁 А если продолжите обучение, для подписчиков канала действует скидка 10% по промокоду до 30 июня [TGPRACTICUM10]. Попробовать бесплатно → Erid: 2SDnjcVRJFU Название: ООО "ЯНДЕКС" ИНН: 7736207543
1 501
14
🗓 13 июля в 18:00 МСК приглашаем вас на открытый урок в преддверии старта курса «Большие языковые модели. Экспертный уровень
🗓 13 июля в 18:00 МСК приглашаем вас на открытый урок в преддверии старта курса «Большие языковые модели. Экспертный уровень / LLM». На занятии разберём: 👇 • как RAG помогает модели работать с фактами и внешними источниками; • в чём суть LoRA и почему этот метод позволяет эффективно дообучать большие языковые модели; • отдельно обсудим, когда использовать RAG, когда выбирать LoRA, а когда эти подходы стоит комбинировать. Урок подойдёт DS-специалистам, ML-инженерам и ИТ-специалистам, которые работают с текстовыми данными и хотят внедрять LLM-решения осознанно. Зарегистрируйтесь и разберитесь, как выбирать архитектуру LLM-решения под реальные задачи: https://otus.pw/HPgxU/?erid=2W5zFHz7JPb Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
615
15
Как запустить своего Джарвиса за 5 минут: локальный AI-ассистент OpenJarvis Идея простая: вместо очередного облачного чат-бот
Как запустить своего Джарвиса за 5 минут: локальный AI-ассистент OpenJarvis Идея простая: вместо очередного облачного чат-бота вы собираете персонального AI-помощника, который работает ближе к вашему устройству, файлам и задачам. https://github.com/open-jarvis/OpenJarvis Д
1 616
16
LLM уже находят реальные memory safety баги в Rust-коде. И, что неожиданно, это работает очень хорошо. Сергей Давыдов, руково
LLM уже находят реальные memory safety баги в Rust-коде. И, что неожиданно, это работает очень хорошо. Сергей Давыдов, руководитель Rust Secure Code Working Group, использовал GPT-5.5 и Claude Opus для аудита unsafe-блоков в популярных Rust-крейтах. В итоге нашлись десятки реальных багов: • use-after-free • чтение за пределами буфера • data races • неправильные реализации Send / Sync Все находки проверялись через miri, чтобы убрать ложные срабатывания. Почему в Rust это работает лучше, чем в C? • unsafe явно помечен и изолирован, поэтому LLM сразу понимает, где искать • miri может точно подтвердить, настоящий баг или нет • не нужно отслеживать data flow по всей кодовой базе, как часто бывает в C Получается, дизайн Rust случайно сделал его почти идеальным языком для LLM-аудита безопасности. Стоит прочитать всем, кто думает про AI в security tooling. https://gist.github.com/Shnatsel/eb0a4be79a0657e4eb67c4f085f991bc https://shnatsel.medium.com/the-unreasonable-effectiveness-of-llms-for-auditing-rust-code-d4df8bf0afd3 #Rust #RustLang #MemorySafety #Security #LLM
1 884
17
Codex начал отправлять SSD пользователей на пенсию раньше времени 😬 Пользователи заметили баг: агент может записывать до 640
Codex начал отправлять SSD пользователей на пенсию раньше времени 😬 Пользователи заметили баг: агент может записывать до 640 ТБ данных в год на накопитель. Причина банальная, но болезненная: логгер слишком подробно сохраняет действия агента и постепенно превращает диск в расходник. Для сравнения: обычный SSD на 1 ТБ часто рассчитан примерно на 600 ТБ записи за весь срок службы. А один пользователь уже поймал 37 ТБ записи всего за 21 день работы Codex. Фикса пока нет. https://www.notebookcheck.net/OpenAI-Codex-has-a-bug-that-could-kill-your-SSD-in-under-a-year.1326191.0.html
2 236
18
NVIDIA выкатили кое-что большое для AI-агентов. Компания открыла каталог из 110+ проверенных agent skills. Это переносимые на
NVIDIA выкатили кое-что большое для AI-агентов. Компания открыла каталог из 110+ проверенных agent skills. Это переносимые наборы инструкций, которые учат AI-агентов правильно использовать библиотеки CUDA-X и платформенные инструменты. Что внутри: • cuOpt • NeMo • Dynamo • RAG • DeepStream • medical AI • physical AI • и другие направления Каждый skill подписан OMS-подписью. Её можно проверить через trust anchor NVIDIA. Работает из коробки с Claude Code, Codex, Cursor и Kiro. Установка одной командой: npx skills add nvidia/skills Это уже не просто набор инструментов, а governance возможностей для AI-агентов. Проверенные, подписанные и аудируемые инструкции, которым агент может доверять. https://github.com/nvidia/skills
2 234
19
✔️ DeepSeek раскатал Vision Mode в чат-боте DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддержи
✔️ DeepSeek раскатал Vision Mode в чат-боте DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML). В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях. Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT. Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком. Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет. @ai_machinelearning_big_data #news #ai #ml
982
20
✔️ DeepSeek раскатал Vision Mode в чат-боте DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддержи
✔️ DeepSeek раскатал Vision Mode в чат-боте DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML). В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях. Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT. Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком. Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет. @ai_machinelearning_big_data #news #ai #ml
920