BigData
الذهاب إلى القناة على Telegram
Data Science : Big Data : Machine Learning : Deep Learning : LLM : Нейроннные сети По всем вопросам @evgenycarter
إظهار المزيد3 254
المشتركون
-124 ساعات
-27 أيام
+130 أيام
أرشيف المشاركات
3 254
RAG против Агентов (RAGs vs Agents)
Спросите LLM (большую языковую модель) о данных вашей компании, и она начнет гадать. Два паттерна, которые исправляют это - RAG и агенты, и они решают разные задачи.
RAG (Поисково-ориентированная генерация)
RAG объединяет LLM с поиском информации, чтобы обосновать ответы фактами. Этот процесс состоит из 4 шагов:
• Шаг 1: Запрос пользователя (User Query) векторизуется и отправляется на этап поиска (Retrieval).
• Шаг 2: Компонент поиска извлекает наиболее релевантные фрагменты из базы знаний (Knowledge Base: PDF-файлы, вики-страницы и т.д.).
• Шаг 3: Эти фрагменты вставляются в промпт в качестве контекста.
• Шаг 4: LLM пишет ответ, опираясь на извлеченный текст (Answer grounded).
Особенности: Один поиск. Одна генерация. Дешево, предсказуемо и легко поддается отладке.
Агенты (Agents)
Агенты оборачивают LLM в цикл рассуждений с набором инструментов (Tools) для выполнения конкретных действий.
• Шаг 1: Запрос пользователя поступает в среду выполнения агента (Agent runtime) — цикл рассуждений вокруг LLM.
• Шаг 2: LLM анализирует цель и выбирает нужный инструмент (Чтение, Запись, Редактирование, Bash и т.д.).
• Шаг 3: Среда выполнения (runtime) запускает инструмент и передает результат обратно в LLM.
• Шаг 4: LLM снова проводит рассуждения, выбирает следующий инструмент и повторяет этот цикл, пока задача не будет выполнена.
Особенности: Более гибко. Расходует больше токенов. Сложнее отлаживать, так как ошибки накапливаются от шага к шагу.
Главное эмпирическое правило (из центральной части картинки):
• Используйте RAG, когда ответ находится внутри ваших документов.
• Используйте Агента, когда решение задачи требует действий в других системах.
👉 @bigdata_1
3 254
Преодоление узкого места LLM: подход GenPRM к вычислениям во время тестирования Scale с помощью генеративного рассуждения.
Недавно модели вознаграждения процессов (PRM) в качестве верификаторов стали перспективным подходом для повышения производительности LLM. Для решения проблем с PRM в этой статье представлена GenPRM — модель вознаграждения за генеративный процесс, которая выполняет явное рассуждение по цепочке мысли (CoT) с верификацией кода перед вынесением суждений по каждому этапу рассуждения.
👉 Проблемы с текущими PRM:
- Ограниченные возможности контроля и обобщения процессов
- Зависимость от скалярного прогнозирования значений без использования генеративных возможностей LLM
- Невозможность масштабировать вычисления во время тестирования
👉 Фреймворк GenPRM
решает вышеупомянутые проблемы с помощью шестичастной структуры, включающей:
1️⃣ Модель политики генерирует шаги решения, при этом оценки MC оцениваются по траекториям внедрения.
2️⃣ Предлагаемая оценка относительного прогресса (RPE) получает точные метки PRM.
3️⃣ Высококачественные данные надзора процессов, синтезированные с помощью CoT-рассуждения и верификации кода
4️⃣ Консенсусная фильтрация и обучение SFT GenPRM
5️⃣ Обученный GenPRM, функционирующий в качестве верификатора или критика для расширенного масштабирования времени тестирования
6️⃣ Повышение производительности за счёт масштабирования во время тестирования
👉 Масштабирование времени тестирования с помощью GenPRM
1️⃣ Policy Model TTS: GenPRM как проверяющий
- несколько ответов могут быть выбраны из моделей политики, а затем использовать GenPRM в качестве верификатора для выбора конечного ответа в виде параллельных TTS.
2️⃣ Модель политики TTS: GenPRM как критик
- GenPRM можно естественно использовать как критическую модель для уточнения результатов моделей политик, и мы можем масштабировать процесс уточнения с несколькими ходами последовательно по TTS.
3️⃣ GenPRM TTS
- сначала взят пример N путей верификации рассуждения, а затем используй голосование большинством для получения окончательного прогноза, усредняя вознаграждения.
👉 Синтез данных GenPRM
Состоит из трёх этапов:
1️⃣ генерация путей рассуждения и получение меток PRM с помощью оценки Монте-Карло (MC)
2️⃣ оценка прогресса каждого шага с помощью оценки относительного прогресса
3️⃣ синтез обоснований с CoT и верификацией кода, а также вывод меток LLM-as-a-judge с помощью консенсусной фильтрации
📈 Результаты оценки
- GenPRM значительно превосходит предыдущие PRM, имея всего 23K обучающих данных из набора данных MATH.
- при масштабировании времени тестирования 1,5B GenPRM превосходит GPT-4o, а 7B GenPRM превосходит Qwen2.5-Math-PRM-72B на ProcessBench
Blog: https://medium.com/@techsachin/breaking-the-llm-bottleneck-genprms-approach-to-scale-test-time-compute-via-generative-reasoning-0e90e3ffa71e
Paper: https://arxiv.org/abs/2504.00891
Code: https://github.com/RyanLiu112/GenPRM
Models: https://huggingface.co/collections/GenPRM/genprm-67ee4936234ba5dd16bb9943
👉 @bigdata_1
3 254
🚀 Подборка полезных IT каналов в Max
Системное администрирование, DevOps 📌
https://max.ru/i_odmin Все для системного администратора
https://max.ru/bash_srv Bash Советы
https://max.ru/sysadminof Книги для админов, полезные материалы
https://max.ru/i_odmin_book Библиотека Системного Администратора
https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др.
1C разработка 📌
https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С
Программирование C++📌
https://max.ru/cpp_lib Библиотека C/C++ разработчика
Программирование Go📌
https://max.ru/golang_lib Библиотека Go (Golang) разработчика
Программирование React📌
https://max.ru/react_lib React
Программирование Python 📌
https://max.ru/python_of Python академия.
https://max.ru/BookPython Библиотека Python разработчика
Java разработка 📌
https://max.ru/bookjava Библиотека Java разработчика
GitHub Сообщество 📌
https://max.ru/githublib Интересное из GitHub
Базы данных (Data Base) 📌
https://max.ru/database_info Все про базы данных
Фронтенд разработка 📌
https://max.ru/frontend_1 Подборки для frontend разработчиков
Библиотеки 📌
https://max.ru/programmist_of Книги по программированию
https://max.ru/proglb Библиотека программиста
https://max.ru/bfbook Книги для программистов
Программирование 📌
https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций
https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT
https://max.ru/php_lib Библиотека PHP программиста 👨🏼💻👩💻
Шутки программистов 📌
https://max.ru/itumor Шутки программистов
Защита, взлом, безопасность 📌
https://max.ru/thehaking Канал о кибербезопасности
https://max.ru/xakkep_1 Хакер Free
Книги, статьи для дизайнеров 📌
https://max.ru/odesigners Статьи, книги для дизайнеров
Математика 📌
https://max.ru/Pomatematike Канал по математике
https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике
Вакансии 📌
https://max.ru/progjob Вакансии в IT
Мир технологий 📌
https://max.ru/mir_teh Канал для любознательных
Бонус 📌
https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга
https://max.ru/mockva_life Свежие новости Москвы
3 254
Anthropic представила Claude Design - отдельный продукт для создания готовых макетов, прототипов, слайдов и сайтов.
В основе сервиса лежит Claude Opus 4.7 - флагманская модель компании с продвинутым пониманием визуала. Главная особенность новинки — не просто генерация интерфейсов, а работа с уже существующими материалами продукта. Claude может анализировать кодовую базу и дизайн-файлы, извлекать из них дизайн-систему и затем автоматически придерживаться фирменного стиля.
То есть сервису не нужно вручную объяснять, какие в проекте используются шрифты, цвета и отступы - он сам подстраивается под бренд. Пока Claude Design доступен в формате research preview для тарифов Pro, Max, Team и Enterprise.
Попробовать: claude.ai/design
#Anthropic #ClaudeDesign #ClaudeOpus #дизайн #прототипы #слайды #сайты #AI #нейросети #технологии
👉 @bigdata_1
3 254
🚀 Подборка полезных IT каналов в Max
Системное администрирование, DevOps 📌
https://max.ru/i_odmin Все для системного администратора
https://max.ru/bash_srv Bash Советы
https://max.ru/sysadminof Книги для админов, полезные материалы
https://max.ru/i_odmin_book Библиотека Системного Администратора
https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др.
1C разработка 📌
https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С
Программирование C++📌
https://max.ru/cpp_lib Библиотека C/C++ разработчика
Программирование Go📌
https://max.ru/golang_lib Библиотека Go (Golang) разработчика
Программирование React📌
https://max.ru/react_lib React
Программирование Python 📌
https://max.ru/python_of Python академия.
https://max.ru/BookPython Библиотека Python разработчика
Java разработка 📌
https://max.ru/bookjava Библиотека Java разработчика
GitHub Сообщество 📌
https://max.ru/githublib Интересное из GitHub
Базы данных (Data Base) 📌
https://max.ru/database_info Все про базы данных
Фронтенд разработка 📌
https://max.ru/frontend_1 Подборки для frontend разработчиков
Библиотеки 📌
https://max.ru/programmist_of Книги по программированию
https://max.ru/proglb Библиотека программиста
https://max.ru/bfbook Книги для программистов
Программирование 📌
https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций
https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT
https://max.ru/php_lib Библиотека PHP программиста 👨🏼💻👩💻
Шутки программистов 📌
https://max.ru/itumor Шутки программистов
Защита, взлом, безопасность 📌
https://max.ru/thehaking Канал о кибербезопасности
https://max.ru/xakkep_1 Хакер Free
Книги, статьи для дизайнеров 📌
https://max.ru/odesigners Статьи, книги для дизайнеров
Математика 📌
https://max.ru/Pomatematike Канал по математике
https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике
Вакансии 📌
https://max.ru/progjob Вакансии в IT
Мир технологий 📌
https://max.ru/mir_teh Канал для любознательных
Бонус 📌
https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга
https://max.ru/mockva_life Свежие новости Москвы
3 254
Станьте Deep Learning Engineer с дипломом 👍
Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская диагностика — нейросети используются уже во всех сферах бизнеса. Компании ищут DL-специалистов, чтобы точнее обучать и настраивать нейросети под свои запросы.
Освоить Deep Learning самостоятельно сложно, но ребята из Simulative нашли решение, где учёба становится понятной и структурированной, а все темы разбираются на практике 🔥
Simulative запускает программу профессиональной переподготовки «Инженер глубокого обучения нейросетей».
По итогам обучения вы получите:
🎓 Диплом гособразцаОфициальный диплом о профессиональной переподготовке с квалификацией «Специалист по большим данным».
💯 ПрактикаБолее 40 практических работ в формате симуляции реальной работы DL-инженера — всё пойдёт в портфолио.
🙌🏽 Онлайн обучениеУчитесь из любой точки мира, совмещая с работой, а доступ к материалам останется навсегда. Курс подходит для специалистов любого уровня: новичок, аналитик, ML-инженер или выпускник — на программе опытные менторы помогут выстроить вашу персональную траекторию роста в Deep Learning. Что вы освоите: 🟠Создание и обучение нейросетей с нуля 🟠Компьютерное зрение (Computer Vision) 🟠NLP (обработка текста) 🟠Генеративные модели 🟠MLOps и продакшн-подход 🕖 Скорее записывайтесь, количество мест на поток ограничено! Бронируйте место на курсе прямо сейчас и получите скидку 30% 😶ПОЛУЧИТЬ СКИДКУ НА КУРС
3 254
🚀 Подборка полезных IT каналов в Max
Системное администрирование, DevOps 📌
https://max.ru/i_odmin Все для системного администратора
https://max.ru/bash_srv Bash Советы
https://max.ru/sysadminof Книги для админов, полезные материалы
https://max.ru/i_odmin_book Библиотека Системного Администратора
https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др.
1C разработка 📌
https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С
Программирование C++📌
https://max.ru/cpp_lib Библиотека C/C++ разработчика
Программирование Python 📌
https://max.ru/python_of Python академия.
https://max.ru/BookPython Библиотека Python разработчика
Java разработка 📌
https://max.ru/bookjava Библиотека Java разработчика
GitHub Сообщество 📌
https://max.ru/githublib Интересное из GitHub
Базы данных (Data Base) 📌
https://max.ru/database_info Все про базы данных
Фронтенд разработка 📌
https://max.ru/frontend_1 Подборки для frontend разработчиков
Библиотеки 📌
https://max.ru/programmist_of Книги по программированию
https://max.ru/proglb Библиотека программиста
https://max.ru/bfbook Книги для программистов
Программирование 📌
https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций
https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT
https://max.ru/php_lib Библиотека PHP программиста 👨🏼💻👩💻
Шутки программистов 📌
https://max.ru/itumor Шутки программистов
Защита, взлом, безопасность 📌
https://max.ru/thehaking Канал о кибербезопасности
https://max.ru/xakkep_1 Хакер Free
Книги, статьи для дизайнеров 📌
https://max.ru/odesigners Статьи, книги для дизайнеров
Математика 📌
https://max.ru/Pomatematike Канал по математике
https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике
Вакансии 📌
https://max.ru/progjob Вакансии в IT
Мир технологий 📌
https://max.ru/mir_teh Канал для любознательных
Бонус 📌
https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга
https://max.ru/mockva_life Свежие новости Москвы
3 254
🌟 Tencent HY-WU: динамические LoRA для редактирования изображений.
Tencent HY опубликовала первую часть серии работ под названием HY-WU (Weight Unleashing). Суть метода в отказе от стандартной парадигмы адаптации, при которой модель получает один фиксированный набор весов для всех задач.
Специальная модель-генератор синтезирует LoRA отдельно под каждый входной пример прямо во время инференса, без дополнительной оптимизации на тест-тайме.
Проблема, которую решает HY-WU, хорошо знакома всем, кто работал с дообучением: когда задачи противоречат друг другу (например, "размыть" против "убрать размытие" или "состарить лицо" против "восстановить"), общий адаптер вынужден идти на компромисс.
Градиенты конфликтуют, и результат оказывается хуже, чем если бы задачи обучались раздельно.
Чтобы не быть голословными, авторы измерили это напрямую: косинусное сходство градиентов между разнородными задачами устойчиво отрицательно, среднее около −0.30, то есть задачи буквально тянут веса в противоположные стороны.
HY-WU предлагает условную генерацию параметров. Модель-генератор (8B параметров) принимает на вход совместное представление изображения и текстового запроса через энкодер SigLIP2, после чего генерирует LoRA-матрицы (~0.72B) и инжектирует их в базовую модель.
Обучение сквозное, только через downstream-loss, без предварительно собранных чекпойнтов адаптеров.
🟡Тесты и результаты
Для тестов выбрали задачу редактирования изображения текстовым запросом - в нем конфликты неизбежны и визуально очевидны.
🟡В попарном human evaluation (GSB) HY-WU выигрывает у всех топовых open-source редакторов с большим отрывом: 67–78% против Step1X, Qwen, LongCat и FLUX;
🟡Среди закрытых систем модель обошла Seedream 4.5 (55.6%) и GPT Image 1.5 (55.5%).
🟡Единственные, кто пока впереди - Nano Banana 2 и Nano Banana Pro.
Tencent проверили: прирост качества дается именно условной маршрутизацией, а не просто увеличением числа параметров. Когда генератор использовали с перемешанными или усредненными условиями, результат проваливался до уровня базовой модели.
Полный SFT с намного большим числом обучаемых параметров давал сопоставимый результат с обычным Shared LoRA, так как в обоих случаях в инференсе применяется одна фиксированная точка в пространстве весов.
Выпущенная работа - первая часть серии исследований по функциональной памяти для генеративных моделей. В планах:
🟢сравнить функциональную память с retrieval-подходами и понять, когда каждый из них уместен;
🟢разработать протоколы онлайн-обучения, при которых модель усваивает новые задачи без деградации на старых;
🟢исследовать масштабирование модели-генератора отдельно от базовой модели.
Помимо этого, в планах выйти за пределы LoRA на другие операторные интерфейсы, распространить метод на видео и агентные системы, а также проработать возможность точечно удалять поведение модели через управление состоянием генератора.
Кроме этого архиполезного исследования Tencent выложили связку из модели-генератора и базовой модели HY-Image-3.0-Instruct, поверх которой она и работает.
Поиграться этой красотой можно, если под рукой простаивает 8х40 GB или 4х80 GB VRAM.
🟡Страница проекта https://tencent-hy-wu.github.io/
🟡Prompt Handbook (китайский) https://docs.qq.com/doc/DUVVadmhCdG9qRXBU
🟡Модель https://huggingface.co/tencent/HY-WU
🟡Техотчет https://github.com/Tencent-Hunyuan/HY-WU/blob/main/assets/report.pdf
🖥 Github https://github.com/Tencent-Hunyuan/HY-WU
👉 @bigdata_1
3 254
📌Лучшие нейросети от китайских стартапов - бесплатно и без VPN
1️⃣ GLM от Z.ai
Настоящая находка для разработчиков. Их актуальная версия GLM-5 - это мощнейшая open-source модель, сопоставимая по уровню с GPT-5.2 и Claude Sonnet 4.6. Чат-бот оснащен встроенным интерпретатором кода, поддерживает агентный режим и предлагает базу готовых шаблонов для быстрой верстки сайтов и создания несложных приложений.
2️⃣ Kimi от Moonshot AI
Модель Kimi K2.5 - один из главных фаворитов для выполнения комплексных агентных поручений: от глубокого ресерча и анализа запутанных данных до разбора объемных баз кода. Внутри есть удобные инструменты для верстки презентаций, управления таблицами, программирования, а также фирменная среда OpenClaw для запуска собственных ИИ-агентов.
3️⃣ MiniMax AI Agent
Создатели позиционируют его как универсального ИИ-помощника «для любых задач», который умеет взаимодействовать даже с локальными файлами на вашем компьютере. Кроме текстового агента, стартап успешно развивает нейросеть для генерации видео Hailuo, а также крутые модели для синтеза голоса и создания музыки.
4️⃣ Qwen от Alibaba
Экосистема с самыми лояльными лимитами и огромным выбором инструментов. В арсенале: компактные открытые модели для локального использования, визуальные нейросети, ИИ-кодеры, генераторы речи и передовые для китайского рынка редакторы изображений.
👉 @bigdata_1
3 254
🚀 Подборка полезных IT каналов в Max
Системное администрирование, DevOps 📌
https://max.ru/i_odmin Все для системного администратора
https://max.ru/bash_srv Bash Советы
https://max.ru/sysadminof Книги для админов, полезные материалы
https://max.ru/i_odmin_book Библиотека Системного Администратора
https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др.
1C разработка 📌
https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С
Программирование C++📌
https://max.ru/cpp_lib Библиотека C/C++ разработчика
Программирование Python 📌
https://max.ru/python_of Python академия.
https://max.ru/BookPython Библиотека Python разработчика
Java разработка 📌
https://max.ru/bookjava Библиотека Java разработчика
GitHub Сообщество 📌
https://max.ru/githublib Интересное из GitHub
Базы данных (Data Base) 📌
https://max.ru/database_info Все про базы данных
Фронтенд разработка 📌
https://max.ru/frontend_1 Подборки для frontend разработчиков
Библиотеки 📌
https://max.ru/programmist_of Книги по программированию
https://max.ru/proglb Библиотека программиста
https://max.ru/bfbook Книги для программистов
Программирование 📌
https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций
https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT
https://max.ru/php_lib Библиотека PHP программиста 👨🏼💻👩💻
Шутки программистов 📌
https://max.ru/itumor Шутки программистов
Защита, взлом, безопасность 📌
https://max.ru/thehaking Канал о кибербезопасности
https://max.ru/xakkep_1 Хакер Free
Книги, статьи для дизайнеров 📌
https://max.ru/odesigners Статьи, книги для дизайнеров
Математика 📌
https://max.ru/Pomatematike Канал по математике
https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике
Вакансии 📌
https://max.ru/progjob Вакансии в IT
Мир технологий 📌
https://max.ru/mir_teh Канал для любознательных
Бонус 📌
https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга
https://max.ru/mockva_life Свежие новости Москвы
3 254
🐜 Antfarm - “собери команду агентов” в OpenClaw одной командой
Идея простая: вместо одного универсального агента - команда ролей (planner / developer / verifier / tester / reviewer), которые работают по строгому workflow: каждый шаг в отдельной сессии, есть проверки, ретраи, ревью - чтобы результат был воспроизводимым, а не “повезло с промптом”.
⚙️ Что внутри
🟡Готовые workflows “из коробки”:
• feature-dev (7 агентов): кидаешь фичу → получаешь протестированный PR (планирование → реализация → верификация → тесты → PR → ревью)
• security-audit (7 агентов): скан репо → приоритизация → фиксы → повторный аудит → PR + regression tests
🟡Упор на принцип: агент не “проверяет сам себя” - проверка вынесена в отдельную роль.
🚀 Установка
curl -fsSL https://raw.githubusercontent.com/snarktank/antfarm/v0.5.1/scripts/install.sh | bash
Или прямо в OpenClaw: “install github.com/snarktank/antfarm”
⚠️ Важные нюансы
• Не npm-пакет: ставится с GitHub, а в npm есть другой “antfarm”, не этот.
• Нужен Node.js ≥ 22 (если ловите node:sqlite - проверьте, что это настоящий Node, а не Bun wrapper).
🧠 Кому зайдёт
• тем, кто пилит продукт и устал от “агент сделал, но я не доверяю”
• тем, кому нужны повторяемые результаты: шаги → проверки → тесты → PR
• тем, кто хочет описывать процессы в стиле “CI для агентов”, а не ручной менеджмент
Если интересно, можно начать с простого: прогнать feature-dev на небольшой задачке и посмотреть, насколько хорошо держит дисциплину пайплайна.
https://github.com/snarktank/antfarm
#ai #agents #opensource #devtools #workflow #openclaw
👉 @bigdata_13 254
🌟 HY3D-Bench: 22 терабайта отборной 3D-геометрии.
Tencent Hunyuan вывалили в опенсорс монструозный пак HY3D-Bench на 22.5 ТБ и это подарок для всех, кто занимается 3D Gen и робототехникой.
Датасет разбит на 3 логических куска, каждый под свои задачи:
🟡Full-level Dataset (252K+ мешей, ~11 ТБ)
База с полностью замкнутой геометрией, без дырок и non-manifold артефактов, которыми обычно кишат сканы. Все нормализовано и готово к скармливанию в DiT или GAN. В комплекте идут сэмплы точек и мульти-вью рендеры.
🟡Part-level Dataset (240K+ объектов, ~5 ТБ)
Мёд для робототехников и тех, кто занимается geometric perception. Тут объекты с семантической сегментацией на части. Если учите сервоприводного друга манипуляциям или хотите генерить объекты кусками - вам сюда.
🟡Synthetic Dataset (125K+ объектов, ~6.5 ТБ)
Очевидная синтетика, чтобы закрыть редкие категории, которых нет в обычных датасетах. Охват - 1252 категории.
🟡GitHub: https://github.com/Tencent-Hunyuan/HY3D-Bench
🟡Hugging Face: https://huggingface.co/datasets/tencent/HY3D-Bench
🟡Dataset: https://arxiv.org/pdf/2602.03907
👉 @bigdata_1
3 254
Команды Яндекса ищут продуктовых и data-аналитиков, а также data scientists с опытом на Python от 3 лет.
Участвуйте в Weekend Offer, чтобы всего за 2 дня пройти все собеседования и получить офер.
Как участвовать?
⚪ Зарегистрироваться на сайте до 25 февраля.
⚪ Пройти две технические секции 28 февраля.
⚪ Познакомиться с командами и получить офер 1 марта.
Мы опираемся на научные исследования и аналитические данные, а потом превращаем их в реальные продукты для миллионов пользователей. Присоединяйтесь, чтобы строить полезные сервисы вокруг ИИ-технологий, находить новые решения и делать то, что другим не по силам.
Подробности и регистрация — по ссылке: https://yandex.ru/project/events/wo-analytics-0226
Реклама. ООО "Яндекс". ИНН 7736207543
3 254
HunyuanImage 3.0-Instruct теперь полностью в open-source 🔥
Модель стремительно поднялась в Tier-1 глобального рейтинга Arena Image Edit и уже воспринимается как одна из самых мощных open-source Image-to-Image моделей. По сути - новый ориентир (SOTA) для всего сообщества.
Что это даёт на практике:
- Редактирование изображений по текстовым инструкциям на топовом уровне
- Максимально точное следование промптам в духе «измени, но сохрани структуру»
- Уверенный баланс качества, детализации и управляемости результата
- Отличная основа для собственных инструментов, сервисов и исследований
Также доступна Distil-версия: она легче и быстрее, лучше подходит для продакшена и сценариев с ограниченными ресурсами.
🟡GitHub: https://github.com/Tencent-Hunyuan/HunyuanImage-3.0
🟡Hugging Face: https://huggingface.co/tencent/HunyuanImage-3.0-Instruct
🟡Hugging Face Distil: https://huggingface.co/tencent/HunyuanImage-3.0-Instruct-Distil
👉 @bigdata_1
3 254
Традиционный ИИ vs Агентный ИИ vs Агентный RAG
В разговорах о развитии технологий часто смешивают понятия Традиционного ИИ, Агентного ИИ и Агентного RAG, хотя на самом деле это совершенно разные ступени эволюции. Давайте разберем их отличия простым языком.
Традиционный ИИ представляет собой статичный пайплайн - классическую схему машинного обучения, с которой многие начинали. Это линейный и односторонний процесс: мы определяем задачу, собираем данные, обучаем модель, развертываем её, а затем получаем прогнозы и оцениваем их. Главная особенность в том, что после запуска модель перестает «думать», адаптироваться или перестраивать планы. Если данные или условия меняются, требуется офлайн-переобучение. Такой подход хорош для стабильных, четко определенных задач, но его главное ограничение — отсутствие обучения в реальном времени.
С появлением Агентного ИИ правила игры меняются. Это целеориентированные системы, которые умеют ставить задачи, выбирать подходящие модели и инструменты, планировать многоэтапные действия и исполнять решения. Это уже не просто схема «промпт - ответ», а цикл «план - действие - наблюдение - корректировка». Агенты ведут себя скорее как операторы, а не предсказатели. Ключевой сдвиг здесь заключается в появлении автономности и способностей к рассуждению, что идеально подходит для сложных рабочих процессов и автоматизации принятия решений.
Агентный RAG добавляет недостающий слой: память и эволюцию знаний. Эта система объединяет агентное планирование с семантическим поиском и внешними базами знаний. Теперь ИИ не только ищет информацию, но и помнит прошлые взаимодействия, записывает проверенные результаты обратно в базу и улучшает свои будущие ответы. Происходит адаптация на основе контекста, а не только промптов. Именно на этом этапе ИИ начинает вести себя как полноценная контекстно-зависимая система, а не просто чат-бот.
Таким образом, настоящий технологический сдвиг заключается не в создании более крупных моделей или написании лучших промптов. Суть революции - в переходе от линейных пайплайнов к замкнутым циклам, от генерации ответов к принятию решений, и от простого поиска информации к рассуждению, подкрепленному долгосрочной памятью.
👉 @bigdata_1
3 254
🧠 Бесконечный контекст без дообучения? Встречайте DroPE от Sakana AI
Обычно, чтобы заставить LLM работать с длинным контекстом (Long Context), приходится либо использовать методы интерполяции (как YaRN), либо проводить дорогостоящий файн-тюнинг на длинных последовательностях.
Ребята из Sakana AI (те самые, что делают Evolution Merging) выпустили новый метод — DroPE (Dropping Positional Embeddings).
В чем суть?
Авторы заметили парадокс: позиционные эмбеддинги (например, RoPE) критически важны для *сходимости* во время обучения, но на этапе инференса они становятся бутылочным горлышком, мешающим модели обобщаться на длину, превышающую ту, что была в трейне.
Как это работает:
1. Pre-training: Модель учится как обычно с RoPE.
2. Dropping: После обучения позиционные эмбеддинги... просто удаляются.
3. Recalibration: Проводится быстрая и дешевая калибровка на исходной (короткой) длине контекста.
Результат:
Модель начинает отлично работать с контекстом, который в разы превышает длину обучения (например, 2x и более), при этом не требуя тяжелых вычислений или специализированных архитектур.
Почему это круто:
✅ Дешевле: Не нужен дорогой Long-Context Fine-Tuning.
✅ Эффективнее: Работает лучше, чем популярные методы скейлинга типа YaRN или Position Interpolation (PI).
✅ Универсально: Протестировано на Llama-2 и SmolLM.
Авторы утверждают, что позиционные эмбеддинги - это как "тренировочные колеса": они нужны, чтобы научиться ездить, но потом только мешают ехать далеко.
📄 Paper: https://pub.sakana.ai/DroPE/
🔗 Репозиторий: github.com/SakanaAI/DroPE
#AI #LLM #SakanaAI #LongContext #Research
👉 @bigdata_1
3 254
RAG — это главное. Почему специализированные LLM реже галлюцинируют
Обычные LLM чатботы подходят для разговора по душам или поиска случайных фактов в интернете, толкования снов и тому подобных вещей. Это просто смешная игрушка. Для серьёзных задач (бизнес, финансы, медицина, принятие решений) это неприемлемо.
Для бизнеса галлюцинации LLM — это не «забавные ошибки», а риск: неверная цифра в отчёте, выдуманное условие договора, перепутанная дата в регламенте могут привести к самым непредсказуемым последствиям. Поэтому рынок смещается от универсальных моделей к специализированным ассистентам, которые формируют ответы на основе документов и специализированных баз данных.
Оказывается, что в продакшне базовая LLM нуждается в серьёзном апгрейде — и становится частью более сложного фреймворка, с локальной памятью, самообучением, агентами и специализированными инструментами. RAG полностью меняет дело.
https://habr.com/ru/articles/977260/
👉 @bigdata_1
3 254
OMC25: Новый стандарт данных для моделирования молекулярных кристаллов
Опубликован OMC25 - самый масштабный на сегодняшний день набор данных по молекулярным кристаллам, рассчитанный с использованием теории функционала плотности (DFT) в VASP.
Происхождение данных
Датасет базируется на траекториях релаксации кристаллов. Генерация исходных структур производилась инструментом Genarris 3.0 на основе молекул из проверенного набора OE62. Это гарантирует надежность химических структур при беспрецедентном масштабе выборки.
Объем и структура
- Тренировочная выборка: ~25 млн фреймов (207 тыс. кристаллов, полученных из 44 тыс. уникальных молекул).
- Валидационная выборка: ~1,4 млн фреймов.
- Формат: Данные упакованы в LMDBDatabase (стандарт
ase-db), что облегчает интеграцию в ML-пайплайны.
Инструментарий и метки
Работа с датасетом осуществляется через библиотеку fairchem. Структуры представлены в виде объектов ASE Atoms. Для обучения потенциалов доступны ключевые физические параметры («каноническая троица»):
1. Полная энергия (DFT).
2. Силы, действующие на атомы.
3. Тензор напряжений.
В качестве бонуса авторы предоставляют чекпоинт модели eSEN-S, уже обученной на этом массиве данных.
📜 Лицензия: CC-BY-4.0 (свободное использование с указанием авторства).
🟡Датасет
🟡Модель
🟡GitHub
👉 @bigdata_1
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
