BigData
الذهاب إلى القناة على Telegram
Data Science : Big Data : Machine Learning : Deep Learning : LLM : Нейроннные сети По всем вопросам @evgenycarter
إظهار المزيد3 241
المشتركون
لا توجد بيانات24 ساعات
-67 أيام
-1930 أيام
أرشيف المشاركات
3 239
+2
🚀 OpenAI не оставила шансов Fable 5 — состоялся анонс GPT-5.6 Sol!
Главная новость: свежая модель разгромила нашумевшую Mythos в целом ряде тестов. Показательный пример — бенчмарк Terminal-Bench 2.1, где флагманская Sol Ultra выбила 91,9%, оставив Fable позади с её 88%.
О релизе:
Тотальная автономность: ИИ теперь может писать приложения почти без помощи разработчиков, непрерывно выполняя задачи по несколько десятков часов подряд.
Бюджетные альтернативы: Вдобавок к мощной Sol компания выкатила более легкие и доступные версии — Terra и Luna.
Публичный доступ к GPT-5.6 откроют уже в ближайшие недели.
👉 @bigdata_1
3 239
Вместо того чтобы смотреть час Netflix, посмотрите эту двухчасовую лекцию из Стэнфорда — она научит вас большему о том, как строятся LLM вроде ChatGPT и Claude, чем большинство людей, работающих в ведущих компаниях по ИИ, узнают за всю свою карьеру.
👉 @bigdata_1
3 239
+2
Кластер M5 Max
72 ядра CPU и 128 ядер GPU, 512 ГБ унифицированной оперативной памяти
Каждый MacBook подключён ко всем остальным через Thunderbolt 5 (120 Гбит/с).
👉 @bigdata_1
3 239
RAG против Агентов (RAGs vs Agents)
Спросите LLM (большую языковую модель) о данных вашей компании, и она начнет гадать. Два паттерна, которые исправляют это - RAG и агенты, и они решают разные задачи.
RAG (Поисково-ориентированная генерация)
RAG объединяет LLM с поиском информации, чтобы обосновать ответы фактами. Этот процесс состоит из 4 шагов:
• Шаг 1: Запрос пользователя (User Query) векторизуется и отправляется на этап поиска (Retrieval).
• Шаг 2: Компонент поиска извлекает наиболее релевантные фрагменты из базы знаний (Knowledge Base: PDF-файлы, вики-страницы и т.д.).
• Шаг 3: Эти фрагменты вставляются в промпт в качестве контекста.
• Шаг 4: LLM пишет ответ, опираясь на извлеченный текст (Answer grounded).
Особенности: Один поиск. Одна генерация. Дешево, предсказуемо и легко поддается отладке.
Агенты (Agents)
Агенты оборачивают LLM в цикл рассуждений с набором инструментов (Tools) для выполнения конкретных действий.
• Шаг 1: Запрос пользователя поступает в среду выполнения агента (Agent runtime) — цикл рассуждений вокруг LLM.
• Шаг 2: LLM анализирует цель и выбирает нужный инструмент (Чтение, Запись, Редактирование, Bash и т.д.).
• Шаг 3: Среда выполнения (runtime) запускает инструмент и передает результат обратно в LLM.
• Шаг 4: LLM снова проводит рассуждения, выбирает следующий инструмент и повторяет этот цикл, пока задача не будет выполнена.
Особенности: Более гибко. Расходует больше токенов. Сложнее отлаживать, так как ошибки накапливаются от шага к шагу.
Главное эмпирическое правило (из центральной части картинки):
• Используйте RAG, когда ответ находится внутри ваших документов.
• Используйте Агента, когда решение задачи требует действий в других системах.
👉 @bigdata_1
3 239
Преодоление узкого места LLM: подход GenPRM к вычислениям во время тестирования Scale с помощью генеративного рассуждения.
Недавно модели вознаграждения процессов (PRM) в качестве верификаторов стали перспективным подходом для повышения производительности LLM. Для решения проблем с PRM в этой статье представлена GenPRM — модель вознаграждения за генеративный процесс, которая выполняет явное рассуждение по цепочке мысли (CoT) с верификацией кода перед вынесением суждений по каждому этапу рассуждения.
👉 Проблемы с текущими PRM:
- Ограниченные возможности контроля и обобщения процессов
- Зависимость от скалярного прогнозирования значений без использования генеративных возможностей LLM
- Невозможность масштабировать вычисления во время тестирования
👉 Фреймворк GenPRM
решает вышеупомянутые проблемы с помощью шестичастной структуры, включающей:
1️⃣ Модель политики генерирует шаги решения, при этом оценки MC оцениваются по траекториям внедрения.
2️⃣ Предлагаемая оценка относительного прогресса (RPE) получает точные метки PRM.
3️⃣ Высококачественные данные надзора процессов, синтезированные с помощью CoT-рассуждения и верификации кода
4️⃣ Консенсусная фильтрация и обучение SFT GenPRM
5️⃣ Обученный GenPRM, функционирующий в качестве верификатора или критика для расширенного масштабирования времени тестирования
6️⃣ Повышение производительности за счёт масштабирования во время тестирования
👉 Масштабирование времени тестирования с помощью GenPRM
1️⃣ Policy Model TTS: GenPRM как проверяющий
- несколько ответов могут быть выбраны из моделей политики, а затем использовать GenPRM в качестве верификатора для выбора конечного ответа в виде параллельных TTS.
2️⃣ Модель политики TTS: GenPRM как критик
- GenPRM можно естественно использовать как критическую модель для уточнения результатов моделей политик, и мы можем масштабировать процесс уточнения с несколькими ходами последовательно по TTS.
3️⃣ GenPRM TTS
- сначала взят пример N путей верификации рассуждения, а затем используй голосование большинством для получения окончательного прогноза, усредняя вознаграждения.
👉 Синтез данных GenPRM
Состоит из трёх этапов:
1️⃣ генерация путей рассуждения и получение меток PRM с помощью оценки Монте-Карло (MC)
2️⃣ оценка прогресса каждого шага с помощью оценки относительного прогресса
3️⃣ синтез обоснований с CoT и верификацией кода, а также вывод меток LLM-as-a-judge с помощью консенсусной фильтрации
📈 Результаты оценки
- GenPRM значительно превосходит предыдущие PRM, имея всего 23K обучающих данных из набора данных MATH.
- при масштабировании времени тестирования 1,5B GenPRM превосходит GPT-4o, а 7B GenPRM превосходит Qwen2.5-Math-PRM-72B на ProcessBench
Blog: https://medium.com/@techsachin/breaking-the-llm-bottleneck-genprms-approach-to-scale-test-time-compute-via-generative-reasoning-0e90e3ffa71e
Paper: https://arxiv.org/abs/2504.00891
Code: https://github.com/RyanLiu112/GenPRM
Models: https://huggingface.co/collections/GenPRM/genprm-67ee4936234ba5dd16bb9943
👉 @bigdata_1
3 239
🚀 Подборка полезных IT каналов в Max
Системное администрирование, DevOps 📌
https://max.ru/i_odmin Все для системного администратора
https://max.ru/bash_srv Bash Советы
https://max.ru/sysadminof Книги для админов, полезные материалы
https://max.ru/i_odmin_book Библиотека Системного Администратора
https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др.
1C разработка 📌
https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С
Программирование C++📌
https://max.ru/cpp_lib Библиотека C/C++ разработчика
Программирование Go📌
https://max.ru/golang_lib Библиотека Go (Golang) разработчика
Программирование React📌
https://max.ru/react_lib React
Программирование Python 📌
https://max.ru/python_of Python академия.
https://max.ru/BookPython Библиотека Python разработчика
Java разработка 📌
https://max.ru/bookjava Библиотека Java разработчика
GitHub Сообщество 📌
https://max.ru/githublib Интересное из GitHub
Базы данных (Data Base) 📌
https://max.ru/database_info Все про базы данных
Фронтенд разработка 📌
https://max.ru/frontend_1 Подборки для frontend разработчиков
Библиотеки 📌
https://max.ru/programmist_of Книги по программированию
https://max.ru/proglb Библиотека программиста
https://max.ru/bfbook Книги для программистов
Программирование 📌
https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций
https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT
https://max.ru/php_lib Библиотека PHP программиста 👨🏼💻👩💻
Шутки программистов 📌
https://max.ru/itumor Шутки программистов
Защита, взлом, безопасность 📌
https://max.ru/thehaking Канал о кибербезопасности
https://max.ru/xakkep_1 Хакер Free
Книги, статьи для дизайнеров 📌
https://max.ru/odesigners Статьи, книги для дизайнеров
Математика 📌
https://max.ru/Pomatematike Канал по математике
https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике
Вакансии 📌
https://max.ru/progjob Вакансии в IT
Мир технологий 📌
https://max.ru/mir_teh Канал для любознательных
Бонус 📌
https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга
https://max.ru/mockva_life Свежие новости Москвы
3 239
Anthropic представила Claude Design - отдельный продукт для создания готовых макетов, прототипов, слайдов и сайтов.
В основе сервиса лежит Claude Opus 4.7 - флагманская модель компании с продвинутым пониманием визуала. Главная особенность новинки — не просто генерация интерфейсов, а работа с уже существующими материалами продукта. Claude может анализировать кодовую базу и дизайн-файлы, извлекать из них дизайн-систему и затем автоматически придерживаться фирменного стиля.
То есть сервису не нужно вручную объяснять, какие в проекте используются шрифты, цвета и отступы - он сам подстраивается под бренд. Пока Claude Design доступен в формате research preview для тарифов Pro, Max, Team и Enterprise.
Попробовать: claude.ai/design
#Anthropic #ClaudeDesign #ClaudeOpus #дизайн #прототипы #слайды #сайты #AI #нейросети #технологии
👉 @bigdata_1
3 239
🚀 Подборка полезных IT каналов в Max
Системное администрирование, DevOps 📌
https://max.ru/i_odmin Все для системного администратора
https://max.ru/bash_srv Bash Советы
https://max.ru/sysadminof Книги для админов, полезные материалы
https://max.ru/i_odmin_book Библиотека Системного Администратора
https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др.
1C разработка 📌
https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С
Программирование C++📌
https://max.ru/cpp_lib Библиотека C/C++ разработчика
Программирование Go📌
https://max.ru/golang_lib Библиотека Go (Golang) разработчика
Программирование React📌
https://max.ru/react_lib React
Программирование Python 📌
https://max.ru/python_of Python академия.
https://max.ru/BookPython Библиотека Python разработчика
Java разработка 📌
https://max.ru/bookjava Библиотека Java разработчика
GitHub Сообщество 📌
https://max.ru/githublib Интересное из GitHub
Базы данных (Data Base) 📌
https://max.ru/database_info Все про базы данных
Фронтенд разработка 📌
https://max.ru/frontend_1 Подборки для frontend разработчиков
Библиотеки 📌
https://max.ru/programmist_of Книги по программированию
https://max.ru/proglb Библиотека программиста
https://max.ru/bfbook Книги для программистов
Программирование 📌
https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций
https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT
https://max.ru/php_lib Библиотека PHP программиста 👨🏼💻👩💻
Шутки программистов 📌
https://max.ru/itumor Шутки программистов
Защита, взлом, безопасность 📌
https://max.ru/thehaking Канал о кибербезопасности
https://max.ru/xakkep_1 Хакер Free
Книги, статьи для дизайнеров 📌
https://max.ru/odesigners Статьи, книги для дизайнеров
Математика 📌
https://max.ru/Pomatematike Канал по математике
https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике
Вакансии 📌
https://max.ru/progjob Вакансии в IT
Мир технологий 📌
https://max.ru/mir_teh Канал для любознательных
Бонус 📌
https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга
https://max.ru/mockva_life Свежие новости Москвы
3 239
Станьте Deep Learning Engineer с дипломом 👍
Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская диагностика — нейросети используются уже во всех сферах бизнеса. Компании ищут DL-специалистов, чтобы точнее обучать и настраивать нейросети под свои запросы.
Освоить Deep Learning самостоятельно сложно, но ребята из Simulative нашли решение, где учёба становится понятной и структурированной, а все темы разбираются на практике 🔥
Simulative запускает программу профессиональной переподготовки «Инженер глубокого обучения нейросетей».
По итогам обучения вы получите:
🎓 Диплом гособразцаОфициальный диплом о профессиональной переподготовке с квалификацией «Специалист по большим данным».
💯 ПрактикаБолее 40 практических работ в формате симуляции реальной работы DL-инженера — всё пойдёт в портфолио.
🙌🏽 Онлайн обучениеУчитесь из любой точки мира, совмещая с работой, а доступ к материалам останется навсегда. Курс подходит для специалистов любого уровня: новичок, аналитик, ML-инженер или выпускник — на программе опытные менторы помогут выстроить вашу персональную траекторию роста в Deep Learning. Что вы освоите: 🟠Создание и обучение нейросетей с нуля 🟠Компьютерное зрение (Computer Vision) 🟠NLP (обработка текста) 🟠Генеративные модели 🟠MLOps и продакшн-подход 🕖 Скорее записывайтесь, количество мест на поток ограничено! Бронируйте место на курсе прямо сейчас и получите скидку 30% 😶ПОЛУЧИТЬ СКИДКУ НА КУРС
3 239
🚀 Подборка полезных IT каналов в Max
Системное администрирование, DevOps 📌
https://max.ru/i_odmin Все для системного администратора
https://max.ru/bash_srv Bash Советы
https://max.ru/sysadminof Книги для админов, полезные материалы
https://max.ru/i_odmin_book Библиотека Системного Администратора
https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др.
1C разработка 📌
https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С
Программирование C++📌
https://max.ru/cpp_lib Библиотека C/C++ разработчика
Программирование Python 📌
https://max.ru/python_of Python академия.
https://max.ru/BookPython Библиотека Python разработчика
Java разработка 📌
https://max.ru/bookjava Библиотека Java разработчика
GitHub Сообщество 📌
https://max.ru/githublib Интересное из GitHub
Базы данных (Data Base) 📌
https://max.ru/database_info Все про базы данных
Фронтенд разработка 📌
https://max.ru/frontend_1 Подборки для frontend разработчиков
Библиотеки 📌
https://max.ru/programmist_of Книги по программированию
https://max.ru/proglb Библиотека программиста
https://max.ru/bfbook Книги для программистов
Программирование 📌
https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций
https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT
https://max.ru/php_lib Библиотека PHP программиста 👨🏼💻👩💻
Шутки программистов 📌
https://max.ru/itumor Шутки программистов
Защита, взлом, безопасность 📌
https://max.ru/thehaking Канал о кибербезопасности
https://max.ru/xakkep_1 Хакер Free
Книги, статьи для дизайнеров 📌
https://max.ru/odesigners Статьи, книги для дизайнеров
Математика 📌
https://max.ru/Pomatematike Канал по математике
https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике
Вакансии 📌
https://max.ru/progjob Вакансии в IT
Мир технологий 📌
https://max.ru/mir_teh Канал для любознательных
Бонус 📌
https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга
https://max.ru/mockva_life Свежие новости Москвы
3 239
🌟 Tencent HY-WU: динамические LoRA для редактирования изображений.
Tencent HY опубликовала первую часть серии работ под названием HY-WU (Weight Unleashing). Суть метода в отказе от стандартной парадигмы адаптации, при которой модель получает один фиксированный набор весов для всех задач.
Специальная модель-генератор синтезирует LoRA отдельно под каждый входной пример прямо во время инференса, без дополнительной оптимизации на тест-тайме.
Проблема, которую решает HY-WU, хорошо знакома всем, кто работал с дообучением: когда задачи противоречат друг другу (например, "размыть" против "убрать размытие" или "состарить лицо" против "восстановить"), общий адаптер вынужден идти на компромисс.
Градиенты конфликтуют, и результат оказывается хуже, чем если бы задачи обучались раздельно.
Чтобы не быть голословными, авторы измерили это напрямую: косинусное сходство градиентов между разнородными задачами устойчиво отрицательно, среднее около −0.30, то есть задачи буквально тянут веса в противоположные стороны.
HY-WU предлагает условную генерацию параметров. Модель-генератор (8B параметров) принимает на вход совместное представление изображения и текстового запроса через энкодер SigLIP2, после чего генерирует LoRA-матрицы (~0.72B) и инжектирует их в базовую модель.
Обучение сквозное, только через downstream-loss, без предварительно собранных чекпойнтов адаптеров.
🟡Тесты и результаты
Для тестов выбрали задачу редактирования изображения текстовым запросом - в нем конфликты неизбежны и визуально очевидны.
🟡В попарном human evaluation (GSB) HY-WU выигрывает у всех топовых open-source редакторов с большим отрывом: 67–78% против Step1X, Qwen, LongCat и FLUX;
🟡Среди закрытых систем модель обошла Seedream 4.5 (55.6%) и GPT Image 1.5 (55.5%).
🟡Единственные, кто пока впереди - Nano Banana 2 и Nano Banana Pro.
Tencent проверили: прирост качества дается именно условной маршрутизацией, а не просто увеличением числа параметров. Когда генератор использовали с перемешанными или усредненными условиями, результат проваливался до уровня базовой модели.
Полный SFT с намного большим числом обучаемых параметров давал сопоставимый результат с обычным Shared LoRA, так как в обоих случаях в инференсе применяется одна фиксированная точка в пространстве весов.
Выпущенная работа - первая часть серии исследований по функциональной памяти для генеративных моделей. В планах:
🟢сравнить функциональную память с retrieval-подходами и понять, когда каждый из них уместен;
🟢разработать протоколы онлайн-обучения, при которых модель усваивает новые задачи без деградации на старых;
🟢исследовать масштабирование модели-генератора отдельно от базовой модели.
Помимо этого, в планах выйти за пределы LoRA на другие операторные интерфейсы, распространить метод на видео и агентные системы, а также проработать возможность точечно удалять поведение модели через управление состоянием генератора.
Кроме этого архиполезного исследования Tencent выложили связку из модели-генератора и базовой модели HY-Image-3.0-Instruct, поверх которой она и работает.
Поиграться этой красотой можно, если под рукой простаивает 8х40 GB или 4х80 GB VRAM.
🟡Страница проекта https://tencent-hy-wu.github.io/
🟡Prompt Handbook (китайский) https://docs.qq.com/doc/DUVVadmhCdG9qRXBU
🟡Модель https://huggingface.co/tencent/HY-WU
🟡Техотчет https://github.com/Tencent-Hunyuan/HY-WU/blob/main/assets/report.pdf
🖥 Github https://github.com/Tencent-Hunyuan/HY-WU
👉 @bigdata_1
3 239
📌Лучшие нейросети от китайских стартапов - бесплатно и без VPN
1️⃣ GLM от Z.ai
Настоящая находка для разработчиков. Их актуальная версия GLM-5 - это мощнейшая open-source модель, сопоставимая по уровню с GPT-5.2 и Claude Sonnet 4.6. Чат-бот оснащен встроенным интерпретатором кода, поддерживает агентный режим и предлагает базу готовых шаблонов для быстрой верстки сайтов и создания несложных приложений.
2️⃣ Kimi от Moonshot AI
Модель Kimi K2.5 - один из главных фаворитов для выполнения комплексных агентных поручений: от глубокого ресерча и анализа запутанных данных до разбора объемных баз кода. Внутри есть удобные инструменты для верстки презентаций, управления таблицами, программирования, а также фирменная среда OpenClaw для запуска собственных ИИ-агентов.
3️⃣ MiniMax AI Agent
Создатели позиционируют его как универсального ИИ-помощника «для любых задач», который умеет взаимодействовать даже с локальными файлами на вашем компьютере. Кроме текстового агента, стартап успешно развивает нейросеть для генерации видео Hailuo, а также крутые модели для синтеза голоса и создания музыки.
4️⃣ Qwen от Alibaba
Экосистема с самыми лояльными лимитами и огромным выбором инструментов. В арсенале: компактные открытые модели для локального использования, визуальные нейросети, ИИ-кодеры, генераторы речи и передовые для китайского рынка редакторы изображений.
👉 @bigdata_1
3 239
🚀 Подборка полезных IT каналов в Max
Системное администрирование, DevOps 📌
https://max.ru/i_odmin Все для системного администратора
https://max.ru/bash_srv Bash Советы
https://max.ru/sysadminof Книги для админов, полезные материалы
https://max.ru/i_odmin_book Библиотека Системного Администратора
https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др.
1C разработка 📌
https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С
Программирование C++📌
https://max.ru/cpp_lib Библиотека C/C++ разработчика
Программирование Python 📌
https://max.ru/python_of Python академия.
https://max.ru/BookPython Библиотека Python разработчика
Java разработка 📌
https://max.ru/bookjava Библиотека Java разработчика
GitHub Сообщество 📌
https://max.ru/githublib Интересное из GitHub
Базы данных (Data Base) 📌
https://max.ru/database_info Все про базы данных
Фронтенд разработка 📌
https://max.ru/frontend_1 Подборки для frontend разработчиков
Библиотеки 📌
https://max.ru/programmist_of Книги по программированию
https://max.ru/proglb Библиотека программиста
https://max.ru/bfbook Книги для программистов
Программирование 📌
https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций
https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT
https://max.ru/php_lib Библиотека PHP программиста 👨🏼💻👩💻
Шутки программистов 📌
https://max.ru/itumor Шутки программистов
Защита, взлом, безопасность 📌
https://max.ru/thehaking Канал о кибербезопасности
https://max.ru/xakkep_1 Хакер Free
Книги, статьи для дизайнеров 📌
https://max.ru/odesigners Статьи, книги для дизайнеров
Математика 📌
https://max.ru/Pomatematike Канал по математике
https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике
Вакансии 📌
https://max.ru/progjob Вакансии в IT
Мир технологий 📌
https://max.ru/mir_teh Канал для любознательных
Бонус 📌
https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга
https://max.ru/mockva_life Свежие новости Москвы
3 239
🐜 Antfarm - “собери команду агентов” в OpenClaw одной командой
Идея простая: вместо одного универсального агента - команда ролей (planner / developer / verifier / tester / reviewer), которые работают по строгому workflow: каждый шаг в отдельной сессии, есть проверки, ретраи, ревью - чтобы результат был воспроизводимым, а не “повезло с промптом”.
⚙️ Что внутри
🟡Готовые workflows “из коробки”:
• feature-dev (7 агентов): кидаешь фичу → получаешь протестированный PR (планирование → реализация → верификация → тесты → PR → ревью)
• security-audit (7 агентов): скан репо → приоритизация → фиксы → повторный аудит → PR + regression tests
🟡Упор на принцип: агент не “проверяет сам себя” - проверка вынесена в отдельную роль.
🚀 Установка
curl -fsSL https://raw.githubusercontent.com/snarktank/antfarm/v0.5.1/scripts/install.sh | bash
Или прямо в OpenClaw: “install github.com/snarktank/antfarm”
⚠️ Важные нюансы
• Не npm-пакет: ставится с GitHub, а в npm есть другой “antfarm”, не этот.
• Нужен Node.js ≥ 22 (если ловите node:sqlite - проверьте, что это настоящий Node, а не Bun wrapper).
🧠 Кому зайдёт
• тем, кто пилит продукт и устал от “агент сделал, но я не доверяю”
• тем, кому нужны повторяемые результаты: шаги → проверки → тесты → PR
• тем, кто хочет описывать процессы в стиле “CI для агентов”, а не ручной менеджмент
Если интересно, можно начать с простого: прогнать feature-dev на небольшой задачке и посмотреть, насколько хорошо держит дисциплину пайплайна.
https://github.com/snarktank/antfarm
#ai #agents #opensource #devtools #workflow #openclaw
👉 @bigdata_13 239
🌟 HY3D-Bench: 22 терабайта отборной 3D-геометрии.
Tencent Hunyuan вывалили в опенсорс монструозный пак HY3D-Bench на 22.5 ТБ и это подарок для всех, кто занимается 3D Gen и робототехникой.
Датасет разбит на 3 логических куска, каждый под свои задачи:
🟡Full-level Dataset (252K+ мешей, ~11 ТБ)
База с полностью замкнутой геометрией, без дырок и non-manifold артефактов, которыми обычно кишат сканы. Все нормализовано и готово к скармливанию в DiT или GAN. В комплекте идут сэмплы точек и мульти-вью рендеры.
🟡Part-level Dataset (240K+ объектов, ~5 ТБ)
Мёд для робототехников и тех, кто занимается geometric perception. Тут объекты с семантической сегментацией на части. Если учите сервоприводного друга манипуляциям или хотите генерить объекты кусками - вам сюда.
🟡Synthetic Dataset (125K+ объектов, ~6.5 ТБ)
Очевидная синтетика, чтобы закрыть редкие категории, которых нет в обычных датасетах. Охват - 1252 категории.
🟡GitHub: https://github.com/Tencent-Hunyuan/HY3D-Bench
🟡Hugging Face: https://huggingface.co/datasets/tencent/HY3D-Bench
🟡Dataset: https://arxiv.org/pdf/2602.03907
👉 @bigdata_1
3 239
Команды Яндекса ищут продуктовых и data-аналитиков, а также data scientists с опытом на Python от 3 лет.
Участвуйте в Weekend Offer, чтобы всего за 2 дня пройти все собеседования и получить офер.
Как участвовать?
⚪ Зарегистрироваться на сайте до 25 февраля.
⚪ Пройти две технические секции 28 февраля.
⚪ Познакомиться с командами и получить офер 1 марта.
Мы опираемся на научные исследования и аналитические данные, а потом превращаем их в реальные продукты для миллионов пользователей. Присоединяйтесь, чтобы строить полезные сервисы вокруг ИИ-технологий, находить новые решения и делать то, что другим не по силам.
Подробности и регистрация — по ссылке: https://yandex.ru/project/events/wo-analytics-0226
Реклама. ООО "Яндекс". ИНН 7736207543
3 239
HunyuanImage 3.0-Instruct теперь полностью в open-source 🔥
Модель стремительно поднялась в Tier-1 глобального рейтинга Arena Image Edit и уже воспринимается как одна из самых мощных open-source Image-to-Image моделей. По сути - новый ориентир (SOTA) для всего сообщества.
Что это даёт на практике:
- Редактирование изображений по текстовым инструкциям на топовом уровне
- Максимально точное следование промптам в духе «измени, но сохрани структуру»
- Уверенный баланс качества, детализации и управляемости результата
- Отличная основа для собственных инструментов, сервисов и исследований
Также доступна Distil-версия: она легче и быстрее, лучше подходит для продакшена и сценариев с ограниченными ресурсами.
🟡GitHub: https://github.com/Tencent-Hunyuan/HunyuanImage-3.0
🟡Hugging Face: https://huggingface.co/tencent/HunyuanImage-3.0-Instruct
🟡Hugging Face Distil: https://huggingface.co/tencent/HunyuanImage-3.0-Instruct-Distil
👉 @bigdata_1
3 239
Традиционный ИИ vs Агентный ИИ vs Агентный RAG
В разговорах о развитии технологий часто смешивают понятия Традиционного ИИ, Агентного ИИ и Агентного RAG, хотя на самом деле это совершенно разные ступени эволюции. Давайте разберем их отличия простым языком.
Традиционный ИИ представляет собой статичный пайплайн - классическую схему машинного обучения, с которой многие начинали. Это линейный и односторонний процесс: мы определяем задачу, собираем данные, обучаем модель, развертываем её, а затем получаем прогнозы и оцениваем их. Главная особенность в том, что после запуска модель перестает «думать», адаптироваться или перестраивать планы. Если данные или условия меняются, требуется офлайн-переобучение. Такой подход хорош для стабильных, четко определенных задач, но его главное ограничение — отсутствие обучения в реальном времени.
С появлением Агентного ИИ правила игры меняются. Это целеориентированные системы, которые умеют ставить задачи, выбирать подходящие модели и инструменты, планировать многоэтапные действия и исполнять решения. Это уже не просто схема «промпт - ответ», а цикл «план - действие - наблюдение - корректировка». Агенты ведут себя скорее как операторы, а не предсказатели. Ключевой сдвиг здесь заключается в появлении автономности и способностей к рассуждению, что идеально подходит для сложных рабочих процессов и автоматизации принятия решений.
Агентный RAG добавляет недостающий слой: память и эволюцию знаний. Эта система объединяет агентное планирование с семантическим поиском и внешними базами знаний. Теперь ИИ не только ищет информацию, но и помнит прошлые взаимодействия, записывает проверенные результаты обратно в базу и улучшает свои будущие ответы. Происходит адаптация на основе контекста, а не только промптов. Именно на этом этапе ИИ начинает вести себя как полноценная контекстно-зависимая система, а не просто чат-бот.
Таким образом, настоящий технологический сдвиг заключается не в создании более крупных моделей или написании лучших промптов. Суть революции - в переходе от линейных пайплайнов к замкнутым циклам, от генерации ответов к принятию решений, и от простого поиска информации к рассуждению, подкрепленному долгосрочной памятью.
👉 @bigdata_1
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
