uz
Feedback
BigData

BigData

Kanalga Telegram’da o‘tish

Data Science : Big Data : Machine Learning : Deep Learning : LLM : Нейроннные сети По всем вопросам @evgenycarter

Ko'proq ko'rsatish
3 241
Obunachilar
Ma'lumot yo'q24 soatlar
-67 kunlar
-1930 kunlar
Postlar arxiv
BigData
3 239
🚀 OpenAI не оставила шансов Fable 5 — состоялся анонс GPT-5.6 Sol! Главная новость: свежая модель разгромила нашумевшую Myth
+2
🚀 OpenAI не оставила шансов Fable 5 — состоялся анонс GPT-5.6 Sol! Главная новость: свежая модель разгромила нашумевшую Mythos в целом ряде тестов. Показательный пример — бенчмарк Terminal-Bench 2.1, где флагманская Sol Ultra выбила 91,9%, оставив Fable позади с её 88%. О релизе: Тотальная автономность: ИИ теперь может писать приложения почти без помощи разработчиков, непрерывно выполняя задачи по несколько десятков часов подряд. Бюджетные альтернативы: Вдобавок к мощной Sol компания выкатила более легкие и доступные версии — Terra и Luna. Публичный доступ к GPT-5.6 откроют уже в ближайшие недели. 👉 @bigdata_1

BigData
3 239
Вместо того чтобы смотреть час Netflix, посмотрите эту двухчасовую лекцию из Стэнфорда — она научит вас большему о том, как строятся LLM вроде ChatGPT и Claude, чем большинство людей, работающих в ведущих компаниях по ИИ, узнают за всю свою карьеру. 👉 @bigdata_1

BigData
3 239
Кластер M5 Max 72 ядра CPU и 128 ядер GPU, 512 ГБ унифицированной оперативной памяти Каждый MacBook подключён ко всем остальн
+2
Кластер M5 Max 72 ядра CPU и 128 ядер GPU, 512 ГБ унифицированной оперативной памяти Каждый MacBook подключён ко всем остальным через Thunderbolt 5 (120 Гбит/с). 👉 @bigdata_1

BigData
3 239
RAG против Агентов (RAGs vs Agents) Спросите LLM (большую языковую модель) о данных вашей компании, и она начнет гадать. Два
RAG против Агентов (RAGs vs Agents) Спросите LLM (большую языковую модель) о данных вашей компании, и она начнет гадать. Два паттерна, которые исправляют это - RAG и агенты, и они решают разные задачи. RAG (Поисково-ориентированная генерация) RAG объединяет LLM с поиском информации, чтобы обосновать ответы фактами. Этот процесс состоит из 4 шагов: • Шаг 1: Запрос пользователя (User Query) векторизуется и отправляется на этап поиска (Retrieval). • Шаг 2: Компонент поиска извлекает наиболее релевантные фрагменты из базы знаний (Knowledge Base: PDF-файлы, вики-страницы и т.д.). • Шаг 3: Эти фрагменты вставляются в промпт в качестве контекста. • Шаг 4: LLM пишет ответ, опираясь на извлеченный текст (Answer grounded). Особенности: Один поиск. Одна генерация. Дешево, предсказуемо и легко поддается отладке. Агенты (Agents) Агенты оборачивают LLM в цикл рассуждений с набором инструментов (Tools) для выполнения конкретных действий. • Шаг 1: Запрос пользователя поступает в среду выполнения агента (Agent runtime) — цикл рассуждений вокруг LLM. • Шаг 2: LLM анализирует цель и выбирает нужный инструмент (Чтение, Запись, Редактирование, Bash и т.д.). • Шаг 3: Среда выполнения (runtime) запускает инструмент и передает результат обратно в LLM. • Шаг 4: LLM снова проводит рассуждения, выбирает следующий инструмент и повторяет этот цикл, пока задача не будет выполнена. Особенности: Более гибко. Расходует больше токенов. Сложнее отлаживать, так как ошибки накапливаются от шага к шагу. Главное эмпирическое правило (из центральной части картинки): • Используйте RAG, когда ответ находится внутри ваших документов. • Используйте Агента, когда решение задачи требует действий в других системах. 👉 @bigdata_1

BigData
3 239
Преодоление узкого места LLM: подход GenPRM к вычислениям во время тестирования Scale с помощью генеративного рассуждения. Не
Преодоление узкого места LLM: подход GenPRM к вычислениям во время тестирования Scale с помощью генеративного рассуждения. Недавно модели вознаграждения процессов (PRM) в качестве верификаторов стали перспективным подходом для повышения производительности LLM. Для решения проблем с PRM в этой статье представлена GenPRM — модель вознаграждения за генеративный процесс, которая выполняет явное рассуждение по цепочке мысли (CoT) с верификацией кода перед вынесением суждений по каждому этапу рассуждения. 👉 Проблемы с текущими PRM: - Ограниченные возможности контроля и обобщения процессов - Зависимость от скалярного прогнозирования значений без использования генеративных возможностей LLM - Невозможность масштабировать вычисления во время тестирования 👉 Фреймворк GenPRM решает вышеупомянутые проблемы с помощью шестичастной структуры, включающей: 1️⃣ Модель политики генерирует шаги решения, при этом оценки MC оцениваются по траекториям внедрения. 2️⃣ Предлагаемая оценка относительного прогресса (RPE) получает точные метки PRM. 3️⃣ Высококачественные данные надзора процессов, синтезированные с помощью CoT-рассуждения и верификации кода 4️⃣ Консенсусная фильтрация и обучение SFT GenPRM 5️⃣ Обученный GenPRM, функционирующий в качестве верификатора или критика для расширенного масштабирования времени тестирования 6️⃣ Повышение производительности за счёт масштабирования во время тестирования 👉 Масштабирование времени тестирования с помощью GenPRM 1️⃣ Policy Model TTS: GenPRM как проверяющий - несколько ответов могут быть выбраны из моделей политики, а затем использовать GenPRM в качестве верификатора для выбора конечного ответа в виде параллельных TTS. 2️⃣ Модель политики TTS: GenPRM как критик - GenPRM можно естественно использовать как критическую модель для уточнения результатов моделей политик, и мы можем масштабировать процесс уточнения с несколькими ходами последовательно по TTS. 3️⃣ GenPRM TTS - сначала взят пример N путей верификации рассуждения, а затем используй голосование большинством для получения окончательного прогноза, усредняя вознаграждения. 👉 Синтез данных GenPRM Состоит из трёх этапов: 1️⃣ генерация путей рассуждения и получение меток PRM с помощью оценки Монте-Карло (MC) 2️⃣ оценка прогресса каждого шага с помощью оценки относительного прогресса 3️⃣ синтез обоснований с CoT и верификацией кода, а также вывод меток LLM-as-a-judge с помощью консенсусной фильтрации 📈 Результаты оценки - GenPRM значительно превосходит предыдущие PRM, имея всего 23K обучающих данных из набора данных MATH. - при масштабировании времени тестирования 1,5B GenPRM превосходит GPT-4o, а 7B GenPRM превосходит Qwen2.5-Math-PRM-72B на ProcessBench Blog: https://medium.com/@techsachin/breaking-the-llm-bottleneck-genprms-approach-to-scale-test-time-compute-via-generative-reasoning-0e90e3ffa71e Paper: https://arxiv.org/abs/2504.00891 Code: https://github.com/RyanLiu112/GenPRM Models: https://huggingface.co/collections/GenPRM/genprm-67ee4936234ba5dd16bb9943 👉 @bigdata_1

BigData
3 239
🚀 Подборка полезных IT каналов в Max Системное администрирование, DevOps 📌 https://max.ru/i_odmin Все для системного администратора https://max.ru/bash_srv Bash Советы https://max.ru/sysadminof Книги для админов, полезные материалы https://max.ru/i_odmin_book Библиотека Системного Администратора https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др. 1C разработка 📌 https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С Программирование C++📌 https://max.ru/cpp_lib Библиотека C/C++ разработчика Программирование Go📌 https://max.ru/golang_lib Библиотека Go (Golang) разработчика Программирование React📌 https://max.ru/react_lib React Программирование Python 📌 https://max.ru/python_of Python академия. https://max.ru/BookPython Библиотека Python разработчика Java разработка 📌 https://max.ru/bookjava Библиотека Java разработчика GitHub Сообщество 📌 https://max.ru/githublib Интересное из GitHub Базы данных (Data Base) 📌 https://max.ru/database_info Все про базы данных Фронтенд разработка 📌 https://max.ru/frontend_1 Подборки для frontend разработчиков Библиотеки 📌 https://max.ru/programmist_of Книги по программированию https://max.ru/proglb Библиотека программиста https://max.ru/bfbook Книги для программистов Программирование 📌 https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT https://max.ru/php_lib Библиотека PHP программиста 👨🏼‍💻👩‍💻 Шутки программистов 📌 https://max.ru/itumor Шутки программистов Защита, взлом, безопасность 📌 https://max.ru/thehaking Канал о кибербезопасности https://max.ru/xakkep_1 Хакер Free Книги, статьи для дизайнеров 📌 https://max.ru/odesigners Статьи, книги для дизайнеров Математика 📌 https://max.ru/Pomatematike Канал по математике https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике Вакансии 📌 https://max.ru/progjob Вакансии в IT Мир технологий 📌 https://max.ru/mir_teh Канал для любознательных Бонус 📌 https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга https://max.ru/mockva_life Свежие новости Москвы

BigData
3 239
Anthropic представила Claude Design - отдельный продукт для создания готовых макетов, прототипов, слайдов и сайтов. В основе сервиса лежит Claude Opus 4.7 - флагманская модель компании с продвинутым пониманием визуала. Главная особенность новинки — не просто генерация интерфейсов, а работа с уже существующими материалами продукта. Claude может анализировать кодовую базу и дизайн-файлы, извлекать из них дизайн-систему и затем автоматически придерживаться фирменного стиля. То есть сервису не нужно вручную объяснять, какие в проекте используются шрифты, цвета и отступы - он сам подстраивается под бренд. Пока Claude Design доступен в формате research preview для тарифов Pro, Max, Team и Enterprise. Попробовать: claude.ai/design #Anthropic #ClaudeDesign #ClaudeOpus #дизайн #прототипы #слайды #сайты #AI #нейросети #технологии 👉 @bigdata_1

BigData
3 239
🚀 Подборка полезных IT каналов в Max Системное администрирование, DevOps 📌 https://max.ru/i_odmin Все для системного администратора https://max.ru/bash_srv Bash Советы https://max.ru/sysadminof Книги для админов, полезные материалы https://max.ru/i_odmin_book Библиотека Системного Администратора https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др. 1C разработка 📌 https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С Программирование C++📌 https://max.ru/cpp_lib Библиотека C/C++ разработчика Программирование Go📌 https://max.ru/golang_lib Библиотека Go (Golang) разработчика Программирование React📌 https://max.ru/react_lib React Программирование Python 📌 https://max.ru/python_of Python академия. https://max.ru/BookPython Библиотека Python разработчика Java разработка 📌 https://max.ru/bookjava Библиотека Java разработчика GitHub Сообщество 📌 https://max.ru/githublib Интересное из GitHub Базы данных (Data Base) 📌 https://max.ru/database_info Все про базы данных Фронтенд разработка 📌 https://max.ru/frontend_1 Подборки для frontend разработчиков Библиотеки 📌 https://max.ru/programmist_of Книги по программированию https://max.ru/proglb Библиотека программиста https://max.ru/bfbook Книги для программистов Программирование 📌 https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT https://max.ru/php_lib Библиотека PHP программиста 👨🏼‍💻👩‍💻 Шутки программистов 📌 https://max.ru/itumor Шутки программистов Защита, взлом, безопасность 📌 https://max.ru/thehaking Канал о кибербезопасности https://max.ru/xakkep_1 Хакер Free Книги, статьи для дизайнеров 📌 https://max.ru/odesigners Статьи, книги для дизайнеров Математика 📌 https://max.ru/Pomatematike Канал по математике https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике Вакансии 📌 https://max.ru/progjob Вакансии в IT Мир технологий 📌 https://max.ru/mir_teh Канал для любознательных Бонус 📌 https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга https://max.ru/mockva_life Свежие новости Москвы

BigData
3 239
generative.ai.learning.roadmap.pdf6.46 KB

BigData
3 239
🙇‍♂️ Generative AI Learning Roadmap 👉 @bigdata_1
🙇‍♂️ Generative AI Learning Roadmap 👉 @bigdata_1

BigData
3 239
Станьте Deep Learning Engineer с дипломом 👍 Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская
Станьте Deep Learning Engineer с дипломом 👍 Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская диагностика — нейросети используются уже во всех сферах бизнеса. Компании ищут DL-специалистов, чтобы точнее обучать и настраивать нейросети под свои запросы. Освоить Deep Learning самостоятельно сложно, но ребята из Simulative нашли решение, где учёба становится понятной и структурированной, а все темы разбираются на практике 🔥 Simulative запускает программу профессиональной переподготовки «Инженер глубокого обучения нейросетей». По итогам обучения вы получите:
🎓 Диплом гособразца
Официальный диплом о профессиональной переподготовке с квалификацией «Специалист по большим данным».
💯 Практика
Более 40 практических работ в формате симуляции реальной работы DL-инженера — всё пойдёт в портфолио.
🙌🏽 Онлайн обучение
Учитесь из любой точки мира, совмещая с работой, а доступ к материалам останется навсегда. Курс подходит для специалистов любого уровня: новичок, аналитик, ML-инженер или выпускник — на программе опытные менторы помогут выстроить вашу персональную траекторию роста в Deep Learning. Что вы освоите: 🟠Создание и обучение нейросетей с нуля 🟠Компьютерное зрение (Computer Vision) 🟠NLP (обработка текста) 🟠Генеративные модели 🟠MLOps и продакшн-подход 🕖 Скорее записывайтесь, количество мест на поток ограничено! Бронируйте место на курсе прямо сейчас и получите скидку 30% 😶ПОЛУЧИТЬ СКИДКУ НА КУРС

BigData
3 239
🚀 Подборка полезных IT каналов в Max Системное администрирование, DevOps 📌 https://max.ru/i_odmin Все для системного администратора https://max.ru/bash_srv Bash Советы https://max.ru/sysadminof Книги для админов, полезные материалы https://max.ru/i_odmin_book Библиотека Системного Администратора https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др. 1C разработка 📌 https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С Программирование C++📌 https://max.ru/cpp_lib Библиотека C/C++ разработчика Программирование Python 📌 https://max.ru/python_of Python академия. https://max.ru/BookPython Библиотека Python разработчика Java разработка 📌 https://max.ru/bookjava Библиотека Java разработчика GitHub Сообщество 📌 https://max.ru/githublib Интересное из GitHub Базы данных (Data Base) 📌 https://max.ru/database_info Все про базы данных Фронтенд разработка 📌 https://max.ru/frontend_1 Подборки для frontend разработчиков Библиотеки 📌 https://max.ru/programmist_of Книги по программированию https://max.ru/proglb Библиотека программиста https://max.ru/bfbook Книги для программистов Программирование 📌 https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT https://max.ru/php_lib Библиотека PHP программиста 👨🏼‍💻👩‍💻 Шутки программистов 📌 https://max.ru/itumor Шутки программистов Защита, взлом, безопасность 📌 https://max.ru/thehaking Канал о кибербезопасности https://max.ru/xakkep_1 Хакер Free Книги, статьи для дизайнеров 📌 https://max.ru/odesigners Статьи, книги для дизайнеров Математика 📌 https://max.ru/Pomatematike Канал по математике https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике Вакансии 📌 https://max.ru/progjob Вакансии в IT Мир технологий 📌 https://max.ru/mir_teh Канал для любознательных Бонус 📌 https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга https://max.ru/mockva_life Свежие новости Москвы

BigData
3 239
🌟 Tencent HY-WU: динамические LoRA для редактирования изображений. Tencent HY опубликовала первую часть серии работ под назв
+2
🌟 Tencent HY-WU: динамические LoRA для редактирования изображений. Tencent HY опубликовала первую часть серии работ под названием HY-WU (Weight Unleashing). Суть метода в отказе от стандартной парадигмы адаптации, при которой модель получает один фиксированный набор весов для всех задач. Специальная модель-генератор синтезирует LoRA отдельно под каждый входной пример прямо во время инференса, без дополнительной оптимизации на тест-тайме. Проблема, которую решает HY-WU, хорошо знакома всем, кто работал с дообучением: когда задачи противоречат друг другу (например, "размыть" против "убрать размытие" или "состарить лицо" против "восстановить"), общий адаптер вынужден идти на компромисс. Градиенты конфликтуют, и результат оказывается хуже, чем если бы задачи обучались раздельно. Чтобы не быть голословными, авторы измерили это напрямую: косинусное сходство градиентов между разнородными задачами устойчиво отрицательно, среднее около −0.30, то есть задачи буквально тянут веса в противоположные стороны. HY-WU предлагает условную генерацию параметров. Модель-генератор (8B параметров) принимает на вход совместное представление изображения и текстового запроса через энкодер SigLIP2, после чего генерирует LoRA-матрицы (~0.72B) и инжектирует их в базовую модель. Обучение сквозное, только через downstream-loss, без предварительно собранных чекпойнтов адаптеров. 🟡Тесты и результаты Для тестов выбрали задачу редактирования изображения текстовым запросом - в нем конфликты неизбежны и визуально очевидны. 🟡В попарном human evaluation (GSB) HY-WU выигрывает у всех топовых open-source редакторов с большим отрывом: 67–78% против Step1X, Qwen, LongCat и FLUX; 🟡Среди закрытых систем модель обошла Seedream 4.5 (55.6%) и GPT Image 1.5 (55.5%). 🟡Единственные, кто пока впереди - Nano Banana 2 и Nano Banana Pro. Tencent проверили: прирост качества дается именно условной маршрутизацией, а не просто увеличением числа параметров. Когда генератор использовали с перемешанными или усредненными условиями, результат проваливался до уровня базовой модели. Полный SFT с намного большим числом обучаемых параметров давал сопоставимый результат с обычным Shared LoRA, так как в обоих случаях в инференсе применяется одна фиксированная точка в пространстве весов. Выпущенная работа - первая часть серии исследований по функциональной памяти для генеративных моделей. В планах: 🟢сравнить функциональную память с retrieval-подходами и понять, когда каждый из них уместен; 🟢разработать протоколы онлайн-обучения, при которых модель усваивает новые задачи без деградации на старых; 🟢исследовать масштабирование модели-генератора отдельно от базовой модели. Помимо этого, в планах выйти за пределы LoRA на другие операторные интерфейсы, распространить метод на видео и агентные системы, а также проработать возможность точечно удалять поведение модели через управление состоянием генератора. Кроме этого архиполезного исследования Tencent выложили связку из модели-генератора и базовой модели HY-Image-3.0-Instruct, поверх которой она и работает. Поиграться этой красотой можно, если под рукой простаивает 8х40 GB или 4х80 GB VRAM. 🟡Страница проекта https://tencent-hy-wu.github.io/ 🟡Prompt Handbook (китайский) https://docs.qq.com/doc/DUVVadmhCdG9qRXBU 🟡Модель https://huggingface.co/tencent/HY-WU 🟡Техотчет https://github.com/Tencent-Hunyuan/HY-WU/blob/main/assets/report.pdf 🖥 Github https://github.com/Tencent-Hunyuan/HY-WU 👉 @bigdata_1

BigData
3 239
📌Лучшие нейросети от китайских стартапов - бесплатно и без VPN 1️⃣ GLM от Z.ai Настоящая находка для разработчиков. Их актуа
📌Лучшие нейросети от китайских стартапов - бесплатно и без VPN 1️⃣ GLM от Z.ai Настоящая находка для разработчиков. Их актуальная версия GLM-5 - это мощнейшая open-source модель, сопоставимая по уровню с GPT-5.2 и Claude Sonnet 4.6. Чат-бот оснащен встроенным интерпретатором кода, поддерживает агентный режим и предлагает базу готовых шаблонов для быстрой верстки сайтов и создания несложных приложений. 2️⃣ Kimi от Moonshot AI Модель Kimi K2.5 - один из главных фаворитов для выполнения комплексных агентных поручений: от глубокого ресерча и анализа запутанных данных до разбора объемных баз кода. Внутри есть удобные инструменты для верстки презентаций, управления таблицами, программирования, а также фирменная среда OpenClaw для запуска собственных ИИ-агентов. 3️⃣ MiniMax AI Agent Создатели позиционируют его как универсального ИИ-помощника «для любых задач», который умеет взаимодействовать даже с локальными файлами на вашем компьютере. Кроме текстового агента, стартап успешно развивает нейросеть для генерации видео Hailuo, а также крутые модели для синтеза голоса и создания музыки. 4️⃣ Qwen от Alibaba Экосистема с самыми лояльными лимитами и огромным выбором инструментов. В арсенале: компактные открытые модели для локального использования, визуальные нейросети, ИИ-кодеры, генераторы речи и передовые для китайского рынка редакторы изображений. 👉 @bigdata_1

BigData
3 239
🚀 Подборка полезных IT каналов в Max Системное администрирование, DevOps 📌 https://max.ru/i_odmin Все для системного администратора https://max.ru/bash_srv Bash Советы https://max.ru/sysadminof Книги для админов, полезные материалы https://max.ru/i_odmin_book Библиотека Системного Администратора https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др. 1C разработка 📌 https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С Программирование C++📌 https://max.ru/cpp_lib Библиотека C/C++ разработчика Программирование Python 📌 https://max.ru/python_of Python академия. https://max.ru/BookPython Библиотека Python разработчика Java разработка 📌 https://max.ru/bookjava Библиотека Java разработчика GitHub Сообщество 📌 https://max.ru/githublib Интересное из GitHub Базы данных (Data Base) 📌 https://max.ru/database_info Все про базы данных Фронтенд разработка 📌 https://max.ru/frontend_1 Подборки для frontend разработчиков Библиотеки 📌 https://max.ru/programmist_of Книги по программированию https://max.ru/proglb Библиотека программиста https://max.ru/bfbook Книги для программистов Программирование 📌 https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT https://max.ru/php_lib Библиотека PHP программиста 👨🏼‍💻👩‍💻 Шутки программистов 📌 https://max.ru/itumor Шутки программистов Защита, взлом, безопасность 📌 https://max.ru/thehaking Канал о кибербезопасности https://max.ru/xakkep_1 Хакер Free Книги, статьи для дизайнеров 📌 https://max.ru/odesigners Статьи, книги для дизайнеров Математика 📌 https://max.ru/Pomatematike Канал по математике https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике Вакансии 📌 https://max.ru/progjob Вакансии в IT Мир технологий 📌 https://max.ru/mir_teh Канал для любознательных Бонус 📌 https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга https://max.ru/mockva_life Свежие новости Москвы

BigData
3 239
🐜 Antfarm - “собери команду агентов” в OpenClaw одной командой Идея простая: вместо одного универсального агента - команда р
🐜 Antfarm - “собери команду агентов” в OpenClaw одной командой Идея простая: вместо одного универсального агента - команда ролей (planner / developer / verifier / tester / reviewer), которые работают по строгому workflow: каждый шаг в отдельной сессии, есть проверки, ретраи, ревью - чтобы результат был воспроизводимым, а не “повезло с промптом”. ⚙️ Что внутри 🟡Готовые workflows “из коробки”: • feature-dev (7 агентов): кидаешь фичу → получаешь протестированный PR (планирование → реализация → верификация → тесты → PR → ревью) • security-audit (7 агентов): скан репо → приоритизация → фиксы → повторный аудит → PR + regression tests 🟡Упор на принцип: агент не “проверяет сам себя” - проверка вынесена в отдельную роль. 🚀 Установка

curl -fsSL https://raw.githubusercontent.com/snarktank/antfarm/v0.5.1/scripts/install.sh | bash
Или прямо в OpenClaw: “install github.com/snarktank/antfarm ⚠️ Важные нюансыНе npm-пакет: ставится с GitHub, а в npm есть другой “antfarm”, не этот. • Нужен Node.js ≥ 22 (если ловите node:sqlite - проверьте, что это настоящий Node, а не Bun wrapper). 🧠 Кому зайдёт • тем, кто пилит продукт и устал от “агент сделал, но я не доверяю” • тем, кому нужны повторяемые результаты: шаги → проверки → тесты → PR • тем, кто хочет описывать процессы в стиле “CI для агентов”, а не ручной менеджмент Если интересно, можно начать с простого: прогнать feature-dev на небольшой задачке и посмотреть, насколько хорошо держит дисциплину пайплайна. https://github.com/snarktank/antfarm #ai #agents #opensource #devtools #workflow #openclaw 👉 @bigdata_1

BigData
3 239
🌟 HY3D-Bench: 22 терабайта отборной 3D-геометрии. Tencent Hunyuan вывалили в опенсорс монструозный пак HY3D-Bench на 22.5 ТБ
🌟 HY3D-Bench: 22 терабайта отборной 3D-геометрии. Tencent Hunyuan вывалили в опенсорс монструозный пак HY3D-Bench на 22.5 ТБ и это подарок для всех, кто занимается 3D Gen и робототехникой. Датасет разбит на 3 логических куска, каждый под свои задачи: 🟡Full-level Dataset (252K+ мешей, ~11 ТБ) База с полностью замкнутой геометрией, без дырок и non-manifold артефактов, которыми обычно кишат сканы. Все нормализовано и готово к скармливанию в DiT или GAN. В комплекте идут сэмплы точек и мульти-вью рендеры. 🟡Part-level Dataset (240K+ объектов, ~5 ТБ) Мёд для робототехников и тех, кто занимается geometric perception. Тут объекты с семантической сегментацией на части. Если учите сервоприводного друга манипуляциям или хотите генерить объекты кусками - вам сюда. 🟡Synthetic Dataset (125K+ объектов, ~6.5 ТБ) Очевидная синтетика, чтобы закрыть редкие категории, которых нет в обычных датасетах. Охват - 1252 категории. 🟡GitHub: https://github.com/Tencent-Hunyuan/HY3D-Bench 🟡Hugging Face: https://huggingface.co/datasets/tencent/HY3D-Bench 🟡Dataset: https://arxiv.org/pdf/2602.03907 👉 @bigdata_1

BigData
3 239
Команды Яндекса ищут продуктовых и data-аналитиков, а также data scientists с опытом на Python от 3 лет. Участвуйте в Weekend Offer, чтобы всего за 2 дня пройти все собеседования и получить офер. Как участвовать? ⚪ Зарегистрироваться на сайте до 25 февраля. ⚪ Пройти две технические секции 28 февраля. ⚪ Познакомиться с командами и получить офер 1 марта. Мы опираемся на научные исследования и аналитические данные, а потом превращаем их в реальные продукты для миллионов пользователей. Присоединяйтесь, чтобы строить полезные сервисы вокруг ИИ-технологий, находить новые решения и делать то, что другим не по силам. Подробности и регистрация — по ссылке: https://yandex.ru/project/events/wo-analytics-0226 Реклама. ООО "Яндекс". ИНН 7736207543

BigData
3 239
HunyuanImage 3.0-Instruct теперь полностью в open-source 🔥 Модель стремительно поднялась в Tier-1 глобального рейтинга Arena
HunyuanImage 3.0-Instruct теперь полностью в open-source 🔥 Модель стремительно поднялась в Tier-1 глобального рейтинга Arena Image Edit и уже воспринимается как одна из самых мощных open-source Image-to-Image моделей. По сути - новый ориентир (SOTA) для всего сообщества. Что это даёт на практике: - Редактирование изображений по текстовым инструкциям на топовом уровне - Максимально точное следование промптам в духе «измени, но сохрани структуру» - Уверенный баланс качества, детализации и управляемости результата - Отличная основа для собственных инструментов, сервисов и исследований Также доступна Distil-версия: она легче и быстрее, лучше подходит для продакшена и сценариев с ограниченными ресурсами. 🟡GitHub: https://github.com/Tencent-Hunyuan/HunyuanImage-3.0 🟡Hugging Face: https://huggingface.co/tencent/HunyuanImage-3.0-Instruct 🟡Hugging Face Distil: https://huggingface.co/tencent/HunyuanImage-3.0-Instruct-Distil 👉 @bigdata_1

BigData
3 239
Традиционный ИИ vs Агентный ИИ vs Агентный RAG В разговорах о развитии технологий часто смешивают понятия Традиционного ИИ, Агентного ИИ и Агентного RAG, хотя на самом деле это совершенно разные ступени эволюции. Давайте разберем их отличия простым языком. Традиционный ИИ представляет собой статичный пайплайн - классическую схему машинного обучения, с которой многие начинали. Это линейный и односторонний процесс: мы определяем задачу, собираем данные, обучаем модель, развертываем её, а затем получаем прогнозы и оцениваем их. Главная особенность в том, что после запуска модель перестает «думать», адаптироваться или перестраивать планы. Если данные или условия меняются, требуется офлайн-переобучение. Такой подход хорош для стабильных, четко определенных задач, но его главное ограничение — отсутствие обучения в реальном времени. С появлением Агентного ИИ правила игры меняются. Это целеориентированные системы, которые умеют ставить задачи, выбирать подходящие модели и инструменты, планировать многоэтапные действия и исполнять решения. Это уже не просто схема «промпт - ответ», а цикл «план - действие - наблюдение - корректировка». Агенты ведут себя скорее как операторы, а не предсказатели. Ключевой сдвиг здесь заключается в появлении автономности и способностей к рассуждению, что идеально подходит для сложных рабочих процессов и автоматизации принятия решений. Агентный RAG добавляет недостающий слой: память и эволюцию знаний. Эта система объединяет агентное планирование с семантическим поиском и внешними базами знаний. Теперь ИИ не только ищет информацию, но и помнит прошлые взаимодействия, записывает проверенные результаты обратно в базу и улучшает свои будущие ответы. Происходит адаптация на основе контекста, а не только промптов. Именно на этом этапе ИИ начинает вести себя как полноценная контекстно-зависимая система, а не просто чат-бот. Таким образом, настоящий технологический сдвиг заключается не в создании более крупных моделей или написании лучших промптов. Суть революции - в переходе от линейных пайплайнов к замкнутым циклам, от генерации ответов к принятию решений, и от простого поиска информации к рассуждению, подкрепленному долгосрочной памятью. 👉 @bigdata_1