fa
Feedback
BigData

BigData

رفتن به کانال در Telegram

Data Science : Big Data : Machine Learning : Deep Learning : LLM : Нейроннные сети По всем вопросам @evgenycarter

نمایش بیشتر
3 254
مشترکین
-124 ساعت
-27 روز
+130 روز

در حال بارگیری داده...

کانال‌های مشابه
هیچ داده‌ای
مشکلی وجود دارد؟ لطفاً صفحه را تازه کنید یا با مدیر پشتیبانی ما تماس بگیرید.
اشارات ورودی و خروجی
---
---
---
---
---
---
جذب مشترکین
ژوئن '26
ژوئن '260
در 0 کانال‌ها
مه '26
+21
در 0 کانال‌ها
Get PRO
آوریل '26
+9
در 0 کانال‌ها
Get PRO
مارس '26
+11
در 0 کانال‌ها
Get PRO
فوریه '26
+16
در 0 کانال‌ها
Get PRO
ژانویه '26
+31
در 0 کانال‌ها
Get PRO
دسامبر '25
+19
در 0 کانال‌ها
Get PRO
نوامبر '25
+65
در 31 کانال‌ها
Get PRO
اکتبر '25
+27
در 0 کانال‌ها
Get PRO
سپتامبر '25
+59
در 36 کانال‌ها
Get PRO
اوت '25
+30
در 0 کانال‌ها
Get PRO
ژوئیه '25
+50
در 27 کانال‌ها
Get PRO
ژوئن '25
+59
در 20 کانال‌ها
Get PRO
مه '25
+80
در 44 کانال‌ها
Get PRO
آوریل '25
+105
در 41 کانال‌ها
Get PRO
مارس '25
+100
در 38 کانال‌ها
Get PRO
فوریه '25
+108
در 32 کانال‌ها
Get PRO
ژانویه '25
+94
در 34 کانال‌ها
Get PRO
دسامبر '24
+95
در 35 کانال‌ها
Get PRO
نوامبر '24
+85
در 33 کانال‌ها
Get PRO
اکتبر '24
+89
در 30 کانال‌ها
Get PRO
سپتامبر '24
+135
در 29 کانال‌ها
Get PRO
اوت '24
+71
در 18 کانال‌ها
Get PRO
ژوئیه '24
+41
در 0 کانال‌ها
Get PRO
ژوئن '24
+87
در 25 کانال‌ها
Get PRO
مه '24
+72
در 19 کانال‌ها
Get PRO
آوریل '24
+57
در 0 کانال‌ها
Get PRO
مارس '24
+88
در 21 کانال‌ها
Get PRO
فوریه '24
+73
در 18 کانال‌ها
Get PRO
ژانویه '24
+129
در 24 کانال‌ها
Get PRO
دسامبر '23
+89
در 24 کانال‌ها
Get PRO
نوامبر '23
+94
در 17 کانال‌ها
Get PRO
اکتبر '23
+104
در 18 کانال‌ها
Get PRO
سپتامبر '23
+115
در 0 کانال‌ها
Get PRO
اوت '23
+65
در 0 کانال‌ها
Get PRO
ژوئیه '23
+81
در 0 کانال‌ها
Get PRO
ژوئن '23
+73
در 0 کانال‌ها
Get PRO
مه '23
+96
در 0 کانال‌ها
Get PRO
آوریل '23
+81
در 0 کانال‌ها
Get PRO
مارس '23
+34
در 0 کانال‌ها
Get PRO
فوریه '23
+67
در 0 کانال‌ها
Get PRO
ژانویه '23
+96
در 0 کانال‌ها
Get PRO
دسامبر '22
+104
در 0 کانال‌ها
Get PRO
نوامبر '22
+81
در 0 کانال‌ها
Get PRO
اکتبر '22
+128
در 0 کانال‌ها
Get PRO
سپتامبر '22
+194
در 0 کانال‌ها
Get PRO
اوت '22
+173
در 0 کانال‌ها
Get PRO
ژوئیه '22
+292
در 0 کانال‌ها
Get PRO
ژوئن '22
+241
در 0 کانال‌ها
Get PRO
مه '22
+463
در 0 کانال‌ها
Get PRO
آوریل '22
+2 330
در 0 کانال‌ها
تاریخ
رشد مشترکین
اشارات
کانال‌ها
06 ژوئن0
05 ژوئن0
04 ژوئن0
03 ژوئن0
02 ژوئن0
01 ژوئن0
پست‌های کانال
RAG против Агентов (RAGs vs Agents) Спросите LLM (большую языковую модель) о данных вашей компании, и она начнет гадать. Два
RAG против Агентов (RAGs vs Agents) Спросите LLM (большую языковую модель) о данных вашей компании, и она начнет гадать. Два паттерна, которые исправляют это - RAG и агенты, и они решают разные задачи. RAG (Поисково-ориентированная генерация) RAG объединяет LLM с поиском информации, чтобы обосновать ответы фактами. Этот процесс состоит из 4 шагов: • Шаг 1: Запрос пользователя (User Query) векторизуется и отправляется на этап поиска (Retrieval). • Шаг 2: Компонент поиска извлекает наиболее релевантные фрагменты из базы знаний (Knowledge Base: PDF-файлы, вики-страницы и т.д.). • Шаг 3: Эти фрагменты вставляются в промпт в качестве контекста. • Шаг 4: LLM пишет ответ, опираясь на извлеченный текст (Answer grounded). Особенности: Один поиск. Одна генерация. Дешево, предсказуемо и легко поддается отладке. Агенты (Agents) Агенты оборачивают LLM в цикл рассуждений с набором инструментов (Tools) для выполнения конкретных действий. • Шаг 1: Запрос пользователя поступает в среду выполнения агента (Agent runtime) — цикл рассуждений вокруг LLM. • Шаг 2: LLM анализирует цель и выбирает нужный инструмент (Чтение, Запись, Редактирование, Bash и т.д.). • Шаг 3: Среда выполнения (runtime) запускает инструмент и передает результат обратно в LLM. • Шаг 4: LLM снова проводит рассуждения, выбирает следующий инструмент и повторяет этот цикл, пока задача не будет выполнена. Особенности: Более гибко. Расходует больше токенов. Сложнее отлаживать, так как ошибки накапливаются от шага к шагу. Главное эмпирическое правило (из центральной части картинки): • Используйте RAG, когда ответ находится внутри ваших документов. • Используйте Агента, когда решение задачи требует действий в других системах. 👉 @bigdata_1

2
Преодоление узкого места LLM: подход GenPRM к вычислениям во время тестирования Scale с помощью генеративного рассуждения. Не
Преодоление узкого места LLM: подход GenPRM к вычислениям во время тестирования Scale с помощью генеративного рассуждения. Недавно модели вознаграждения процессов (PRM) в качестве верификаторов стали перспективным подходом для повышения производительности LLM. Для решения проблем с PRM в этой статье представлена GenPRM — модель вознаграждения за генеративный процесс, которая выполняет явное рассуждение по цепочке мысли (CoT) с верификацией кода перед вынесением суждений по каждому этапу рассуждения. 👉 Проблемы с текущими PRM: - Ограниченные возможности контроля и обобщения процессов - Зависимость от скалярного прогнозирования значений без использования генеративных возможностей LLM - Невозможность масштабировать вычисления во время тестирования 👉 Фреймворк GenPRM решает вышеупомянутые проблемы с помощью шестичастной структуры, включающей: 1️⃣ Модель политики генерирует шаги решения, при этом оценки MC оцениваются по траекториям внедрения. 2️⃣ Предлагаемая оценка относительного прогресса (RPE) получает точные метки PRM. 3️⃣ Высококачественные данные надзора процессов, синтезированные с помощью CoT-рассуждения и верификации кода 4️⃣ Консенсусная фильтрация и обучение SFT GenPRM 5️⃣ Обученный GenPRM, функционирующий в качестве верификатора или критика для расширенного масштабирования времени тестирования 6️⃣ Повышение производительности за счёт масштабирования во время тестирования 👉 Масштабирование времени тестирования с помощью GenPRM 1️⃣ Policy Model TTS: GenPRM как проверяющий - несколько ответов могут быть выбраны из моделей политики, а затем использовать GenPRM в качестве верификатора для выбора конечного ответа в виде параллельных TTS. 2️⃣ Модель политики TTS: GenPRM как критик - GenPRM можно естественно использовать как критическую модель для уточнения результатов моделей политик, и мы можем масштабировать процесс уточнения с несколькими ходами последовательно по TTS. 3️⃣ GenPRM TTS - сначала взят пример N путей верификации рассуждения, а затем используй голосование большинством для получения окончательного прогноза, усредняя вознаграждения. 👉 Синтез данных GenPRM Состоит из трёх этапов: 1️⃣ генерация путей рассуждения и получение меток PRM с помощью оценки Монте-Карло (MC) 2️⃣ оценка прогресса каждого шага с помощью оценки относительного прогресса 3️⃣ синтез обоснований с CoT и верификацией кода, а также вывод меток LLM-as-a-judge с помощью консенсусной фильтрации 📈 Результаты оценки - GenPRM значительно превосходит предыдущие PRM, имея всего 23K обучающих данных из набора данных MATH. - при масштабировании времени тестирования 1,5B GenPRM превосходит GPT-4o, а 7B GenPRM превосходит Qwen2.5-Math-PRM-72B на ProcessBench Blog: https://medium.com/@techsachin/breaking-the-llm-bottleneck-genprms-approach-to-scale-test-time-compute-via-generative-reasoning-0e90e3ffa71e Paper: https://arxiv.org/abs/2504.00891 Code: https://github.com/RyanLiu112/GenPRM Models: https://huggingface.co/collections/GenPRM/genprm-67ee4936234ba5dd16bb9943 👉 @bigdata_1
520
3
🚀 Подборка полезных IT каналов в Max Системное администрирование, DevOps 📌 https://max.ru/i_odmin Все для системного администратора https://max.ru/bash_srv Bash Советы https://max.ru/sysadminof Книги для админов, полезные материалы https://max.ru/i_odmin_book Библиотека Системного Администратора https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др. 1C разработка 📌 https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С Программирование C++📌 https://max.ru/cpp_lib Библиотека C/C++ разработчика Программирование Go📌 https://max.ru/golang_lib Библиотека Go (Golang) разработчика Программирование React📌 https://max.ru/react_lib React Программирование Python 📌 https://max.ru/python_of Python академия. https://max.ru/BookPython Библиотека Python разработчика Java разработка 📌 https://max.ru/bookjava Библиотека Java разработчика GitHub Сообщество 📌 https://max.ru/githublib Интересное из GitHub Базы данных (Data Base) 📌 https://max.ru/database_info Все про базы данных Фронтенд разработка 📌 https://max.ru/frontend_1 Подборки для frontend разработчиков Библиотеки 📌 https://max.ru/programmist_of Книги по программированию https://max.ru/proglb Библиотека программиста https://max.ru/bfbook Книги для программистов Программирование 📌 https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT https://max.ru/php_lib Библиотека PHP программиста 👨🏼‍💻👩‍💻 Шутки программистов 📌 https://max.ru/itumor Шутки программистов Защита, взлом, безопасность 📌 https://max.ru/thehaking Канал о кибербезопасности https://max.ru/xakkep_1 Хакер Free Книги, статьи для дизайнеров 📌 https://max.ru/odesigners Статьи, книги для дизайнеров Математика 📌 https://max.ru/Pomatematike Канал по математике https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике Вакансии 📌 https://max.ru/progjob Вакансии в IT Мир технологий 📌 https://max.ru/mir_teh Канал для любознательных Бонус 📌 https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга https://max.ru/mockva_life Свежие новости Москвы
0
4
Anthropic представила Claude Design - отдельный продукт для создания готовых макетов, прототипов, слайдов и сайтов. В основе
Anthropic представила Claude Design - отдельный продукт для создания готовых макетов, прототипов, слайдов и сайтов. В основе сервиса лежит Claude Opus 4.7 - флагманская модель компании с продвинутым пониманием визуала. Главная особенность новинки — не просто генерация интерфейсов, а работа с уже существующими материалами продукта. Claude может анализировать кодовую базу и дизайн-файлы, извлекать из них дизайн-систему и затем автоматически придерживаться фирменного стиля. То есть сервису не нужно вручную объяснять, какие в проекте используются шрифты, цвета и отступы - он сам подстраивается под бренд. Пока Claude Design доступен в формате research preview для тарифов Pro, Max, Team и Enterprise. Попробовать: claude.ai/design #Anthropic #ClaudeDesign #ClaudeOpus #дизайн #прототипы #слайды #сайты #AI #нейросети #технологии 👉 @bigdata_1
0
5
🚀 Подборка полезных IT каналов в Max Системное администрирование, DevOps 📌 https://max.ru/i_odmin Все для системного администратора https://max.ru/bash_srv Bash Советы https://max.ru/sysadminof Книги для админов, полезные материалы https://max.ru/i_odmin_book Библиотека Системного Администратора https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др. 1C разработка 📌 https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С Программирование C++📌 https://max.ru/cpp_lib Библиотека C/C++ разработчика Программирование Go📌 https://max.ru/golang_lib Библиотека Go (Golang) разработчика Программирование React📌 https://max.ru/react_lib React Программирование Python 📌 https://max.ru/python_of Python академия. https://max.ru/BookPython Библиотека Python разработчика Java разработка 📌 https://max.ru/bookjava Библиотека Java разработчика GitHub Сообщество 📌 https://max.ru/githublib Интересное из GitHub Базы данных (Data Base) 📌 https://max.ru/database_info Все про базы данных Фронтенд разработка 📌 https://max.ru/frontend_1 Подборки для frontend разработчиков Библиотеки 📌 https://max.ru/programmist_of Книги по программированию https://max.ru/proglb Библиотека программиста https://max.ru/bfbook Книги для программистов Программирование 📌 https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT https://max.ru/php_lib Библиотека PHP программиста 👨🏼‍💻👩‍💻 Шутки программистов 📌 https://max.ru/itumor Шутки программистов Защита, взлом, безопасность 📌 https://max.ru/thehaking Канал о кибербезопасности https://max.ru/xakkep_1 Хакер Free Книги, статьи для дизайнеров 📌 https://max.ru/odesigners Статьи, книги для дизайнеров Математика 📌 https://max.ru/Pomatematike Канал по математике https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике Вакансии 📌 https://max.ru/progjob Вакансии в IT Мир технологий 📌 https://max.ru/mir_teh Канал для любознательных Бонус 📌 https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга https://max.ru/mockva_life Свежие новости Москвы
0
6
generative.ai.learning.roadmap.pdf
0
7
🙇‍♂️ Generative AI Learning Roadmap 👉 @bigdata_1
🙇‍♂️ Generative AI Learning Roadmap 👉 @bigdata_1
0
8
Станьте Deep Learning Engineer с дипломом 👍 Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская
Станьте Deep Learning Engineer с дипломом 👍 Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская диагностика — нейросети используются уже во всех сферах бизнеса. Компании ищут DL-специалистов, чтобы точнее обучать и настраивать нейросети под свои запросы. Освоить Deep Learning самостоятельно сложно, но ребята из Simulative нашли решение, где учёба становится понятной и структурированной, а все темы разбираются на практике 🔥 Simulative запускает программу профессиональной переподготовки «Инженер глубокого обучения нейросетей». По итогам обучения вы получите: 🎓 Диплом гособразца Официальный диплом о профессиональной переподготовке с квалификацией «Специалист по большим данным». 💯 Практика Более 40 практических работ в формате симуляции реальной работы DL-инженера — всё пойдёт в портфолио. 🙌🏽 Онлайн обучение Учитесь из любой точки мира, совмещая с работой, а доступ к материалам останется навсегда. Курс подходит для специалистов любого уровня: новичок, аналитик, ML-инженер или выпускник — на программе опытные менторы помогут выстроить вашу персональную траекторию роста в Deep Learning. Что вы освоите: 🟠Создание и обучение нейросетей с нуля 🟠Компьютерное зрение (Computer Vision) 🟠NLP (обработка текста) 🟠Генеративные модели 🟠MLOps и продакшн-подход 🕖 Скорее записывайтесь, количество мест на поток ограничено! Бронируйте место на курсе прямо сейчас и получите скидку 30% 😶ПОЛУЧИТЬ СКИДКУ НА КУРС
0
9
🚀 Подборка полезных IT каналов в Max Системное администрирование, DevOps 📌 https://max.ru/i_odmin Все для системного администратора https://max.ru/bash_srv Bash Советы https://max.ru/sysadminof Книги для админов, полезные материалы https://max.ru/i_odmin_book Библиотека Системного Администратора https://max.ru/i_devops DevOps: Пишем о Docker, Kubernetes и др. 1C разработка 📌 https://max.ru/odin1c_rus Cтатьи, курсы, советы, шаблоны кода 1С Программирование C++📌 https://max.ru/cpp_lib Библиотека C/C++ разработчика Программирование Python 📌 https://max.ru/python_of Python академия. https://max.ru/BookPython Библиотека Python разработчика Java разработка 📌 https://max.ru/bookjava Библиотека Java разработчика GitHub Сообщество 📌 https://max.ru/githublib Интересное из GitHub Базы данных (Data Base) 📌 https://max.ru/database_info Все про базы данных Фронтенд разработка 📌 https://max.ru/frontend_1 Подборки для frontend разработчиков Библиотеки 📌 https://max.ru/programmist_of Книги по программированию https://max.ru/proglb Библиотека программиста https://max.ru/bfbook Книги для программистов Программирование 📌 https://max.ru/bookflow Лекции, видеоуроки, доклады с IT конференций https://max.ru/itmozg Программисты, дизайнеры, новости из мира IT https://max.ru/php_lib Библиотека PHP программиста 👨🏼‍💻👩‍💻 Шутки программистов 📌 https://max.ru/itumor Шутки программистов Защита, взлом, безопасность 📌 https://max.ru/thehaking Канал о кибербезопасности https://max.ru/xakkep_1 Хакер Free Книги, статьи для дизайнеров 📌 https://max.ru/odesigners Статьи, книги для дизайнеров Математика 📌 https://max.ru/Pomatematike Канал по математике https://max.ru/phismat_1 Обучающие видео, книги по Физике и Математике Вакансии 📌 https://max.ru/progjob Вакансии в IT Мир технологий 📌 https://max.ru/mir_teh Канал для любознательных Бонус 📌 https://max.ru/piterspb_78 Свежие новости Санкт-Петербурга https://max.ru/mockva_life Свежие новости Москвы
0
10
🌟 Tencent HY-WU: динамические LoRA для редактирования изображений. Tencent HY опубликовала первую часть серии работ под назв+2
🌟 Tencent HY-WU: динамические LoRA для редактирования изображений. Tencent HY опубликовала первую часть серии работ под названием HY-WU (Weight Unleashing). Суть метода в отказе от стандартной парадигмы адаптации, при которой модель получает один фиксированный набор весов для всех задач. Специальная модель-генератор синтезирует LoRA отдельно под каждый входной пример прямо во время инференса, без дополнительной оптимизации на тест-тайме. Проблема, которую решает HY-WU, хорошо знакома всем, кто работал с дообучением: когда задачи противоречат друг другу (например, "размыть" против "убрать размытие" или "состарить лицо" против "восстановить"), общий адаптер вынужден идти на компромисс. Градиенты конфликтуют, и результат оказывается хуже, чем если бы задачи обучались раздельно. Чтобы не быть голословными, авторы измерили это напрямую: косинусное сходство градиентов между разнородными задачами устойчиво отрицательно, среднее около −0.30, то есть задачи буквально тянут веса в противоположные стороны. HY-WU предлагает условную генерацию параметров. Модель-генератор (8B параметров) принимает на вход совместное представление изображения и текстового запроса через энкодер SigLIP2, после чего генерирует LoRA-матрицы (~0.72B) и инжектирует их в базовую модель. Обучение сквозное, только через downstream-loss, без предварительно собранных чекпойнтов адаптеров. 🟡Тесты и результаты Для тестов выбрали задачу редактирования изображения текстовым запросом - в нем конфликты неизбежны и визуально очевидны. 🟡В попарном human evaluation (GSB) HY-WU выигрывает у всех топовых open-source редакторов с большим отрывом: 67–78% против Step1X, Qwen, LongCat и FLUX; 🟡Среди закрытых систем модель обошла Seedream 4.5 (55.6%) и GPT Image 1.5 (55.5%). 🟡Единственные, кто пока впереди - Nano Banana 2 и Nano Banana Pro. Tencent проверили: прирост качества дается именно условной маршрутизацией, а не просто увеличением числа параметров. Когда генератор использовали с перемешанными или усредненными условиями, результат проваливался до уровня базовой модели. Полный SFT с намного большим числом обучаемых параметров давал сопоставимый результат с обычным Shared LoRA, так как в обоих случаях в инференсе применяется одна фиксированная точка в пространстве весов. Выпущенная работа - первая часть серии исследований по функциональной памяти для генеративных моделей. В планах: 🟢сравнить функциональную память с retrieval-подходами и понять, когда каждый из них уместен; 🟢разработать протоколы онлайн-обучения, при которых модель усваивает новые задачи без деградации на старых; 🟢исследовать масштабирование модели-генератора отдельно от базовой модели. Помимо этого, в планах выйти за пределы LoRA на другие операторные интерфейсы, распространить метод на видео и агентные системы, а также проработать возможность точечно удалять поведение модели через управление состоянием генератора. Кроме этого архиполезного исследования Tencent выложили связку из модели-генератора и базовой модели HY-Image-3.0-Instruct, поверх которой она и работает. Поиграться этой красотой можно, если под рукой простаивает 8х40 GB или 4х80 GB VRAM. 🟡Страница проекта https://tencent-hy-wu.github.io/ 🟡Prompt Handbook (китайский) https://docs.qq.com/doc/DUVVadmhCdG9qRXBU 🟡Модель https://huggingface.co/tencent/HY-WU 🟡Техотчет https://github.com/Tencent-Hunyuan/HY-WU/blob/main/assets/report.pdf 🖥 Github https://github.com/Tencent-Hunyuan/HY-WU 👉 @bigdata_1
0