Generative Ai

Open in Telegram

Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience, Generative Ai, LLM, LangChain, ChatGPT По рекламе писать @miralinka, Created by @life2film

Russia142 154 Technologies & Applications22 644

3 675

Subscribers

-124 hours

-37 days

+8830 days

761

Post views

~ 26024 hours

~ 31348 hours

20.71%

Engagement rate

No data

Posts per day

Ads index

beta

Data loading in progress...

Similar Channels

Агенты ИИ | AGI_and_RL

1.9K

Минск Сейчас

More channels

Incoming and Outgoing Mentions

---

Attracting Subscribers

June '26

+128

in 0 channels

May '26

+56

in 0 channels

Get PRO

April '26

+33

in 0 channels

Get PRO

March '26

+39

in 0 channels

Get PRO

February '26

+46

in 1 channels

Get PRO

January '26

+40

in 0 channels

Get PRO

December '25

+231

in 0 channels

Get PRO

November '25

+43

in 1 channels

Get PRO

October '25

in 0 channels

Get PRO

September '25

+21

in 0 channels

Get PRO

August '25

+47

in 0 channels

Get PRO

July '25

+123

in 0 channels

Get PRO

June '25

+56

in 0 channels

Get PRO

May '25

+69

in 0 channels

Get PRO

April '25

+83

in 1 channels

Get PRO

March '25

+115

in 0 channels

Get PRO

February '25

+100

in 0 channels

Get PRO

January '25

+132

in 2 channels

Get PRO

December '24

+114

in 1 channels

Get PRO

November '24

+129

in 1 channels

Get PRO

October '24

+124

in 0 channels

Get PRO

September '24

+101

in 0 channels

Get PRO

August '24

+89

in 0 channels

Get PRO

July '24

+115

in 0 channels

Get PRO

June '24

+99

in 3 channels

Get PRO

May '24

+57

in 0 channels

Get PRO

April '24

+57

in 0 channels

Get PRO

March '24

+115

in 0 channels

Get PRO

February '24

+107

in 0 channels

Get PRO

January '24

+108

in 0 channels

Get PRO

December '23

+112

in 0 channels

Get PRO

November '23

+139

in 2 channels

Get PRO

October '23

+53

in 0 channels

Get PRO

September '23

+30

in 0 channels

Get PRO

August '23

+24

in 0 channels

Get PRO

July '23

+20

in 0 channels

Get PRO

June '23

+25

in 0 channels

Get PRO

May '23

+92

in 0 channels

Get PRO

April '23

+55

in 0 channels

Get PRO

March '23

+29

in 0 channels

Get PRO

February '23

+18

in 0 channels

Get PRO

January '23

+29

in 0 channels

Get PRO

December '22

+19

in 0 channels

Get PRO

November '22

+18

in 0 channels

Get PRO

October '22

+23

in 0 channels

Get PRO

September '22

+22

in 0 channels

Get PRO

August '22

+34

in 0 channels

Get PRO

July '22

+41

in 0 channels

Get PRO

June '22

+23

in 0 channels

Get PRO

May '22

+27

in 0 channels

Get PRO

April '22

+32

in 0 channels

Get PRO

March '22

+20

in 0 channels

Get PRO

February '22

+20

in 0 channels

Get PRO

January '22

+26

in 0 channels

Get PRO

December '21

+24

in 0 channels

Get PRO

November '21

+34

in 0 channels

Get PRO

October '21

+44

in 0 channels

Get PRO

September '21

+34

in 0 channels

Get PRO

August '21

+31

in 0 channels

Get PRO

July '21

+32

in 0 channels

Get PRO

June '21

+28

in 0 channels

Get PRO

May '21

+22

in 0 channels

Get PRO

April '21

+31

in 0 channels

Get PRO

March '21

+58

in 0 channels

Get PRO

February '21

+48

in 0 channels

Get PRO

January '21

+51

in 0 channels

Get PRO

December '20

+2 339

in 0 channels

Date	Subscriber Growth	Mentions	Channels
28 June	+2
27 June	+1
26 June	+1
25 June	+2
24 June	+3
23 June	0
22 June	+1
21 June	+4
20 June	+4
19 June	+5
18 June	+14
17 June	+70
16 June	+1
15 June	0
14 June	+1
13 June	+2
12 June	+1
11 June	+2
10 June	0
09 June	0
08 June	0
07 June	+2
06 June	+3
05 June	+2
04 June	+4
03 June	+1
02 June	0
01 June	+2

Channel Posts

Repost from Вайб-кодинг

Знакомьтесь: Clips. Бесплатная открытая замена Loom, заточенная под агентов. 😋 В отличие от Loom, агент понимает Clips просто по ссылке. Каждый клип содержит API и метаданные, благодаря которым агент может изучить его содержимое. Агенты видят и слышат не только транскрипт, а вообще всё, что происходит на видео в любой момент времени. Делишься баг-репортом, фидбеком, анализом — и передаёшь это агенту, чтобы он улучшал продукт или отчёт. Ещё один плюс: софт твой. Никто не поднимет цену в один день, как это сделал Loom. Clips создан для кастомизации. Встроенный агент умеет править собственный код, просто адаптируешь приложение под себя. Ещё можно импортировать Loom по ссылке и загружать видео. Есть бесплатная хостовая версия. Можно форкнуть и хостить самому.

2	Вышел Harness-1 — поисковый агент на 20B параметров с довольно необычной идеей. Вместо того чтобы заставлять модель хранить всю историю поиска в контексте, авторы решили вынести состояние наружу и обучить модель работать через специальный harness. Получился агент на 20B параметров, который на длинных поисковых задачах конкурирует с гораздо более крупными моделями. Обычно поисковые агенты работают по схеме: поиск → чтение → поиск → чтение → всё подряд добавляется в контекст. В итоге модель одновременно играет роль поисковика, памяти, заметочника, верификатора и библиотекаря. Harness-1 разделяет эти задачи. Модель по-прежнему решает, что искать, что читать, какие факты сохранять и что проверять. Но всё состояние поиска хранится во внешнем harness-слое. Он ведёт рабочую память агента: • найденные документы • отобранные доказательства • историю поиска • связи между источниками • результаты проверок • дедупликацию и сжатие данных • контроль контекстного бюджета Интересно и то, что модель обучалась на сравнительно небольшом объёме данных: всего 899 SFT-траекторий и RL на 3453 запросах. Авторы считают, что значительную часть нужного поведения можно вынести в сам harness, а не зашивать в веса модели Самый любопытный результат - переносимость. На новых бенчмарках, которых модель не видела во время обучения, прирост оказался ещё выше, чем на исходных задачах. Paper : arxiv.org/abs/2606.02373 Code : https://github.com/pat-jj/harness-1 Model : https://huggingface.co/pat-jj/harness-1 HF Paper: https://huggingface.co/papers/2606.02373	965
3	Если у вас есть видеокарта с 8 ГБ VRAM, то у меня для вас хорошие новости. Вчера чувак тестировал Unsloth Gemma 4 12B Q4_K_XL на карте с 8 ГБ VRAM. Народ был в шоке и сразу спросил: А 25B+ модель на бюджетной карте вообще реально запустить? Оказалось — да. Чувак запускает локально огромную MoE-модель на 26 миллиардов параметров на обычном ноутбуке с RTX 4060 8 ГБ и 16 ГБ оперативки. Что по скорости: - стабильные 20 токенов/с на декодировании; - скорость не проседает даже на длинных промптах; - скормил ей промпт на 60k токенов - всё так же держит около 20 TPS. По TTFT чудес нет. Огромный контекст нужно сначала обработать. Но при скорости prefill около 200 токенов/с ждать приходится недолго, пользоваться вполне комфортно. И всё это без MTP. Главная причина — новые QAT-кванты Gemma 4 от Google. Файл весов unsloth gemma-4-26B-A4B-it-qat-UD-Q4_K_XL.gguf весит всего 13.2 ГБ, что для модели такого размера выглядит почти нереально. Главный секрет — флаг -cmoe в llama.cpp. Он отправляет веса экспертов MoE в оперативную память, а GPU оставляет Attention и KV Cache. В результате VRAM не забивается под завязку, а скорость остаётся стабильной. Флаги запуска: -m "gemma-4-26B-A4B-it-qat-UD-Q4_K_XL.gguf" -cmoe -c 248000 -v После запуска достаточно открыть веб-интерфейс на localhost и включить новый значок лампочки режима reasoning в поле ввода, чтобы наблюдать, как модель выполняет многошаговые рассуждения. 😒😒😒 А интеграция с Hermes Agent заняла буквально пару минут.	782
4	Посмотрел выступление Anthropic про то, как они собирают агентов, которые могут работать часами. Схема такая: planner → agent → evaluator Это маленькая продуктовая команда из агентов. У каждого своя роль, свой контекст и своя зона ответственности. Но есть важные нюансы. 1. Planner: верхний план и спринты Planner получает короткий запрос и превращает его в структуру работы: — что собираем — какие большие части нужны — в какой последовательности идти — какие спринты должны получиться Важная деталь: planner не расписывает всю техническую реализацию заранее. Если в начале придумать подробный план на 200 шагов и ошибиться, ошибка потом поедет каскадом через несколько часов работы. Поэтому planner держит уровень продукта и спринтов, а технические решения остаются ближе к моменту реализации. 2. Agent: сборка следующего спринта Agent берёт следующий спринт и собирает фичу. Но перед началом работы он сначала договаривается с evaluator, что именно будет считаться готовым результатом. Это главный механизм всей системы. В обычной агентской работе часто бывает так: дал задачу, агент что-то сделал, сам себя проверил, сказал “готово”, а потом выясняется, что половина сценариев не работает. Anthropic решает это через contract. 3. Contract: договорённость о готовом результате Agent пишет: я соберу такую фичу, проверять её надо вот так. Evaluator отвечает: добавь такой сценарий, такой edge case, такое состояние интерфейса, такую проверку. Они обмениваются markdown-файлами и уточняют критерии, пока не сходятся на contract. Contract — это список конкретных проверяемых утверждений. Дальше evaluator проверяет уже не исходный расплывчатый запрос пользователя, а этот contract. Например, исходный запрос: “сделай retro game maker” А contract превращает его в конкретику: — можно создать новый проект — есть sprite editor — есть play mode — сохраняется состояние — canvas работает корректно — основные сценарии кликаются в браузере В примере Anthropic для одного приложения получилось 27 contract criteria. Если критерии расплывчатые, critique тоже будет расплывчатой. Agent получает “ну как-то не очень” и не понимает, что именно чинить. Если критерии конкретные, он видит точную проблему. 4. Evaluator: жёсткая проверка через браузер Evaluator — это отдельный агент-критик. Он открывает приложение через Playwright, кликает по интерфейсу, делает скриншоты, проверяет сценарии, пишет критику и отдаёт её обратно agent. Отдельного критика проще настроить быть жёстким. У него отдельный контекст, отдельная роль и отдельная инструкция. Agent собирает. Evaluator атакует результат. За счёт этого появляется нормальное давление на качество. 5. Финальный цикл Итоговый процесс выглядит так: 1. planner разбивает задачу на спринты 2. agent берёт следующий спринт 3. agent и evaluator согласуют contract 4. agent строит 5. evaluator проверяет через браузер 6. agent чинит 7. цикл повторяется С новыми моделями эту схему можно делать проще. Иногда agent может два часа спокойно собирать продукт, а потом evaluator прогоняет проверку. Но суть остаётся: качество держится не на “модель умная”, а на архитектуре процесса. 6. Как собрать похожее самому Нужны понятные примитивы: — subagents для отдельных ролей — Playwright / Chrome MCP для проверки интерфейса — skills / rubrics для критериев качества — auto mode / permissions для долгой автономной работы — contract files для договорённости о “готово” до начала реализации — Я сам дошёл до части этих принципов: независимое тестирование, контракт (у меня назвался definition of done, dod). Теперь хочу попробовать воспроизвести целиком. Видео: https://youtu.be/mR-WAvEPRwE	565
5	Антропики выкатили Claude Opus 4.8. Доступна уже сегодня по той же цене 🎉 Из самого интересного – заметно подтянули честность модели. По словам Anthropic, Opus 4.8 примерно в 4 раза реже пропускает баги в коде, который написал сам, и не пытается выдать сломанное решение за рабочее. Также в Claude Code появилась новая фича: dynamic workflows (research preview) – для самых сложных задач Claude строит план, запускает сотни параллельных subagents и валидирует результаты перед тем, как вернуть отчёт. Например, при миграции, затрагивающей сотни файлов. Подробнее тут Для Opus 4.8 также доступен Fast mode - это та же модель, но примерно в 2.5 раза быстрее и в три раза дешевле, чем раньше.	987
6	Microsoft открыла исходный код Webright. Это скилл для ИИ-агентов, позволяющий управлять браузерами. Фишка в том, что внутри он использует Playwright, генерирует код на лету, а производительность просто бешеная. 🧑‍🍳	897
7	Как освоить ключевые инструменты ИИ и успешно внедрять инновации в бизнес-процессы? Расскажут эксперты Cloud․ru на курсе «ИИ для менеджеров» ✨ В программе курса: ▶️Как подготовить бизнес к внедрению ИИ ▶️Как адаптировать ИИ-модели под задачи ▶️Как перейти от идеи до Proof of Concept (PoC) ▶️Какие ИИ-технологии можно использовать ▶️Как оценить экономику ИИ-проектов ▶️Как обеспечить Data Governance и безопасность данных Учиться можно в комфортное время в своем темпе, а среднее время прохождения курса — 15 часов. 👉 Пройти курс👈	384
8	+1 🔥 AlphaProof Nexus: формальные доказательства начинают превращаться в инженерный пайплайн Google DeepMind показали AlphaProof Nexus - систему, которая автономно закрыла 9 открытых задач Эрдёша, часть из которых висела десятилетиями. По оценке авторов, стоимость решения одной задачи составила всего несколько сотен долларов. Кроме этого, система доказала 44 открытые гипотезы из OEIS, закрыла 15-летний вопрос в алгебраической геометрии и нашла новый алгоритмический параметр в оптимизационной теории, который раньше не был описан людьми. Модель генерирует идеи и фрагменты доказательств, а Lean проверяет каждый логический шаг через компилятор. Если доказательство некорректно, оно просто не проходит проверку. Не нужен рецензент, который вручную ищет дыру в рассуждении. Базовый агент, который просто чередует генерацию LLM и обратную связь от компилятора, смог повторить все 9 успешных решений задач Эрдёша. Более сложная версия с эволюционным поиском и reinforcement learning дала заметный выигрыш только на самых тяжёлых случаях. Чем сильнее становятся foundation models, тем чаще простые циклы «сгенерировал - проверил - исправил» начинают догонять специализированные архитектуры. Отличие от неформального подхода к математическим доказательствам принципиальное. Модель часто придумывала несуществующие леммы, ссылалась на «известные результаты» и пыталась спрятать сложность задачи в вспомогательное утверждение. В обычном текстовом доказательстве такие ошибки легко пропустить. Lean отсекает их сразу. Ещё один неожиданный эффект: агент находил неточности в формализациях уже существующих математических утверждений. То есть он работал не только как решатель, но и как диагностический инструмент для самой постановки задачи. Успехи пока сосредоточены там, где библиотека Lean уже достаточно зрелая: комбинаторика, теория чисел, оптимизация. Задачи, где нужно строить большой пласт новой теории, всё ещё далеко не закрыты. И большинство задач Эрдёша система не решила. Та же схема подходит для кодигша, спецификаций, верификации протоколов, компиляторов, криптографии. Формальная проверка отсекает галлюцинации. Модель может придумать лемму или сослаться на несуществующий результат, но Lean это не пропустит. https://arxiv.org/html/2605.22763v1 @ai_machinelearning_big_data	874
9	Наткнулся на практический опенсорс курс на GitHub: Learn Harness Engineering 😐 Он раскладывает коллаборацию с ИИ на 5 механизмов: инструкции, состояние, валидация, область и сессии - каждая задача становится отслеживаемой, продолжаемой и проверяемой, без рандома в результатах. Структура курса: 12 теоретических уроков + 6 практических проектов, всё проходит через одно десктоп-приложение, которое эволюционирует по мере сборки. Начинается с базовых сравнительных экспериментов, затем постепенно собирается полноценное рабочее окружение; результаты каждого проекта используются в следующем и усиливают пайплайн. Есть готовые шаблоны, тоесть можно сразу закинуть в свой проект и начать использовать, не проходя курс целиком.	0
10	Устал инициализировать претрейны весами Qwen? Приходи к нам — мы честно учим с нуля! 😉 Ищем Senior/Senior+ AI Engineer и продактов в RnD-команду: как отдельных специалистов, так и целые команды, — которые готовы разрабатывать прорывные AI-решения. Познакомиться ближе с нашими направлениями и оставить отклик можно на сайте. А если хотите следить за тем, как команда RnD ML Сбера исследует и разрабатывает AI-технологии, — подписывайтесь на Telegram-канал команды. Там делятся исследованиями, экспериментами и инсайтами из мира AI, а также свежими вакансиями 🚀	633
11	// Обвязка агента через код // Отчёт на 100+ страниц по всем аспектам, связанным с агентными обвязками: https://arxiv.org/abs/2605.18747 В частности, обзор суммирует методы и применения кода как обвязки для агентов. В статье приводится сильный аргумент, что такой подход может быть ключом к переходу к более широкой науке инженерии обвязок. Достаточно ли одного кода? Возможно. В любом случае, в работе утверждается, что будущие системы должны обладать четырьмя свойствами: исполняемость, инспектируемость, состояние, управляемость. 🤑	843
12	Наткнулся на практический опенсорс курс на GitHub: Learn Harness Engineering 😐 Он раскладывает коллаборацию с ИИ на 5 механизмов: инструкции, состояние, валидация, область и сессии - каждая задача становится отслеживаемой, продолжаемой и проверяемой, без рандома в результатах. Структура курса: 12 теоретических уроков + 6 практических проектов, всё проходит через одно десктоп-приложение, которое эволюционирует по мере сборки. Начинается с базовых сравнительных экспериментов, затем постепенно собирается полноценное рабочее окружение; результаты каждого проекта используются в следующем и усиливают пайплайн. Есть готовые шаблоны, тоесть можно сразу закинуть в свой проект и начать использовать, не проходя курс целиком.	1 319
13	🌟 Sakana AI открыла бета-тест супер-оркестратора LLM Японская лаборатория запустила бета-тестирование Sakana Fugu — своего первого международного коммерческого продукта. Это система-оркестратор, которая динамически собирает команду из GPT-5, Gemini, Claude и опенсорсных моделей и распределяет между ними подзадачи. 🟡Fugu основан на предыдущих работах Sakana - Conductor и TRINITY. В Conductor обучили 7B-модель через RL: на каждом шаге она решает, какого агента вызвать, какую подзадачу ему сформулировать и какие предыдущие сообщения передать в контекст. Говоря проще - мелкая модель работает мета-промпт-инженером для больших. На простых вопросах Conductor отвечает за один проход, а на сложных задачах сам выстраивает цепочку "планировщик — исполнитель — верификатор". Дополнительно метод способен делать рекурсивный самовызов: модель читает собственный инференс, определяет, что первая попытка провалилась, и запускает корректирующий рабочий процесс. 🟡Тесты Сама по себе модель-дирижёр (которая на 7B) в тестах показал 83,9% на LiveCodeBench и 87,5% на GPQA-Diamond, обогнав не только модели из своего весового пула, но и мультиагентные бейзлайны Mixture-of-Agents (тут правда только по стоимости, но обогнала). В коммерческой версии методы доработаны: fugu-ultra выбила 95,1% на GPQA Diamond (против 94,4% у Gemini 3.1 и 92,7% у Opus 4.6), 93,2% на LiveCodeBench v6 и 54,2% на SWE-Pro. Доступ к Fugu через API, совместимый с форматом OpenAI. В линейке 2 модели: скоростная Fugu Mini для быстрых ответов и Fugu Ultra с полным пулом для тяжёлого ризонинга. Заявки на бета-тест уже принимаются. Conductor и TRINITY приняты на ICLR 2026. 🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Orchestration #FUGU #SakanaAi	0
14	После утечки исходного кода Claude Code, бывший PM выделил его систему мультиагентной оркестрации в опенсорс, модель-агностичный фреймворк. Он изучил архитектуру, сосредоточился на слое мультиагентной оркестрации (координатор, который декомпозирует цели на задачи, система команд, message bus, планировщик задач с учётом зависимостей) и реализовал эти паттерны с нуля как отдельный опенсорс фреймворк, не нарушая код Anthropic. В результате получился то, что JackChen называет «open-multi-agent». В отличие от claude-agent-sdk, который поднимает отдельный CLI-процесс на каждого агента, здесь всё выполняется in-process и может деплоиться где угодно (serverless, Docker, CI/CD). Посмотреть: https://github.com/JackChen-me/open-multi-agent 🔭	0
15	🚀 Gemma 4 - новое семейство открытых моделей Google, которые можно запускать прямо на своём железе. Модели заточены для сложного reasoning и агентных задач. 🔵 Доступны в четырёх вариантах: • 31B Dense и 26B MoE Топовый уровень производительности для сложных локальных задач: кастомные код-ассистенты, анализ научных данных и не только. • E4B и E2B (Edge) Оптимизированы для мобильных устройств — работают в реальном времени с текстом, изображениями и аудио. 🤖 Что можно делать: • строить автономных ИИ-агентов • планировать и выполнять многошаговые задачи • взаимодействовать с приложениями • искать данные и вызывать API 👉 Встроенная работа с инструментами (tool use) из коробки. 🧠 Контекст до 256K токенов: • анализ целых кодовых баз • длинные цепочки действий без потери контекста • стабильная работа в сложных сценариях ⚡️ Начать можно уже сейчас через Google AI Studio Также веса моделей доступны на Hugging Face, Kaggle и Ollama Лицензия: Apache 2.0. https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/ @ai_machinelearning_big_data #Gemma	0

View all posts