Агенты ИИ | AGI_and_RL
Ir al canal en Telegram
Про ии, RL и в целом @tokarev_i_v https://t.me/researchim
Mostrar más6 007
Suscriptores
+224 horas
+107 días
+7030 días
Archivo de publicaciones
Мои хорошие новый релизик полностью локального кодинг агента на квенах
https://github.com/researchim-ai/one-click-coding-agent
https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.3
Там Qwen 3.6 35B, 27B
Qwen 3.5 35B, 9B
Для скорости рекомендую кванты Q3_K_XL
На 3090 35B бегает ловко с макс контекстом
на 12 VRAM + 16 RAM виндовском ноутбуке 9B со 128к контекстом тоже вполне шурует
ну и вообще в целом стал более-менее норм агент, мне даже нравится
Все проекты делаются тут: https://t.me/researchim
Если потестите агента и будут баги/предложения отписывайтесь сюда плиз ❤️
Repost from LakoMoor
QClaw-4B — это языковая модель, дообученная для агентных задач и работы с инструментами в рамках OpenClaw-совместимых фреймворков. Основана на Qwen3.5-4B.
Несмотря на компактный размер, модель достигает результатов уровня значительно более крупных моделей — на ClawBench набрала 84.8 / 100 (Pass Rate 73.5%), вплотную к Kimi K2.5 и GLM-4.5. На Ru-Arena-General — 80.7% winrate, SOTA в классе ≤4B.
🔗 Карточка модели: https://huggingface.co/LakoMoor/QClaw-4B
🔗 GGUF (llama.cpp / Ollama / LM Studio): https://huggingface.co/LakoMoor/QClaw-4B-GGUF
⚖️ Лицензия: apache-2.0
Отдельная благодарность @lovedeathtransformers за ресурсы под обучение и прогон бенчмарков
ребятки опус 4.7 уже в курсоре доступен
щас работает над переносом нашей тренинг студии дома https://github.com/researchim-ai/models-at-home
на электрон.
попробуем сделать отдельную аппку под разные платформы а весь бек будет в докере также крутиться
там будет по сути отдельный проект для студии как прилы. а models-at-home пока так и будет оставаться браузерным со стримлитом. ну такие планы
так что посмотрим как новый опус справится
Repost from (sci)Berloga Всех Наук и Технологий
🚀 Серия соревнований по МЛ ! С денежными и другими призами ! Кому интересен МЛ/RL или математика или пазлы или роботы.
Приглашаем Вас принять участие в серии челленджей.
Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении https://t.me/forodirchNEWS/3165 , хабре или в чате @starkitmega.
Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл.
Первый разыгрываемый приз - 10 000 рублей.
Условия первого этапа очень простые.
Есть три челленджа на Каггле
Мегаминкс
https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard
Кубик Рубика 333
https://www.kaggle.com/competitions/cayleypy-ihes-cube
Кубик Рубика 444
https://www.kaggle.com/competitions/cayley-py-444-cube
Приз будет получен первым, кто достигнет ЛЮБУЮ из целей:
1 Или в конкурсе Мегаминкс - кто достигает скор 80 000 - и опубликует публичное решение
2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов).
Подробное описание соревнований -- по ссылкам выше. Кратко: даны 1000 состояний пазлов и Вам надо предъявить их решения -- чем короче решение тем лучше (то есть чем меньше шагов/"мувов"). Score на лидерборде = сумма длин решений по всем пазлам. Соревнования полностью аналогичны соревнованию Каггл Санта 2023 -- можно навайбкодить изменения лучших решений оттуда. Также стоит взять наш подход CayleyPy и изменить в нем образующие на мегаминкс. Это сделали те, кто сейчас в топе. Дополнительную информацию, обсуждение и советы - см. чаты - @starkitmega @sberlogasci. Вводные лекции: четверг 19.00, пятница 20.00 (время по Москве).
Дополнительным призом будет возможное участие в научных публикациях. Наши цели амбициозны - мы уже добились исключительных результатов, которые имеют приложение в МЛ, математике, теории струн, квантовых вычислениях и т.д. Публикации отмечены NIPS spotlight. Узнать больше Вы можете в наших статьях. Если у Вас есть несколько свободных часов в неделю, знание Питона или математики и Вам интересно принять участие - пишите @alexander_v_c - мы рады всем - начинающим и профи.
Планируется серия челленджей и призов. Когда первый приз будет разыгран - мы объявим о втором этапе.
================
А также мы ищем Cпоносоров.
Вы можете поддержать нас переведя на карту Илье Осокину 2202208362030505
Или напишите @alexander_v_c (Александр Червов)
И кидайте нам, пожалуйста, звезды на гитхаб, Вы нам очень поможите:
https://github.com/cayleypy/cayleypy
================
Выражаем благодарность компании RYBE - толстовки для айтишников: https://rybe.store https://t.me/rybe_store
================
Выражаем благодарность агентству BLASTIM за поддержку:
❤️ Наши курсы: agency.blastim.ru
🥨 Свежие вакансии в биотехе: blastim.ru
🤝 https://t.me/blastim
Кстати из небольших новостей я начал недавно пробовать стримить
Не по иишке правда а больше по играм. Сделал рандом канальчик по игрушке в которой время провожу. Хотелось чисто попробовать и понять а что это вообще и есть ли смысл. Понял что смысл есть. Можно было это делать еще пару лет назад спокойно. Но как-то даже в голову не приходило стримерство, тк никаких других стримеров я не смотрю
Возможно чутка попозже я буду пробовать выводить и этот канал тоже на твич и со стримами по иишке ну и вообще на разговорные темы, там досуг типа игрушки поиграть и еще чего хз.
не знаю)
Но пока так скажу - если вы в чем-то онлайновом время проводите и у вас есть желание с другими конектиться и общаться, то попробуйте. Не зайдет - ну и пофигу. А если понравится, то будете собирать аудиторию и близких по интересам людей)
кстати ребятки у нас кроме ван-клик-кодинг агента еще делается ван-клик-ресеч агент
это почти тоже самое но нацеленное на работу со статьями
внутри также https://huggingface.co/Qwen/Qwen3.5-35B-A3B
вот тута https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF
а еще добавлен searxng https://github.com/searxng/searxng
для поиска по интернету. но он разворачивается через докер (так что если не нужен то отжать галочку можно и все)
пока ранняя первая версия так сказать вот тут
https://github.com/researchim-ai/one-click-research-agent
https://github.com/researchim-ai/one-click-research-agent/releases/tag/v0.1.0
ну и вот тут сбилженные прилы
прикольно дизайнить процессоры агентами
Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU
https://arxiv.org/abs/2603.08716
https://www.alphaxiv.org/ru/overview/2603.08716
кстати у нас там обнова в локальном кодинговом агенте
https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.1
на самом деле оно должно быть v0.2 потому что там прям много чего добавлено. но ладно.
вроде стало сильно удобнее
https://github.com/researchim-ai/one-click-coding-agent
а вот это прикольное применение опенклав
Most RL-for-LLM systems assume centralized, batch-mode training with pre-collected datasets. OpenClaw-RL takes a fundamentally different approach: it wraps your self-hosted model in OpenClaw as an OpenAI-compatible API, intercepts live multi-turn conversations, and continuously optimizes the policy in the background — all without interrupting your usage.https://github.com/Gen-Verse/OpenClaw-RL а я напомню что у нас есть штука для тех кто хотел бы сам тюнить модельки https://github.com/researchim-ai/models-at-home достаточно докера и можно тюнить ллмки небольшие от претрена до грпо)
ребятки, новые квены 3.5 получились отличные. респект квенам
отдельное спасибо OpenAI, Anthropic, Google за такие крутые модельки. эти компании со своими фронтирами для того и нужны чтобы были у нас крутые квены
щас локально работаю с 35b и 9b в q4 - все классн
я вообще думаю что через 1-2 подобных релизов у нас мб будет прям опус 4.6 дома
для меня всегда чисто локальные модельки были важнее любых крутых внешних. но вот до недавнего времени вменяемых по размеру моделек для локала не было.
и тк щас пришло время то я начал делать потихонечку и кодингагента который бы работал чисто с локальными модельками и желательно максимально просто для юзера.
и хочется чтобы он запускался буквально в 1 клик
поэтому делаю https://github.com/researchim-ai/one-click-coding-agent
сейчас там все кванты от квен 3.5 35b-a3b и 9b
https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.0
сбилжено и вроде работает под линуксом и под виндой, под макосом не тестил
оно само по нажатию выкачает лламацпп, выкачает указанный квант и запустит
там по дефолту будет 35b выбрана промотайте вверх и возьмите 9b
у меня с ними проблем нету вроде
если вдруг есть желание то можно потестить, я сам еще тесчу
на скрине 9b
пыжится маленький пишет симулятор квантового компутера.
пока рекомендую q4_k_xl для 9b и для 35b
https://huggingface.co/unsloth/Qwen3.5-9B-GGUF
https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF
кстати более мелкие еще не смотрел
Repost from шорткат
про нейронки и машинное обучение простыми словами
Из каждого утюга сказали про нейронки, но никто так и не смог донести до меня простыми словами, как именно чат жпт и дипсик выдают ответ на наши вопросы.
Ко мне на подкаст пришел Борис, который пишет книгу про ИИ для всех. В своей книге Борис рассказывает простыми словами для таких как я, что под капотом у нейросетей.
Обсудили с Борисом:
🟡как именно текстовые нейронки анализируют запрос и как именно выдают ответ
🟡как обучают нейронки и почему их бьют палками
🟡почему нейросети галлюцинируют
Получился насыщенный подкаст, послушать можно:
на youtube
на яндекс.музыке
в apple подкастах
https://voxelbench.ai/compare
бенч моделек на генерации всякого из кубиков
довольно прикольно выглядит
можно пооценивать и полюбоваться
приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас
кстати кодексом 5.3 я доволен
приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас
там кстати челы выложили датасеты которые использовали для трена Goedel-Prover-V2 - модельки для доказательств теорем
выходил он в августе 2025
сама папир
Goedel-Prover-V2: Scaling Formal Theorem Proving with Scaffolded Data Synthesis and Self-Correction
https://arxiv.org/abs/2508.03613
https://www.alphaxiv.org/ru/overview/2508.03613
сеты
SFT (1.74M samples)
https://huggingface.co/datasets/Goedel-LM/SFT_dataset_v2
RL (whole proof generation + self-revision, 98k samples)
https://huggingface.co/datasets/Goedel-LM/RL_dataset_V2
квены надистилили небольших моделек
https://huggingface.co/Qwen/Qwen3.5-27B
https://huggingface.co/Qwen/Qwen3.5-35B-A3B
gguf для лмстудии и llama.cpp:
https://huggingface.co/lmstudio-community/Qwen3.5-35B-A3B-GGUF
https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF
https://huggingface.co/lmstudio-community/Qwen3.5-27B-GGUF
https://huggingface.co/unsloth/Qwen3.5-27B-GGUF
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
