uz
Feedback
Агенты ИИ | AGI_and_RL

Агенты ИИ | AGI_and_RL

Kanalga Telegram’da o‘tish
6 007
Obunachilar
+224 soatlar
+107 kunlar
+7030 kunlar
Postlar arxiv
Мои хорошие новый релизик полностью локального кодинг агента на квенах https://github.com/researchim-ai/one-click-coding-agen
Мои хорошие новый релизик полностью локального кодинг агента на квенах https://github.com/researchim-ai/one-click-coding-agent https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.3 Там Qwen 3.6 35B, 27B Qwen 3.5 35B, 9B Для скорости рекомендую кванты Q3_K_XL На 3090 35B бегает ловко с макс контекстом на 12 VRAM + 16 RAM виндовском ноутбуке 9B со 128к контекстом тоже вполне шурует ну и вообще в целом стал более-менее норм агент, мне даже нравится Все проекты делаются тут: https://t.me/researchim Если потестите агента и будут баги/предложения отписывайтесь сюда плиз ❤️

Repost from LakoMoor
QClaw-4B — это языковая модель, дообученная для агентных задач и работы с инструментами в рамках OpenClaw-совместимых фреймво
QClaw-4B — это языковая модель, дообученная для агентных задач и работы с инструментами в рамках OpenClaw-совместимых фреймворков. Основана на Qwen3.5-4B. Несмотря на компактный размер, модель достигает результатов уровня значительно более крупных моделей — на ClawBench набрала 84.8 / 100 (Pass Rate 73.5%), вплотную к Kimi K2.5 и GLM-4.5. На Ru-Arena-General — 80.7% winrate, SOTA в классе ≤4B. 🔗 Карточка модели: https://huggingface.co/LakoMoor/QClaw-4B 🔗 GGUF (llama.cpp / Ollama / LM Studio): https://huggingface.co/LakoMoor/QClaw-4B-GGUF ⚖️ Лицензия: apache-2.0 Отдельная благодарность @lovedeathtransformers за ресурсы под обучение и прогон бенчмарков

ребятки опус 4.7 уже в курсоре доступен щас работает над переносом нашей тренинг студии дома https://github.com/researchim-ai
ребятки опус 4.7 уже в курсоре доступен щас работает над переносом нашей тренинг студии дома https://github.com/researchim-ai/models-at-home на электрон. попробуем сделать отдельную аппку под разные платформы а весь бек будет в докере также крутиться там будет по сути отдельный проект для студии как прилы. а models-at-home пока так и будет оставаться браузерным со стримлитом. ну такие планы так что посмотрим как новый опус справится

🚀 Серия соревнований по МЛ ! С денежными и другими призами ! Кому интересен МЛ/RL или математика или пазлы или роботы. Пригл
🚀 Серия соревнований по МЛ ! С денежными и другими призами ! Кому интересен МЛ/RL или математика или пазлы или роботы. Приглашаем Вас принять участие в серии челленджей. Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении https://t.me/forodirchNEWS/3165 , хабре или в чате @starkitmega. Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл. Первый разыгрываемый приз - 10 000 рублей. Условия первого этапа очень простые. Есть три челленджа на Каггле Мегаминкс https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard Кубик Рубика 333 https://www.kaggle.com/competitions/cayleypy-ihes-cube Кубик Рубика 444 https://www.kaggle.com/competitions/cayley-py-444-cube Приз будет получен первым, кто достигнет ЛЮБУЮ из целей: 1 Или в конкурсе Мегаминкс - кто достигает скор 80 000 - и опубликует публичное решение 2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов). Подробное описание соревнований -- по ссылкам выше. Кратко: даны 1000 состояний пазлов и Вам надо предъявить их решения -- чем короче решение тем лучше (то есть чем меньше шагов/"мувов"). Score на лидерборде = сумма длин решений по всем пазлам. Соревнования полностью аналогичны соревнованию Каггл Санта 2023 -- можно навайбкодить изменения лучших решений оттуда. Также стоит взять наш подход CayleyPy и изменить в нем образующие на мегаминкс. Это сделали те, кто сейчас в топе. Дополнительную информацию, обсуждение и советы - см. чаты - @starkitmega @sberlogasci. Вводные лекции: четверг 19.00, пятница 20.00 (время по Москве). Дополнительным призом будет возможное участие в научных публикациях. Наши цели амбициозны - мы уже добились исключительных результатов, которые имеют приложение в МЛ, математике, теории струн, квантовых вычислениях и т.д. Публикации отмечены NIPS spotlight. Узнать больше Вы можете в наших статьях. Если у Вас есть несколько свободных часов в неделю, знание Питона или математики и Вам интересно принять участие - пишите @alexander_v_c - мы рады всем - начинающим и профи. Планируется серия челленджей и призов. Когда первый приз будет разыгран - мы объявим о втором этапе. ================ А также мы ищем Cпоносоров. Вы можете поддержать нас переведя на карту Илье Осокину 2202208362030505 Или напишите @alexander_v_c (Александр Червов) И кидайте нам, пожалуйста, звезды на гитхаб, Вы нам очень поможите: https://github.com/cayleypy/cayleypy ================ Выражаем благодарность компании RYBE - толстовки для айтишников: https://rybe.store https://t.me/rybe_store ================ Выражаем благодарность агентству BLASTIM за поддержку: ❤️ Наши курсы: agency.blastim.ru 🥨 Свежие вакансии в биотехе: blastim.ru 🤝 https://t.me/blastim

Кстати из небольших новостей я начал недавно пробовать стримить Не по иишке правда а больше по играм. Сделал рандом канальчик по игрушке в которой время провожу. Хотелось чисто попробовать и понять а что это вообще и есть ли смысл. Понял что смысл есть. Можно было это делать еще пару лет назад спокойно. Но как-то даже в голову не приходило стримерство, тк никаких других стримеров я не смотрю Возможно чутка попозже я буду пробовать выводить и этот канал тоже на твич и со стримами по иишке ну и вообще на разговорные темы, там досуг типа игрушки поиграть и еще чего хз. не знаю) Но пока так скажу - если вы в чем-то онлайновом время проводите и у вас есть желание с другими конектиться и общаться, то попробуйте. Не зайдет - ну и пофигу. А если понравится, то будете собирать аудиторию и близких по интересам людей)

кстати ребятки у нас кроме ван-клик-кодинг агента еще делается ван-клик-ресеч агент это почти тоже самое но нацеленное на работу со статьями внутри также https://huggingface.co/Qwen/Qwen3.5-35B-A3B вот тута https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF а еще добавлен searxng https://github.com/searxng/searxng для поиска по интернету. но он разворачивается через докер (так что если не нужен то отжать галочку можно и все) пока ранняя первая версия так сказать вот тут https://github.com/researchim-ai/one-click-research-agent https://github.com/researchim-ai/one-click-research-agent/releases/tag/v0.1.0 ну и вот тут сбилженные прилы

photo content

прикольно дизайнить процессоры агентами Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU htt
прикольно дизайнить процессоры агентами Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU https://arxiv.org/abs/2603.08716 https://www.alphaxiv.org/ru/overview/2603.08716

кстати у нас там обнова в локальном кодинговом агенте https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0
кстати у нас там обнова в локальном кодинговом агенте https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.1 на самом деле оно должно быть v0.2 потому что там прям много чего добавлено. но ладно. вроде стало сильно удобнее https://github.com/researchim-ai/one-click-coding-agent

а вот это прикольное применение опенклав
Most RL-for-LLM systems assume centralized, batch-mode training with pre-collected datasets. OpenClaw-RL takes a fundamentally different approach: it wraps your self-hosted model in OpenClaw as an OpenAI-compatible API, intercepts live multi-turn conversations, and continuously optimizes the policy in the background — all without interrupting your usage.
https://github.com/Gen-Verse/OpenClaw-RL а я напомню что у нас есть штука для тех кто хотел бы сам тюнить модельки https://github.com/researchim-ai/models-at-home достаточно докера и можно тюнить ллмки небольшие от претрена до грпо)

https://openai.com/index/introducing-gpt-5-4/ квен 4 хороший будет
https://openai.com/index/introducing-gpt-5-4/ квен 4 хороший будет

ребятки, новые квены 3.5 получились отличные. респект квенам отдельное спасибо OpenAI, Anthropic, Google за такие крутые моде
ребятки, новые квены 3.5 получились отличные. респект квенам отдельное спасибо OpenAI, Anthropic, Google за такие крутые модельки. эти компании со своими фронтирами для того и нужны чтобы были у нас крутые квены щас локально работаю с 35b и 9b в q4 - все классн я вообще думаю что через 1-2 подобных релизов у нас мб будет прям опус 4.6 дома для меня всегда чисто локальные модельки были важнее любых крутых внешних. но вот до недавнего времени вменяемых по размеру моделек для локала не было. и тк щас пришло время то я начал делать потихонечку и кодингагента который бы работал чисто с локальными модельками и желательно максимально просто для юзера. и хочется чтобы он запускался буквально в 1 клик поэтому делаю https://github.com/researchim-ai/one-click-coding-agent сейчас там все кванты от квен 3.5 35b-a3b и 9b https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.0 сбилжено и вроде работает под линуксом и под виндой, под макосом не тестил оно само по нажатию выкачает лламацпп, выкачает указанный квант и запустит там по дефолту будет 35b выбрана промотайте вверх и возьмите 9b у меня с ними проблем нету вроде если вдруг есть желание то можно потестить, я сам еще тесчу на скрине 9b пыжится маленький пишет симулятор квантового компутера. пока рекомендую q4_k_xl для 9b и для 35b https://huggingface.co/unsloth/Qwen3.5-9B-GGUF https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF кстати более мелкие еще не смотрел

Repost from шорткат
про нейронки и машинное обучение простыми словами Из каждого утюга сказали про нейронки, но никто так и не смог донести до ме
про нейронки и машинное обучение простыми словами Из каждого утюга сказали про нейронки, но никто так и не смог донести до меня простыми словами, как именно чат жпт и дипсик выдают ответ на наши вопросы. Ко мне на подкаст пришел Борис, который пишет книгу про ИИ для всех. В своей книге Борис рассказывает простыми словами для таких как я, что под капотом у нейросетей. Обсудили с Борисом: 🟡как именно текстовые нейронки анализируют запрос и как именно выдают ответ 🟡как обучают нейронки и почему их бьют палками 🟡почему нейросети галлюцинируют Получился насыщенный подкаст, послушать можно: на youtube на яндекс.музыке в apple подкастах

🥰 завтра весна 🥰

https://voxelbench.ai/compare бенч моделек на генерации всякого из кубиков довольно прикольно выглядит можно пооценивать и по
https://voxelbench.ai/compare бенч моделек на генерации всякого из кубиков довольно прикольно выглядит можно пооценивать и полюбоваться

приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас кстати кодексом 5.3 я доволен
приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас кстати кодексом 5.3 я доволен

приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас
приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас

там кстати челы выложили датасеты которые использовали для трена Goedel-Prover-V2 - модельки для доказательств теорем выходил
там кстати челы выложили датасеты которые использовали для трена Goedel-Prover-V2 - модельки для доказательств теорем выходил он в августе 2025 сама папир Goedel-Prover-V2: Scaling Formal Theorem Proving with Scaffolded Data Synthesis and Self-Correction https://arxiv.org/abs/2508.03613 https://www.alphaxiv.org/ru/overview/2508.03613 сеты SFT (1.74M samples) https://huggingface.co/datasets/Goedel-LM/SFT_dataset_v2 RL (whole proof generation + self-revision, 98k samples) https://huggingface.co/datasets/Goedel-LM/RL_dataset_V2

надо дистилить антропика?
Anonymous voting