Агенты ИИ | AGI_and_RL

Kanalga Telegram’da o‘tish

Про ии, RL и в целом @tokarev_i_v https://t.me/researchim

Ko'proq ko'rsatish

Rossiya95 700 Texnologiyalar & Aralashmalar16 508

6 098

Obunachilar

+224 soatlar

+217 kunlar

+4530 kunlar

2 380

Post ko'rishlar

~ 93024 soatlar

~ 1 02048 soatlar

39.05%

Muloqot nisbati

Ma'lumot yo'q

Kuniga postlar

Ads index

beta

Postlar arxiv

6 099

ну штош выложили веса Kimi K3 (2.8TA104b) - это который фейбл дома наверное самый важный релиз со времен квенов 3.5, правда совсем другой весовой категории муншоты легенды🥰 именно для таких релизов нужны OpenAI, Anthropic и все остальные жаль в 3090 не влезет https://www.kimi.com/blog/kimi-k3 https://github.com/MoonshotAI/Kimi-K3/blob/main/k3_tech_report.pdf веса https://huggingface.co/moonshotai/Kimi-K3

6 099

про ризонинге и как уровень рассуждений контролировать и настраивать в ллм https://magazine.sebastianraschka.com/p/controlling-reasoning-effort-in-llms

6 099

Чел показывает как потюнить ллмку рлем чтобы она тюнила маленькие ллмки рлем, прикольно https://github.com/Danau5tin/ai-trains-ai

6 099

Мои хорошие новый релизик полностью локального кодинг агента на квенах https://github.com/researchim-ai/one-click-coding-agent https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.3 Там Qwen 3.6 35B, 27B Qwen 3.5 35B, 9B Для скорости рекомендую кванты Q3_K_XL На 3090 35B бегает ловко с макс контекстом на 12 VRAM + 16 RAM виндовском ноутбуке 9B со 128к контекстом тоже вполне шурует ну и вообще в целом стал более-менее норм агент, мне даже нравится Все проекты делаются тут: https://t.me/researchim Если потестите агента и будут баги/предложения отписывайтесь сюда плиз ❤️

6 099

Repost from LakoMoor

QClaw-4B — это языковая модель, дообученная для агентных задач и работы с инструментами в рамках OpenClaw-совместимых фреймворков. Основана на Qwen3.5-4B. Несмотря на компактный размер, модель достигает результатов уровня значительно более крупных моделей — на ClawBench набрала 84.8 / 100 (Pass Rate 73.5%), вплотную к Kimi K2.5 и GLM-4.5. На Ru-Arena-General — 80.7% winrate, SOTA в классе ≤4B. 🔗 Карточка модели: https://huggingface.co/LakoMoor/QClaw-4B 🔗 GGUF (llama.cpp / Ollama / LM Studio): https://huggingface.co/LakoMoor/QClaw-4B-GGUF ⚖️ Лицензия: apache-2.0 Отдельная благодарность @lovedeathtransformers за ресурсы под обучение и прогон бенчмарков

6 099

ребятки опус 4.7 уже в курсоре доступен щас работает над переносом нашей тренинг студии дома https://github.com/researchim-ai/models-at-home на электрон. попробуем сделать отдельную аппку под разные платформы а весь бек будет в докере также крутиться там будет по сути отдельный проект для студии как прилы. а models-at-home пока так и будет оставаться браузерным со стримлитом. ну такие планы так что посмотрим как новый опус справится

6 099

Repost from (sci)Berloga Всех Наук и Технологий

🚀 Серия соревнований по МЛ ! С денежными и другими призами ! Кому интересен МЛ/RL или математика или пазлы или роботы. Приглашаем Вас принять участие в серии челленджей. Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении https://t.me/forodirchNEWS/3165 , хабре или в чате @starkitmega. Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл. Первый разыгрываемый приз - 10 000 рублей. Условия первого этапа очень простые. Есть три челленджа на Каггле Мегаминкс https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard Кубик Рубика 333 https://www.kaggle.com/competitions/cayleypy-ihes-cube Кубик Рубика 444 https://www.kaggle.com/competitions/cayley-py-444-cube Приз будет получен первым, кто достигнет ЛЮБУЮ из целей: 1 Или в конкурсе Мегаминкс - кто достигает скор 80 000 - и опубликует публичное решение 2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов). Подробное описание соревнований -- по ссылкам выше. Кратко: даны 1000 состояний пазлов и Вам надо предъявить их решения -- чем короче решение тем лучше (то есть чем меньше шагов/"мувов"). Score на лидерборде = сумма длин решений по всем пазлам. Соревнования полностью аналогичны соревнованию Каггл Санта 2023 -- можно навайбкодить изменения лучших решений оттуда. Также стоит взять наш подход CayleyPy и изменить в нем образующие на мегаминкс. Это сделали те, кто сейчас в топе. Дополнительную информацию, обсуждение и советы - см. чаты - @starkitmega @sberlogasci. Вводные лекции: четверг 19.00, пятница 20.00 (время по Москве). Дополнительным призом будет возможное участие в научных публикациях. Наши цели амбициозны - мы уже добились исключительных результатов, которые имеют приложение в МЛ, математике, теории струн, квантовых вычислениях и т.д. Публикации отмечены NIPS spotlight. Узнать больше Вы можете в наших статьях. Если у Вас есть несколько свободных часов в неделю, знание Питона или математики и Вам интересно принять участие - пишите @alexander_v_c - мы рады всем - начинающим и профи. Планируется серия челленджей и призов. Когда первый приз будет разыгран - мы объявим о втором этапе. ================ А также мы ищем Cпоносоров. Вы можете поддержать нас переведя на карту Илье Осокину 2202208362030505 Или напишите @alexander_v_c (Александр Червов) И кидайте нам, пожалуйста, звезды на гитхаб, Вы нам очень поможите: https://github.com/cayleypy/cayleypy ================ Выражаем благодарность компании RYBE - толстовки для айтишников: https://rybe.store https://t.me/rybe_store ================ Выражаем благодарность агентству BLASTIM за поддержку: ❤️ Наши курсы: agency.blastim.ru 🥨 Свежие вакансии в биотехе: blastim.ru 🤝 https://t.me/blastim

6 099

Кстати из небольших новостей я начал недавно пробовать стримить Не по иишке правда а больше по играм. Сделал рандом канальчик по игрушке в которой время провожу. Хотелось чисто попробовать и понять а что это вообще и есть ли смысл. Понял что смысл есть. Можно было это делать еще пару лет назад спокойно. Но как-то даже в голову не приходило стримерство, тк никаких других стримеров я не смотрю Возможно чутка попозже я буду пробовать выводить и этот канал тоже на твич и со стримами по иишке ну и вообще на разговорные темы, там досуг типа игрушки поиграть и еще чего хз. не знаю) Но пока так скажу - если вы в чем-то онлайновом время проводите и у вас есть желание с другими конектиться и общаться, то попробуйте. Не зайдет - ну и пофигу. А если понравится, то будете собирать аудиторию и близких по интересам людей)

6 099

кстати ребятки у нас кроме ван-клик-кодинг агента еще делается ван-клик-ресеч агент это почти тоже самое но нацеленное на работу со статьями внутри также https://huggingface.co/Qwen/Qwen3.5-35B-A3B вот тута https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF а еще добавлен searxng https://github.com/searxng/searxng для поиска по интернету. но он разворачивается через докер (так что если не нужен то отжать галочку можно и все) пока ранняя первая версия так сказать вот тут https://github.com/researchim-ai/one-click-research-agent https://github.com/researchim-ai/one-click-research-agent/releases/tag/v0.1.0 ну и вот тут сбилженные прилы

6 099

прикольно дизайнить процессоры агентами Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU https://arxiv.org/abs/2603.08716 https://www.alphaxiv.org/ru/overview/2603.08716

6 099

кстати у нас там обнова в локальном кодинговом агенте https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.1 на самом деле оно должно быть v0.2 потому что там прям много чего добавлено. но ладно. вроде стало сильно удобнее https://github.com/researchim-ai/one-click-coding-agent

6 099

а вот это прикольное применение опенклав

Most RL-for-LLM systems assume centralized, batch-mode training with pre-collected datasets. OpenClaw-RL takes a fundamentally different approach: it wraps your self-hosted model in OpenClaw as an OpenAI-compatible API, intercepts live multi-turn conversations, and continuously optimizes the policy in the background — all without interrupting your usage.

https://github.com/Gen-Verse/OpenClaw-RL а я напомню что у нас есть штука для тех кто хотел бы сам тюнить модельки https://github.com/researchim-ai/models-at-home достаточно докера и можно тюнить ллмки небольшие от претрена до грпо)

6 099

https://openai.com/index/introducing-gpt-5-4/ квен 4 хороший будет

6 099

ребятки, новые квены 3.5 получились отличные. респект квенам отдельное спасибо OpenAI, Anthropic, Google за такие крутые модельки. эти компании со своими фронтирами для того и нужны чтобы были у нас крутые квены щас локально работаю с 35b и 9b в q4 - все классн я вообще думаю что через 1-2 подобных релизов у нас мб будет прям опус 4.6 дома для меня всегда чисто локальные модельки были важнее любых крутых внешних. но вот до недавнего времени вменяемых по размеру моделек для локала не было. и тк щас пришло время то я начал делать потихонечку и кодингагента который бы работал чисто с локальными модельками и желательно максимально просто для юзера. и хочется чтобы он запускался буквально в 1 клик поэтому делаю https://github.com/researchim-ai/one-click-coding-agent сейчас там все кванты от квен 3.5 35b-a3b и 9b https://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.0 сбилжено и вроде работает под линуксом и под виндой, под макосом не тестил оно само по нажатию выкачает лламацпп, выкачает указанный квант и запустит там по дефолту будет 35b выбрана промотайте вверх и возьмите 9b у меня с ними проблем нету вроде если вдруг есть желание то можно потестить, я сам еще тесчу на скрине 9b пыжится маленький пишет симулятор квантового компутера. пока рекомендую q4_k_xl для 9b и для 35b https://huggingface.co/unsloth/Qwen3.5-9B-GGUF https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF кстати более мелкие еще не смотрел

6 099

Repost from шорткат

про нейронки и машинное обучение простыми словами Из каждого утюга сказали про нейронки, но никто так и не смог донести до меня простыми словами, как именно чат жпт и дипсик выдают ответ на наши вопросы. Ко мне на подкаст пришел Борис, который пишет книгу про ИИ для всех. В своей книге Борис рассказывает простыми словами для таких как я, что под капотом у нейросетей. Обсудили с Борисом: 🟡как именно текстовые нейронки анализируют запрос и как именно выдают ответ 🟡как обучают нейронки и почему их бьют палками 🟡почему нейросети галлюцинируют Получился насыщенный подкаст, послушать можно: на youtube на яндекс.музыке в apple подкастах

6 099

🥰 завтра весна 🥰

6 099

https://voxelbench.ai/compare бенч моделек на генерации всякого из кубиков довольно прикольно выглядит можно пооценивать и полюбоваться

6 099

приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас кстати кодексом 5.3 я доволен

6 099

приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас