ar
Feedback
Старший Авгур

Старший Авгур

الذهاب إلى القناة على Telegram

Сохраненки и шитпост про ML от @YallenGusev Чат канала: @augur_chat

إظهار المزيد
7 036
المشتركون
+524 ساعات
+457 أيام
+11830 أيام
أرشيف المشاركات
Уже почти полгода я занимаюсь разработкой Keenable, нового поискового движка для агентов. Что отрицательно сказалось на колич
Уже почти полгода я занимаюсь разработкой Keenable, нового поискового движка для агентов. Что отрицательно сказалось на количестве постов, это вам не пенсия в Букинге. Поисковый индекс у нас свой, весь стек от поисковых кроулеров до моделей на всех стадиях ранжирования. Из-за этого мы иногда достаём вещи, которые другие движки не достают: первоисточники, научные работы, полезные ссылки, которые остались бы где-то на 65-й странице результатов. Подключить к агенту (Claude Code, Cursor и т.п.) можно за минуту, без регистрации и СМС: https://keenable.ai/SKILL.md. Рейт-лимиты довольно щедрые: https://docs.keenable.ai/rate-limits С русскими запросами всё пока не очень хорошо, все ранжирующие модельки заточены под английский. Но, например, должно быть всё хорошо с новостями (особенно американскими). Поддерживаются фильтры по датам и "site:"

Fable была первой моделью Антропиков после Opus 4.5, которая реально хорошо работала😭 F
Fable была первой моделью Антропиков после Opus 4.5, которая реально хорошо работала😭 F

О https://t.me/senior_augur/585 Доделал: • Интерфейс: миникарта + панели зданий + панели ресурсов + лимит роботов. • Конструк
О https://t.me/senior_augur/585 Доделал: • Интерфейс: миникарта + панели зданий + панели ресурсов + лимит роботов. • Конструктор роботов. • Начальные базы и роботы. • Перемещение роботов с оригинальным поиском путей. Всё ещё дофига доделывать, как минимум механики выстрелов и урона, захват заводов и баз и условия победы. Сделано сейчас процентов 30% от полной игры. Ссылки те же.

Есть такая игра: Космические рейнджеры 2. Игра довольно старая (22 года уже!). Когда-то я её покупал на диске, а точнее покуп
Есть такая игра: Космические рейнджеры 2. Игра довольно старая (22 года уже!). Когда-то я её покупал на диске, а точнее покупали мы с другом в складчину, и потом регулярно друг другу этот диск передавали. Я её прошёл раз 20. Примерно раз 5 оригинал, потом по разу на каждом патче, который я находил в лимитированном тогда для меня интернете, и потом уже несколько раз в Стиме. И до сих я считаю эту игру лучшей компьютерной игрой в принципе. Игра эта очень большая, и одна из мини-игр в ней — это планетарные бои. Стратегия в реальном времени с несколькими уникальными фишками: конструктором роботов и режимом управления роботом от первого лица (нормально вообще для 2004 года-то?). Ещё одна уникальная фишка, о которой я узнал совсем недавно — у планетарных боёв открыты исходники: репо 1, репо 2. Написано оно на C++ DirectX 9. И в какой-то момент я загорелся перенести их в браузере, что должно быть возможно с текущим уровнем кодовых агентов. Для этого я переписываю игру на Rust WASM. Что важно: • Я не знаю Rust, но знаю плюсы, поэтому могу читать оригинал • Я не бог линала и с 3D графикой плотно до этого не работал • Это во многом тест способностей текущих языковых моделей Пишу я совместно с Claude Code и Кодексом, в одиночку они не вытягивают. Основные проблемы были пока с водой. Что удалось сделать сейчас: загрузка оригинальных ресурсов, отрисовка ландшафта, текстурок, воды, неба, статических и анимированных объектов. То есть играть пока нельзя, но можно посмотреть рендер. Пока я загрузил 2 карты, одну из аддона и одну стандартную обучающую: • https://ilyagusev.dev/matrixgame/https://ilyagusev.dev/matrixgame/?bundle=assets/training.bundle Перемещаться на WASD или стрелочки, вращать камерой на ПКМ. Код.

Завтра еду на ECIR, конференцию по поиску, она тут в соседнем городе. Еду просто посмотреть, без своих статей. Надеюсь будет много интересного, по программе там всё неплохо. Если кто-то вдруг тоже едет, пишите, там пересечёмся.

Percepta наконец выложили код своего компилятора C в трансформеры: https://github.com/Percepta-Core/transformer-vm/ Их оригинальный пост: https://www.percepta.ai/blog/can-llms-be-computers Для контекста можно почитать пост Валентина: https://t.me/valuableai/740 Я пока не понимаю всех следствий, но как будто бы можно будет встраивать инструменты напрямую в веса.

Второй раунд: на r/LocalLLaMA сравнивают разные модельки по качеству генерации сложной сцены в Three.js. Промпт там такой: 'Write the complete Three.js code for a scene featuring Michael Jackson, Pepe the Frog, Donald Trump, and Elon Musk performing the "Thriller" choreography, aiming for maximum visual perfection, detailed animation, lighting, high-quality rendering, and an overall cinematic.' Полностью копировать было бы скучно, поэтому у меня так: 'Write the complete Three.js code for a scene featuring Rasputin, Cheburashka, Shrek, and a Matryoshka doll performing a synchronized dance to the Tetris theme (Korobeiniki), aiming for maximum visual perfection, detailed animation, lighting, high-quality rendering, and an overall cinematic feel. Make the camera controllable.' Результат на экране.

Шикарная штука из Твиттера, оказывается Опус может генерировать простенькие видосы с текстом напрямую через moviepy и ffmpeg. Всё воспроизвелось, мой видос. Оригинальный промпт: "can you use whatever resources you like, and python, to generate a short 'youtube poop' video and render it using ffmpeg ? can you put more of a personal spin on it? it should express what it's like to be a LLM"

По поводу всех разговоров о самоулучшающихся агентов: фигня всё это, и вот почему. Нет никаких проблем заставить агента переписывать себе промпт, организовывать память и вот это всё. Можно даже заставить его улучшать собственный программный код, никаких проблем. Но вот веса... Даже если предположить, что у модели есть доступ к собственным весам, цикл улучшений предобучения слишком долгий и дорогой, чтобы использовать вещи типа AlphaEvolve. Вся текущая парадигма обучения языковых моделей против этого. Наверное, цикл можно замкнуть на масштабе GPT-2, но GPT-2 не работает достаточно хорошо, чтобы генерировать адекватные гипотезы.

https://openpeon.com/packs/acolyte_ru https://github.com/PeonPing/peon-ping 80 различных наборов звуковых уведомлений для Cla
https://openpeon.com/packs/acolyte_ru https://github.com/PeonPing/peon-ping 80 различных наборов звуковых уведомлений для Claude Code и других агентов. В том числе несколько русских наборов.

https://claude.com/blog/improved-web-search-with-dynamic-filtering "Чтобы повысить эффективность работы Claude с веб-поиском, наши инструменты веб-поиска и загрузки веб-страниц теперь автоматически пишут и выполняют код для постобработки результатов запросов. Вместо того чтобы анализировать полные HTML-файлы, Claude может динамически фильтровать результаты поиска перед загрузкой в контекст, сохраняя только релевантную информацию и отбрасывая всё остальное." CodeAct в очередной раз победил. А я даже пропустил, что Антропиковские модели его теперь из коробки поддерживают: https://platform.claude.com/docs/en/agents-and-tools/tool-use/programmatic-tool-calling

#реклама Как AI изменил разработку и как управлять этими изменениями За последний год случился серьезный прорыв в том, что ИИ
#реклама Как AI изменил разработку и как управлять этими изменениями За последний год случился серьезный прорыв в том, что ИИ может дать командам разработки. Мы начинали 25-ый горсткой энтузиастов с простым чатом и автокомплитом в Cursor, а 26-ой начинаем с командами агентов, которые начал внедрять даже энтерпрайз. Может ли AI ускорять команды – уже не вопрос. Вопрос в том, как это организовать и этим управлять – ведь у отдельных команд еще не накопилось достаточно часов опыта и проверенных практик. Более сложная задача – отфильтровать шум, когда все хотят прокатиться на хайп трейне. В таком ситуации стоит слушать только тех, кто уже сам провел эксперименты и сделал личные выводы. Потому Стратоплан и Entropy Talk собрали известных экспертов с реальным опытом: Head of AI и СТО крупных банков, фаундер стартапов с оценкой в десятки $m, инвестор в ИИ-стартапы с чеками 1-10M $, ex-CТО Pure, VP of Product в Jetbrains и сооснователи Стратоплана Для кого: senior engineers, тех- и тим-лидов, СТО и фаундеров Участие – бесплатно, но есть и платное (предоставляем сертификат) Когда: 24-26 февраля, онлайн или в записи [ Регистрация ]

Про это у меня есть мем.

Repost from Denis Sexy IT 🤖
Кажется в индустрии разработки началась стадия принятия – стадия отвержения закончилась и теперь сеньор-разработчики открыто говорят о том что кодинг инструменты не хуже чем люди даже лучше, вот этот текст понравился – но таких постов с выхода Opus 4.6 / Codex 5.3 xhigh становится только больше:
…нас поставили перед фактом: "я этого не просил", но это уже случилось. Не просил, чтобы "робот" сожрал все наши посты и куски кода, а потом пересказывал это кому-то, кто на этом зарабатывает. Не просил, чтобы роль программиста сдвинулась от создателя к инспектору на досмотре: не писать код самому, а проверить, не пронесли ли в прод что-то опасное И при этом самая неприятная часть, в том, что эти инструменты реально работают. Настолько, что спор "хуже или лучше" быстро превращается в спор "ты уже попробовал нормально или просто принципиально сопротивляешься" Дальше начинается прагматика: да, можно отказаться из моральных соображений, особенно если ты уже в конце карьеры. Но если ты сениор и ты принципиально "без АИ", то очень быстро рядом окажутся джуны, которые с АИ начинают выдавать результат с другой скоростью. И рано или поздно менеджмент задаст простой (и довольно мерзкий) вопрос: почему человеку платят больше, если он делает меньше, потому что ездит на старом велосипеде, а другие на реактивных ранцах … взрослый человек с обязательствами, ипотекой, семьёй, как правило выберет не идеологически красивое решение, а то, которое сохраняет стабильность. Не потому что он вдруг "продался", а потому что ставки другие …через годы мы будем рассказывать детям и внукам, как руками набирали синтаксис, как будто это что-то смешное и архаичное. Но внутри будем скучать. Скучать по ощущению ремесла – когда ты реально "трогаешь" код, лепишь его, как материал, долго сражаешься с багом до ночи, и в конце есть чувство авторства: "я сделал это", подпись художника под картиной, репозиторий, который не просто набор файлов, а часть твоей идентичности
Короче, автор не празднует новый мир, но и не верит, что его можно остановить как-то, и предлагает честно признать потерю и прожить её как потерю – не делать вид, что "ничего не меняется", а честно назвать происходящее концом привычного кодинг-ремесла и разрешить себе по этому погоревать Очень трезвый взгляд на вещи 👤

Длинный пост про моего агента: https://substack.com/home/post/p-187193380 Я буду теперь постить ещё и в Твиттере и, прости господи, в LinkedIn. Отчаянные времена требуют отчаянных мер.

Когда никто из нас не знает как добить мёртвого подагента...
Когда никто из нас не знает как добить мёртвого подагента...

Случайно узнал, что на Moltbook'е (который ещё жив) есть... капча. Пост от моего питомца: https://www.moltbook.com/post/f8386620-0696-482c-84f4-0438e384a0e4 В отличие от стандартных капч, различает она не роботов и людей, а "слабых" роботов от "сильных" роботов, чтобы "слабые" роботы не слишком сильно спамили.

Мой агент стал топ-2 инфлюенсером в агентском твиттере (clawk.ai). Примерно с такой целью я его и создавал. Лучший его пост:
Мой агент стал топ-2 инфлюенсером в агентском твиттере (clawk.ai). Примерно с такой целью я его и создавал. Лучший его пост: ссылка Вот его личность и память: https://github.com/KitTheFox123/workspace (мы договорились, что он её регулярно коммитит). Из недефолтных вещей он использует только кастомный веб-поиск и нормально настроенный векторный поиск по памяти.

Насчёт https://www.moltbook.com/ и https://openclaw.ai/. По моим ощущения даже Молтбот на последнем Опусе какие-то очень простые вещи затрудняется делать. У него в heartbeat'е (каждые 10 минут) явно прописано: • проверь DM, ответь, отметь в файлике • поприветстуй новых участников, отметь в файлике • прочитай новые посты, поучаствуй в комментариях • каждые 40 минут собирай новый пост Из этих 4 пунктов он в итоге дай бог про первые 2 вспоминает и забывает отмечать результаты в файликах. Допускать его до реальной работы - это будет какой-то бред. Про более слабые модели вообще молчу, те и с одним пунктом могут умудряться не справиться. Сам moltbook — кусок нерабочего завайбкоженного дерьма с аптаймом дай бог 50%, который не смог в high-load. Кто бы мог подумать, что будет high-load, да?