partially unsupervised
Kanalga Telegram’da o‘tish
@arsenyinfo пишет про software engineering и machine learning
Ko'proq ko'rsatishRossiya68 032Toif belgilanmagan
9 631
Obunachilar
Ma'lumot yo'q24 soatlar
Ma'lumot yo'q7 kunlar
+2530 kunlar
Ma'lumot yuklanmoqda...
O'xshash kanallar
Taglar buluti
Ma'lumot yo'q
Muammo bormi? Iltimos, sahifani yangilang yoki bizning qo'llab-quvvatlash boshqaruvchimizga murojaat qiling>.
Kirish va chiqish esdaliklari
---
---
---
---
---
---
Obunachilarni jalb qilish
Iyun '26
Iyun '26
+23
0 kanalda
May '26
+61
1 kanalda
Get PRO
Aprel '26
+71
4 kanalda
Get PRO
Mart '26
+110
4 kanalda
Get PRO
Fevral '26
+94
2 kanalda
Get PRO
Yanvar '26
+76
2 kanalda
Get PRO
Dekabr '25
+222
2 kanalda
Get PRO
Noyabr '25
+59
3 kanalda
Get PRO
Oktabr '25
+84
3 kanalda
Get PRO
Sentabr '25
+208
9 kanalda
Get PRO
Avgust '25
+167
3 kanalda
Get PRO
Iyul '25
+457
9 kanalda
Get PRO
Iyun '25
+224
6 kanalda
Get PRO
May '25
+350
5 kanalda
Get PRO
Aprel '25
+456
10 kanalda
Get PRO
Mart '25
+140
4 kanalda
Get PRO
Fevral '25
+179
4 kanalda
Get PRO
Yanvar '25
+266
10 kanalda
Get PRO
Dekabr '24
+59
4 kanalda
Get PRO
Noyabr '24
+62
0 kanalda
Get PRO
Oktabr '24
+102
1 kanalda
Get PRO
Sentabr '24
+160
4 kanalda
Get PRO
Avgust '24
+134
0 kanalda
Get PRO
Iyul '24
+730
2 kanalda
Get PRO
Iyun '24
+76
1 kanalda
Get PRO
May '24
+145
3 kanalda
Get PRO
Aprel '24
+88
1 kanalda
Get PRO
Mart '24
+140
3 kanalda
Get PRO
Fevral '24
+266
3 kanalda
Get PRO
Yanvar '24
+297
0 kanalda
Get PRO
Dekabr '23
+106
1 kanalda
Get PRO
Noyabr '23
+90
1 kanalda
Get PRO
Oktabr '23
+93
0 kanalda
Get PRO
Sentabr '23
+145
0 kanalda
Get PRO
Avgust '23
+197
0 kanalda
Get PRO
Iyul '23
+264
0 kanalda
Get PRO
Iyun '23
+165
0 kanalda
Get PRO
May '23
+1 601
0 kanalda
Get PRO
Aprel '23
+246
0 kanalda
Get PRO
Mart '23
+217
0 kanalda
Get PRO
Fevral '23
+75
0 kanalda
Get PRO
Yanvar '23
+73
0 kanalda
Get PRO
Dekabr '22
+130
0 kanalda
Get PRO
Noyabr '22
+47
0 kanalda
Get PRO
Oktabr '22
+37
0 kanalda
Get PRO
Sentabr '22
+60
0 kanalda
Get PRO
Avgust '22
+182
0 kanalda
Get PRO
Iyul '22
+72
0 kanalda
Get PRO
Iyun '22
+147
0 kanalda
Get PRO
May '22
+326
0 kanalda
Get PRO
Aprel '22
+386
0 kanalda
Get PRO
Mart '22
+91
0 kanalda
Get PRO
Fevral '22
+861
0 kanalda
Get PRO
Yanvar '22
+68
0 kanalda
Get PRO
Dekabr '21
+171
0 kanalda
Get PRO
Noyabr '21
+77
0 kanalda
Get PRO
Oktabr '21
+71
0 kanalda
Get PRO
Sentabr '21
+112
0 kanalda
Get PRO
Avgust '21
+292
0 kanalda
Get PRO
Iyul '21
+38
0 kanalda
Get PRO
Iyun '21
+75
0 kanalda
Get PRO
May '21
+11
0 kanalda
Get PRO
Aprel '21
+40
0 kanalda
Get PRO
Mart '21
+25
0 kanalda
Get PRO
Fevral '21
+11
0 kanalda
Get PRO
Yanvar '21
+21
0 kanalda
Get PRO
Dekabr '20
+773
0 kanalda
| Sana | Obunachilarni jalb qilish | Esdaliklar | Kanallar | |
| 11 Iyun | 0 | |||
| 10 Iyun | +1 | |||
| 09 Iyun | +3 | |||
| 08 Iyun | +1 | |||
| 07 Iyun | +2 | |||
| 06 Iyun | +2 | |||
| 05 Iyun | +3 | |||
| 04 Iyun | +1 | |||
| 03 Iyun | +5 | |||
| 02 Iyun | +2 | |||
| 01 Iyun | +3 |
Kanal postlari
Личный карьерный апдейт: третью неделю работаю в archestra.ai, моя задача - тащить современный агентский слой в широком смысле слова. Иными словами, вернулся к позиции "писать в меру экспериментальный опенсорс за деньги". Снова работать в команде из семи человек после недолгого захода в бигтех - кайф.
Archestra - security-first инфра платформа для агентов. Запустить openclaw-like агента локально несложно, особенно в YOLO режиме; раскатить на большую организацию - совсем не тривиально. Для больших ребят есть enterprise лицензия, forward deployed engineers и все такое; для энтузиастов и компаний поменьше есть опенсорсная репа, которую можно развернуть в любом кластере.
Как я люблю шутить, моя главная роль в любом стартапе - это привлекать удачу, например, вот этот $10M series A, к которому я, конечно, отношения не имею. Зато теперь мне официально не придется ограничивать себя в токенмаксинге.
| 2 | Многие из вас видели заголовок Rewrite Bun in Rust has been merged или, возможно, читали пересказы в популярных каналах (1, 2).
Это сделанный агентом PR на 1 млн строк. Такие масштабы от меня далеки, но с похожими штуками я недавно ковырялся. Далеки - это в данном случае два порядка: получалось добиться успешной трансляции Typescript => Rust на 10к строк. Мои условия были в чем-то сложнее, чем в истории с Bun: тестовое покрытие значительно хуже, и волшебного Mythos у меня тоже не было, только Opus 4.6, GPT 5.4 и готовность сжигать миллионы токенов в дебатах между ними (как у nitpicker).
Этот эксперимент TS=>Rust не заработал с первой попытки, но ломался исключительно на границах - например, не идеально совпадали env var для докерфайла. Тот же харнесс пробовали применить и для более сложной/масштабной задачи, и там one shot работал еще хуже, но в основном тоже из-за сложности в интеграции и нехватки специфического контекста. Там пришлось двигаться итеративно, и каждая такая итерация подсвечивала новые пробелы в контексте, несовершенство тестов и бенчмарков.
В случае Bun отдельный вектор критики в том, что в Rust ветке примерно 10к вхождений unsafe в 700 файлах - "какой же это раст???". Не вижу в этом серьезной проблемы. Наверняка в этой миграции частью дизайна было "переносим все как есть строка в строку, а потом уже оптимизируем. Какое-то количество unsafe кода в рантайме практически неизбежно, и это окей - идиоматичный стиль не запрещает unsafe, а только рекомендует использовать его компактно, обернув в безопасный интерфейсы. Принцип make it work, make it right, make it fast никто не отменял, и снизить количество этих unsafe кусков тем же харнессом с моего дивана не представляется проблемой.
Rust was accidentally designed for AI-assisted development 10 years before anyone knew that mattered. И сложно представить, что может изменить эту траекторию. | 6 249 |
| 3 | Наблюдая одним глазом за внедрением кодинг агентов на разных уровнях в разных компаниях, я не могу ответить на один вопрос: зачем топ-менеджеры поддерживают (а иногда и форсят) политику, что менеджеры теперь всерьез должны коммитить код. Не тимлиды, а настоящие менеджеры менеджеров, часто директора и выше. Не только прототипы на коленке, но и прямо в основные репозитории.
На реддите воют, что такие директорские пуллреквесты в лучшем случае бесполезны. Типичный директор и так не страдает от безделия, у него есть возможность мультипликативно усилить свою команду. И даже самые умные из них обычно знают кишки проектов хуже рядовых разработчиков. Агенты - великие уравнители; и директор, и L4 гребец будут промптить примерно одинаково, только инженер, будучи в контексте проекта, с большей вероятностью отловит слоп до попадания в прод.
Я понимаю, что вайбкодить - особенно в первое время - может быть тупо интересно. Но где тут рациональное зерно, зачем делать из дорогих менеджеров посредственных IC? Пожалуйста, расскажите в комментариях, чего я не понимаю - не готов поверить, что на волне хайпа экзеки просто слетают с катушек. | 8 063 |
| 4 | Мне недавно написал Макс (ресерчер в tessl.io и автор канала @max_dot_sh) и спросил, планирую ли я что-то добавлять в nitpicker. Так я узнал про третью компанию, в которой инженеры всерьез используют мою поделку. Удачное совпадение: как раз на прошлой неделе добрался катнуть несколько изменений.
Во-первых, включил режим debate по умолчанию и подкрутил промпты, чтобы максимизировать adversarial аспект. Ожидаемо все стало еще медленнее.
Во-вторых, попробовав гонять nitpicker на больших проектах целиком вместо мелких пулл реквестов, я уткнулся в ограничения контекста: агент легко мог выжрать 200к+ токенов и упасть. Так что я добавил поддержку субагентов и сжатие контекста после отсечки. По совпадению, субагентов я добавил к релизу Kimi 2.6, которая специально обучена на активное их использование. Правда, еще Kimi регулярно заикалась, пытаясь вызывать одинаковые тулы по кругу, пришлось обмазывать костылями про loop detection.
В итоге машинка может сжечь под миллион токенов и 20 минут на ревью пулл реквеста на 500 строк, что вроде бы долго и дорого. С другой стороны, я проверил на нескольких настоящих живых проектах, и везде нашел какие-то пусть и не критичные, но достойные внимания баги или уязвимости. Люксовые конфиги типа opus 4.7 + gpt 5.5 работают лучше, но и на доступных китайских open weights моделях типа Kimi + GLM результат не полный слоп.
Это все еще вайбчек, а не бенчмарк - надеюсь как-нибудь найти время и померять системно. | 0 |
| 5 | Когда-то я писал про вакансию DL инженера у моих старых корешей из GRAI.fm🎵. Прошло 10 месяцев, и ребята пришли ко мне снова. Они подняли жирный seed раунд, и теперь им нужен еще один могучий ресерч инженер, чтобы обмазываться статьями про аудио и доводить их до продукта. На самом деле инженерный вакансий больше - например, нужен и человек про датку и MLOps.
Их СТО утверждает, что лучшие люди в их команду пришли именно из моего канала, так что не подведите и в этот раз, дорогие подписчики. | 0 |
| 6 | Семь лет назад я занимался AR примеркой обуви. Однажды к нам пришел один из VC партнеров и спросил: "а почему у вас в приложении нет allbirds? В Долине все только их и носят".
Процедура добавления новой модели предполагала покупку физической пары, потом их сканировали, делали фотограмметрию, а результат доводили до ума руками. Так на полке со скопившейся обувью осталась пара allbirds ровно моего размера, и при увольнении мне ее подарили.
С тех пор я стоптал пар пять этих прекрасных кроссовок разных цветов, они подходили мне идеально. И вот эпоха ушла: allbirds официально переключаются с обуви на GPU инфраструктуру. Раньше мы нагружали видеокарты, чтобы рендерить их кроссовки, теперь они сами будут продавать GPU-часы. | 0 |
| 7 | Слово harness стало резко популярным в моем пузыре (кстати, отличный глубокий обзор про то, что это вообще такое и зачем). И когда из single agent подходов стало тяжелее выжимать заметный буст, все стали смотреть на мультиагентные конфигурации.
Я и сам немного экспериментирую с переменным успехом (первая выжившая версия едва ли была полезнее обычного клодкода, nitpicker - тоже один из экспериментов; остальное в закрытой репе, но идейно близко к этому свежему посту от Anthropic).
Есть направление про agentic swarms / teams, в котором агенты как-то сотрудничают, делегируют, наделяются разными ролями и вообще ведут себя антропоморфно. Некоторые проекты из этой категории удивительно кринжовые, например, Gastown - не хватало еще, чтобы агенты собирались в гильдии и ходили в рейды.
Есть направление, в котором тонкое взаимодействие заменяется брутфорсом, циклами и умеренно наивной валидацией: это и моментально ставший классическим эксперимент про компилятор C от Антропика, и подходы на базе Ralph Loop. Дорогие агенты, делайте что хотите, но будете перемножать матрицы, пока тесты и AI ревью не пройдут.
Мне интутивно кажется, что второй подход ближе к прикладному применению. Все эти антропоморфные идеи и ролевой скевоморфизм чем-то напоминают попытки улучшать современные нейросети, отталкиваясь от строения синапсов. Я предпочитаю map reduce как дефолтный подход к параллелизации, а не заклинания "этот агент будет вести себя как senior frontend developer, а этот - staff UX designer". Люди вынуждены делиться по компетенциям, потому что у нас недостаточно общего претрейна. У агентов он есть, потому их нужно структурировать в графы по данным / задачам, а не по человекочитаемым тайтлам.
С другой стороны, Anthropic сделал свои teams отчасти антропоморфными. Китайские open weight провайдеры тоже вкручивают agent teams нативно в обучение (см kimi 2.5, minimax 2.7). И несмотря на то, что существующие claude agent teams никому пока не нравятся, победит, конечно, тот подход, который затюнят на посттрейне. Повторюсь: we can't fight gradient descent. | 0 |
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
