partially unsupervised

Відкрити в Telegram

@arsenyinfo пишет про software engineering и machine learning

Росія66 067Категорія не вказана

9 812

Підписники

+1324 години

+1377 днів

+17330 день

10 781

Перегляди допису

~ 8 26524 години

~ 6 39148 годин

109.97%

Коефіцієнт залучення

Немає даних

Дописів на день

Ads index

beta

Триває завантаження даних...

Схожі канали

Агенты ИИ | AGI_and_RL

3.1K

Варим МЛ

Більше каналів

Хмара тегів

Немає даних

Виникли проблеми? Будь ласка, оновіть сторінку або зверніться до нашого support-менеджера.

Вхідні та вихідні згадування

---

Залучення підписників

липень '26

+155

в 4 каналах

червень '26

+95

в 3 каналах

Get PRO

травень '26

+61

в 1 каналах

Get PRO

квітень '26

+71

в 4 каналах

Get PRO

березень '26

+110

в 4 каналах

Get PRO

лютий '26

+94

в 3 каналах

Get PRO

січень '26

+76

в 2 каналах

Get PRO

грудень '25

+222

в 2 каналах

Get PRO

листопад '25

+59

в 3 каналах

Get PRO

жовтень '25

+84

в 3 каналах

Get PRO

вересень '25

+208

в 9 каналах

Get PRO

серпень '25

+167

в 3 каналах

Get PRO

липень '25

+457

в 9 каналах

Get PRO

червень '25

+224

в 6 каналах

Get PRO

травень '25

+350

в 5 каналах

Get PRO

квітень '25

+456

в 10 каналах

Get PRO

березень '25

+140

в 4 каналах

Get PRO

лютий '25

+179

в 4 каналах

Get PRO

січень '25

+266

в 10 каналах

Get PRO

грудень '24

+59

в 4 каналах

Get PRO

листопад '24

+62

в 0 каналах

Get PRO

жовтень '24

+102

в 1 каналах

Get PRO

вересень '24

+160

в 4 каналах

Get PRO

серпень '24

+134

в 0 каналах

Get PRO

липень '24

+730

в 2 каналах

Get PRO

червень '24

+76

в 1 каналах

Get PRO

травень '24

+145

в 3 каналах

Get PRO

квітень '24

+88

в 1 каналах

Get PRO

березень '24

+140

в 3 каналах

Get PRO

лютий '24

+266

в 3 каналах

Get PRO

січень '24

+297

в 0 каналах

Get PRO

грудень '23

+106

в 1 каналах

Get PRO

листопад '23

+90

в 1 каналах

Get PRO

жовтень '23

+93

в 0 каналах

Get PRO

вересень '23

+145

в 0 каналах

Get PRO

серпень '23

+197

в 0 каналах

Get PRO

липень '23

+264

в 0 каналах

Get PRO

червень '23

+165

в 0 каналах

Get PRO

травень '23

+1 601

в 0 каналах

Get PRO

квітень '23

+246

в 0 каналах

Get PRO

березень '23

+217

в 0 каналах

Get PRO

лютий '23

+75

в 0 каналах

Get PRO

січень '23

+73

в 0 каналах

Get PRO

грудень '22

+130

в 0 каналах

Get PRO

листопад '22

+47

в 0 каналах

Get PRO

жовтень '22

+37

в 0 каналах

Get PRO

вересень '22

+60

в 0 каналах

Get PRO

серпень '22

+182

в 0 каналах

Get PRO

липень '22

+72

в 0 каналах

Get PRO

червень '22

+147

в 0 каналах

Get PRO

травень '22

+326

в 0 каналах

Get PRO

квітень '22

+386

в 0 каналах

Get PRO

березень '22

+91

в 0 каналах

Get PRO

лютий '22

+861

в 0 каналах

Get PRO

січень '22

+68

в 0 каналах

Get PRO

грудень '21

+171

в 0 каналах

Get PRO

листопад '21

+77

в 0 каналах

Get PRO

жовтень '21

+71

в 0 каналах

Get PRO

вересень '21

+112

в 0 каналах

Get PRO

серпень '21

+292

в 0 каналах

Get PRO

липень '21

+38

в 0 каналах

Get PRO

червень '21

+75

в 0 каналах

Get PRO

травень '21

+11

в 0 каналах

Get PRO

квітень '21

+40

в 0 каналах

Get PRO

березень '21

+25

в 0 каналах

Get PRO

лютий '21

+11

в 0 каналах

Get PRO

січень '21

+21

в 0 каналах

Get PRO

грудень '20

+773

в 0 каналах

Дата	Залучення підписників	Згадування	Канали
09 липня	0
08 липня	+10
07 липня	+14
06 липня	+79
05 липня	+49
04 липня	0
03 липня	0
02 липня	+3
01 липня	0

Дописи каналу

Давние читатели канала помнят, что когда-то в древние времена мы с Валерой написали книжку про ML design. Это было так давно, что люди тогда умели не только читать по диагонали, но еще иногда писать, а книги были значимым артефактом для упаковки знаний. С тех пор утекло немало воды, работу делают агенты, и книгам они предпочитают скиллы. И вот мы с клодом наконец добрались перепаковать одно в другое: ML system design в форме скилла с набором рубрик для ревью. Устанавливается одной командой через skills.sh, умеет ревьювить дизайн-доки и ML проекты лучше агента из коробки и ~~чесать нам эго~~ ненавязчиво ссылаться на авторов как могучих авторитетов.

2	☭ https://sovietrxiv.org ☭ Самое время идти к VC с питчем: "Ивахненко и Вапник - два моих деда, нашел их записные книжки на даче, дайте миллиард"	15 443
3	Самая недохайпованная AI лаба тоже верит в будущее за оркестрацией доступных модей. Frontier-level performance without single-vendor dependency. > Our Fugu models surpass publicly accessible frontier models and are shoulder-to-shoulder with Fable 5 and Mythos Preview in various rigorous engineering, scientific, and reasoning benchmarks while delivering frontier capability without the risk of export controls. Как обычно, европейцам без впна можно только почитать репорт.	6 311
4	История с закрытием доступа к Fable - повод тянуться за шампанским в офисах провайдеров открытых моделей. Каждый executive, который участвовал во внедрении AI в своей организации (т.е. просто каждый executive), резко задумался: "А что и кому они внезапно отключат в следующий раз?". Все страхи про вендорлок материализовались мгновенно, даже если конкретно в этой компании Fable и не начали использовать, да и не планировали. И поэтому все мультивендорные альтернативы резко заиграли новыми красками. Во-первых, бигтехи, перепродающие много моделей под своей крышей (AWS Bedrock, Databricks Unity AI Gateway, Cursor в случае кодинг агентов). Но это полумера, все еще сильная зависимость от топовых лаб. Потому есть и во-вторых: выбрать что-то с open weights, как раз ключевые игроки в этой нише недавно выкатили свежие релизы (Minimax 3, Kimi 2.7, GLM 5.2). Сменить провайдера в таком сетапе совершенно не проблема. Где-то тут еще витают страхи, что токены в обозримом будущем подорожают, чтобы отбивать венчурные сотни миллиардов, кодинг агенты по подписке снизят лимиты / перестанут быть доступны для корпораций. В общем, беспокойное время для менеджеров, хорошее время делать vendor-agnostic платформы. Openrouter идеально подгадал по времени и выкатил fusion ендпоинт, из которого неспециалист достанет только один тейк - "микс из моделей попроще работает не хуже топовой модели". Воспитанные кагглом люди помнят, что ансамбли слабо скоррелированных моделей - универсальный молоток. Дьявол все еще в деталях, универсального способа блендить LLM пока не видно, хотя для частных случаев что-то придумать можно. — Именно для этих экспериментов я в свое время и сделал nitpicker - чтобы вайбчекать варианты бленда моделей, пытаясь получить близкое к tier-1 качество, используя tier-2 модели (впрочем, никто не мешает жечь и токены опуса/gpt). Для тех, кому лень ставить незнакомый софт, сделал бесплатную веб-версию. Ограничения: одно ревью на всех в момент времени, работает только с публичными PR на гитхабе, те самые tier-2 модели, аптайм не гарантирован (хостится у меня под теликом).	8 426
5	Личный карьерный апдейт: третью неделю работаю в archestra.ai, моя задача - тащить современный агентский слой в широком смысле слова. Иными словами, вернулся к позиции "писать в меру экспериментальный опенсорс за деньги". Снова работать в команде из семи человек после недолгого захода в бигтех - кайф. Archestra - security-first инфра платформа для агентов. Запустить openclaw-like агента локально несложно, особенно в YOLO режиме; раскатить на большую организацию - совсем не тривиально. Для больших ребят есть enterprise лицензия, forward deployed engineers и все такое; для энтузиастов и компаний поменьше есть опенсорсная репа, которую можно развернуть в любом кластере. Как я люблю шутить, моя главная роль в любом стартапе - это привлекать удачу, например, вот этот $10M series A, к которому я, конечно, отношения не имею. Зато теперь мне официально не придется ограничивать себя в токенмаксинге.	7 472
6	Многие из вас видели заголовок Rewrite Bun in Rust has been merged или, возможно, читали пересказы в популярных каналах (1, 2). Это сделанный агентом PR на 1 млн строк. Такие масштабы от меня далеки, но с похожими штуками я недавно ковырялся. Далеки - это в данном случае два порядка: получалось добиться успешной трансляции Typescript => Rust на 10к строк. Мои условия были в чем-то сложнее, чем в истории с Bun: тестовое покрытие значительно хуже, и волшебного Mythos у меня тоже не было, только Opus 4.6, GPT 5.4 и готовность сжигать миллионы токенов в дебатах между ними (как у nitpicker). Этот эксперимент TS=>Rust не заработал с первой попытки, но ломался исключительно на границах - например, не идеально совпадали env var для докерфайла. Тот же харнесс пробовали применить и для более сложной/масштабной задачи, и там one shot работал еще хуже, но в основном тоже из-за сложности в интеграции и нехватки специфического контекста. Там пришлось двигаться итеративно, и каждая такая итерация подсвечивала новые пробелы в контексте, несовершенство тестов и бенчмарков. В случае Bun отдельный вектор критики в том, что в Rust ветке примерно 10к вхождений unsafe в 700 файлах - "какой же это раст???". Не вижу в этом серьезной проблемы. Наверняка в этой миграции частью дизайна было "переносим все как есть строка в строку, а потом уже оптимизируем. Какое-то количество unsafe кода в рантайме практически неизбежно, и это окей - идиоматичный стиль не запрещает unsafe, а только рекомендует использовать его компактно, обернув в безопасный интерфейсы. Принцип make it work, make it right, make it fast никто не отменял, и снизить количество этих unsafe кусков тем же харнессом с моего дивана не представляется проблемой. Rust was accidentally designed for AI-assisted development 10 years before anyone knew that mattered. И сложно представить, что может изменить эту траекторию.	6 312
7	Наблюдая одним глазом за внедрением кодинг агентов на разных уровнях в разных компаниях, я не могу ответить на один вопрос: зачем топ-менеджеры поддерживают (а иногда и форсят) политику, что менеджеры теперь всерьез должны коммитить код. Не тимлиды, а настоящие менеджеры менеджеров, часто директора и выше. Не только прототипы на коленке, но и прямо в основные репозитории. На реддите воют, что такие директорские пуллреквесты в лучшем случае бесполезны. Типичный директор и так не страдает от безделия, у него есть возможность мультипликативно усилить свою команду. И даже самые умные из них обычно знают кишки проектов хуже рядовых разработчиков. Агенты - великие уравнители; и директор, и L4 гребец будут промптить примерно одинаково, только инженер, будучи в контексте проекта, с большей вероятностью отловит слоп до попадания в прод. Я понимаю, что вайбкодить - особенно в первое время - может быть тупо интересно. Но где тут рациональное зерно, зачем делать из дорогих менеджеров посредственных IC? Пожалуйста, расскажите в комментариях, чего я не понимаю - не готов поверить, что на волне хайпа экзеки просто слетают с катушек.	8 063
8	Мне недавно написал Макс (ресерчер в tessl.io и автор канала @max_dot_sh) и спросил, планирую ли я что-то добавлять в nitpicker. Так я узнал про третью компанию, в которой инженеры всерьез используют мою поделку. Удачное совпадение: как раз на прошлой неделе добрался катнуть несколько изменений. Во-первых, включил режим debate по умолчанию и подкрутил промпты, чтобы максимизировать adversarial аспект. Ожидаемо все стало еще медленнее. Во-вторых, попробовав гонять nitpicker на больших проектах целиком вместо мелких пулл реквестов, я уткнулся в ограничения контекста: агент легко мог выжрать 200к+ токенов и упасть. Так что я добавил поддержку субагентов и сжатие контекста после отсечки. По совпадению, субагентов я добавил к релизу Kimi 2.6, которая специально обучена на активное их использование. Правда, еще Kimi регулярно заикалась, пытаясь вызывать одинаковые тулы по кругу, пришлось обмазывать костылями про loop detection. В итоге машинка может сжечь под миллион токенов и 20 минут на ревью пулл реквеста на 500 строк, что вроде бы долго и дорого. С другой стороны, я проверил на нескольких настоящих живых проектах, и везде нашел какие-то пусть и не критичные, но достойные внимания баги или уязвимости. Люксовые конфиги типа opus 4.7 + gpt 5.5 работают лучше, но и на доступных китайских open weights моделях типа Kimi + GLM результат не полный слоп. Это все еще вайбчек, а не бенчмарк - надеюсь как-нибудь найти время и померять системно.	0
9	Когда-то я писал про вакансию DL инженера у моих старых корешей из GRAI.fm🎵. Прошло 10 месяцев, и ребята пришли ко мне снова. Они подняли жирный seed раунд, и теперь им нужен еще один могучий ресерч инженер, чтобы обмазываться статьями про аудио и доводить их до продукта. На самом деле инженерный вакансий больше - например, нужен и человек про датку и MLOps. Их СТО утверждает, что лучшие люди в их команду пришли именно из моего канала, так что не подведите и в этот раз, дорогие подписчики.	0
10	Семь лет назад я занимался AR примеркой обуви. Однажды к нам пришел один из VC партнеров и спросил: "а почему у вас в приложении нет allbirds? В Долине все только их и носят". Процедура добавления новой модели предполагала покупку физической пары, потом их сканировали, делали фотограмметрию, а результат доводили до ума руками. Так на полке со скопившейся обувью осталась пара allbirds ровно моего размера, и при увольнении мне ее подарили. С тех пор я стоптал пар пять этих прекрасных кроссовок разных цветов, они подходили мне идеально. И вот эпоха ушла: allbirds официально переключаются с обуви на GPU инфраструктуру. Раньше мы нагружали видеокарты, чтобы рендерить их кроссовки, теперь они сами будут продавать GPU-часы.	0

Переглянути всі дописи