Pavel Zloi

Відкрити в Telegram

директор ИИ · инженер‑интегратор https://github.com/EvilFreelancer 20 лет в IT ∈ 10 лет в разработке ∈ 3 года в ML/AI ∈ 1 год - вайбмастер Бусти: https://boosty.to/evilfreelancer Пожертвования: https://pay.cloudtips.ru/p/937f48ac

Росія134 987 Технології та додатки21 700

3 968

Підписники

+2124 години

+777 днів

+25830 день

3 013

Перегляди допису

~ 1 06624 години

~ 1 14748 годин

75.95%

Коефіцієнт залучення

~ 1

Дописів на день

Ads index

beta

Триває завантаження даних...

Схожі канали

AI Experience Exchange

Більше каналів

Вхідні та вихідні згадування

---

Залучення підписників

липень '26

в 0 каналах

червень '26

+291

в 12 каналах

Get PRO

травень '26

+282

в 12 каналах

Get PRO

квітень '26

+465

в 9 каналах

Get PRO

березень '26

+428

в 16 каналах

Get PRO

лютий '26

+181

в 8 каналах

Get PRO

січень '26

+366

в 8 каналах

Get PRO

грудень '25

+126

в 7 каналах

Get PRO

листопад '25

+195

в 7 каналах

Get PRO

жовтень '25

+118

в 5 каналах

Get PRO

вересень '25

+96

в 3 каналах

Get PRO

серпень '25

+140

в 4 каналах

Get PRO

липень '25

+112

в 8 каналах

Get PRO

червень '25

+91

в 7 каналах

Get PRO

травень '25

+191

в 5 каналах

Get PRO

квітень '25

+95

в 6 каналах

Get PRO

березень '25

+168

в 3 каналах

Get PRO

лютий '25

+44

в 1 каналах

Get PRO

січень '25

+140

в 5 каналах

Get PRO

грудень '24

+60

в 4 каналах

Get PRO

листопад '24

+32

в 1 каналах

Get PRO

жовтень '24

+40

в 1 каналах

Get PRO

вересень '24

+63

в 1 каналах

Get PRO

серпень '24

+35

в 0 каналах

Get PRO

липень '24

+35

в 1 каналах

Get PRO

червень '24

+47

в 0 каналах

Get PRO

травень '24

+52

в 1 каналах

Get PRO

квітень '24

+38

в 2 каналах

Get PRO

березень '24

+37

в 0 каналах

Get PRO

лютий '24

+46

в 0 каналах

Get PRO

січень '24

+71

в 0 каналах

Get PRO

грудень '23

+147

в 2 каналах

Get PRO

листопад '23

+354

в 2 каналах

Дата	Залучення підписників	Згадування	Канали
01 липня	+2

Дописи каналу

Repost from Константин Доронин

Запись стрима "Что же такое harness?". Ссылка на YouTube: https://www.youtube.com/watch?v=QAxejH-KNak Стрим получился полезным, с примерами на практике. Большое спасибо, Паша, что согласился прийти! Таймкоды доступны как на YouTube, так и прямо в Telegram: 00:00 — Вступление 07:12 — О чём этот стрим? 09:31 — Что такое harness? 17:10 — Откуда появился термин «harness»? 23:20 — Виды harness 26:20 — Анатомия harness 34:28 — Вопросы от зрителей 35:20 — Что такое Skill? 39:10 — Чем harness отличается от guardrails? 44:30 — Можно ли использовать harness в продакшене банка? 49:43 — Чем harness отличается от scaffolding? 53:05 — Агент Coddy на практике 54:45 — Как harness может быть заточен под модель? На примере Coddy 59:03 — Как Coddy обрабатывает запрос? 1:00:30 — Пример работы Agent Loop 1:03:30 — 30 инструментов для on-prem-модели 1:06:15 — Работа с schedule-задачами 1:08:50 — Работа в режиме Plan 1:12:20 — Заставляем OSS-120B работать по SSH 1:14:20 — Проблемы on-prem-моделей с мультиязычностью 1:16:40 — Как работают Agent Skills? 1:21:30 — Протокол ACP на примере интеграции с Obsidian 1:31:10 — HTTP API в Coddy 1:36:50 — Уроки и грабли при создании собственного harness 1:48:00 — Готовые фреймворки для создания harness 1:50:06 — Принципы построения агентов на базе harness и отличие от AI-агентных фреймворков 1:53:55 — Harness работает только через API или поддерживает подписки Claude и Codex? 1:55:55 — Инструменты для экономии токенов 2:00:30 — Как патчить Hermes и Claude Code? 2:03:09 — Мониторинг качества harness Полезные ссылки со стрима: 1. Презентация – использовать как полезную шпаргалку по harness 2. Coddy – harness, который создал Паша 3. Pi – минималистичный harness 4. Hermes – качественно-сделанный harness, который умеет доделывать самого себя 5. OpenClaw = Hermes+страдания (для ценителей) Подписывайтесь на каналы участников трансляции: Павел Рыков Константин Доронин p.s.: Под конец стрима у меня немного отвалился звук. Прошу понять и простить – я всё ещё в процессе дрессировки OBS.

2	Список фейлов произошедших на стриме: - [x] человек-сосед с дрелью - [x] забыть текст который репетировал - [x] не сохранить слайды с правильным текстом - [x] забыл определение слова - [x] человек-сосед с дрелью - [x] волнение - [x] человек-сосед с дрелью - [x] баги в демке - [x] человек-сосед с дрелью	1 174
3	Мы начинаем наш стрим "Что же такое Harness?" Подключайтесь по ссылке: https://youtube.com/live/IvTYyABCQxo?feature=share	1 114
4	Менее чем через час, в 17:00 MSK, начинаем стрим про harness.	1 275
5	Да кто такой этот ваш harness? Свершилось! Я позвал на следующий стрим человека, который уже дважды был упомянут на предыдущих (тут и тут). В понедельник, 29 июня, в 17:00 по Мск (GMT+3) мы с Пашей Рыковым проведём трансляцию на тему "Что же такое harness?". Обсудим как само понятие, так и внутреннее устройство harness. На стриме запустим harness, разработанный Пашей (его зовут Coddy), и посмотрим, как он работает. В конце будет обязательный блок вопросов из чата и комментариев к этому посту. Стрим пройдёт на моём YouTube-канале. Добавить событие в Google-календарь можно по ссылке. Подключайтесь. Будет интересно!	1 553
6	Прочёл: https://openai.com/index/previewing-gpt-5-6-sol/ Увидел: During the preview, GPT‑5.6 models will initially be available through the API and Codex to a select group of trusted partners and organizations. Сочинил: Мимо нейроинфополя я без шуток не хожу, То агент в окно засуну, то модельку покажу. Хопа, хопа срослись модель и харнес, Этого не может быть фейбл скоро должен быть.	1 699
7	По мотивам больших обсуждений темы нейрослопа запилил на Хабр свеженький пост. В нём тезисно собрал мои мысли о том, что меня раздражает в нейрослопе, как его выявлять и как вычищать. Желаю приятного прочтения!	1 586
8	/goal это тема На этих выходных у меня по плану была обкатка новинки /goal, которую решил поюзать через ClaudeCode, канва такая, у меня на работе через сеть нельзя получить доступ к рабочей почте, и приходится изобретать всякие костыли типа outlook-pst-mcp сервера, подробнее тут. Но вместе с почтой у меня нет прямого доступа и к календарю событий ical, а я бы хотел эту историю себе настроить, чтобы быть в курсе рабочих событий не только на компе, но и на мобилке. Благо с недавних пор там настроен экспорт событий календаря в корпоративный чатику Dion (аналог Slack), а это значит, можно изучить документацию по апишке, натравить агента на неё и разобраться с протоколом. Сижу, рефлексирую свой рефлексатор, прикидываю, как это всё запланировать и реализовать по уму. По-хорошему надо писать подробный план, архитектуру, затем делать /rpa-gen-rules и потом по юз-кейсам направлять агента через /rpa-feat на каждую фичу по отдельности. Но мне что-то таааак лень стало, потому как по прикидкам и прошлому опыту ресёрч протокола, составление плана, реализация и так должны занять примерно пару часов пинания ИИшницы. И тут я вспомнил про /goal, решил не мудрствовать лукаво и описать план работ, что и как делать, агенту через эту команду, получился такого вида промт: /goal Мне нужно сделать штуку которая будет способна получить данные из календаря (определить какие из них повторяющиеся) и правильно формировать ical-файлик, который можно было бы использовать в любом календаре. Для начала поищи информацию про работу с API Dion VC. Посмотреть мой календарь можно тут: https://dion.vc/calendar Ты сможешь сделать это через yandex-браузер, там я уже авторизовался, бери оттуда кукисы и токены для ресёрча. Помимо этого есть уже установленный Dion на моей локальной машине, авторизованный профиль тут: /home/pasha/.config/Dion Само по себе приложение Dion - это Electron-апп (браузер в котором запущен сайт-приложение), которое ходит через API на удалённый сервер. Твоя задача реализовать API-сервер который будет отдавать ical запрашивая данные из Dion через API, после того как соберёшь спецификации и продумаешь архитектуру выполни /rpa-gen-rules, далее используй /rpa-feat под каждую отдельную фичу. По итогу я хочу иметь протестированный и рабочий API-сервер, Dockerfile и docker-compose.yaml (плюс .env.example), readme с подробной инструкцией что это за сервер, для чего он нужен, как пользоваться, как тестировать и как запустить вручную и через docker. Клодкод примерно 15 минут выполнял подготовительный этап, сначала полез читать доку про Dion API, затем через линуксовые тулы изучал конфиги Dion в домашней папке, нашёл профиль Yandex-браузера, вытащил из него кукисы, закинул их в тестовый профиль Playwright, потом через Playwright MCP запустил браузер и пошёл изучать апишку. После чего агент составил такой вот план, в котором первые три пункта были уже отмечены как выполненные, и начал его делать: - [x] Research Dion calendar API, auth, recurrence model - [x] Clean up browser session + temp secrets; prepare sanitized test fixtures - [x] Decide stack + write SPEC.md project brief - [ ] /rpa-gen-rules: generate agent project rules - [ ] /rpa-feat: domain model + recurrence detection (innermost layer) - [ ] /rpa-feat: iCal serialization - [ ] /rpa-feat: Dion API client + token refresh - [ ] /rpa-feat: HTTP API server (/calendar.ics, /healthz) - [ ] Dockerfile, docker-compose.yaml, .env.example - [ ] README with full instructions - [ ] Run full test suite + verify working end-to-end Стек агент выбрал тривиальный, python, fastapi, pydantic, httpx и icalendar. Если бы я делал это руками сам, то взял бы ровно то же самое. Потом начал целенаправленно реализовывать фичи шаг за шагом, под конец выполнил автоматические и ручные тесты, выдал мне ical-файл и отрапортовал о проделанной работе. Самое интересное, что единственная по-настоящему нетривиальная часть всплыла сама. Оказалось, Dion в апишке вообще не отдаёт правила повторений (никаких RRULE), а возвращает каждое повторяющееся событие отдельной записью с флажком repetitive. Выгрузишь как есть, получишь рабочий, но раздутый календарь с кучей дублей, да ещё и отменённые встречи будут торчать призраками. Я это обозначил одной скобочкой в промте, а агент сам развернул в полноценное восстановление серий, группирует события по названию, организатору, времени и длительности и собирает повторения обратно. Вдобавок сделал два режима, expanded (по событию на каждое повторение, всегда корректно) и collapsed (схлопывает серию в одно событие с выведенным RRULE). В итоге получился рабочий API-сервер с ручками /calendar.ics и /healthz, 48 зелёных тестов (сеть замокана через respx, так что гоняются без интернета), Dockerfile, docker-compose, .env.example и подробный readme. Плюс по дороге /rpa-gen-rules сгенерил правила проекта сразу под два агента, Cursor и Claude Code, и держит их в синхроне. Теперь просто подписываюсь на этот ics-фид в Nextcloud и вижу рабочие встречи с мобилки, в Kontact и в Nextcloud. Я ещё потестирую /goal на других проектах, но похоже, что в сочетании с уже готовыми скилами эта штука прям идеально под ваншотники будет заходить, что потенциально позволяет сократить ваншотинг со 120 минут (Валера, привет) до меньших значений. Исходники тут: https://github.com/EvilFreelancer/dion-calendar Всем бобра. #МесяцАгентности	2 236
9	Встречайте новый пост "Почём нынче токен для народа?" на Хабре, в котором я попытался составить формулу расчёта нижней границы цены токена используя стоимость электроэнергии и амортизацию оборудования. В посте вас ожидает формулы, расчёты на примере модели GPT-OSS-120B запущенной на сервере NeuralDeep и сравнение с другими вендорами. PS. По мотивам статьи запилил скил token-cost, с ним вы сможете попробовать выполнить расчёты на своём железе. #МесяцАгентности	2 114
10	Вещаю про Coddy Agent на Podlodka Вчера выступил с небольшим докладом (слайды презентации тут) про Coddy Agent на площадке Podlodka. Если вам захочется задать вопросы про мой проект, то не стесняйтесь, буду рад ответить. Видос кстати с вебкой, закинул его на бусти, желаю приятного просмотра!	2 044
11	Правило BDD которое мы с коллегами вывели: Если запрос на функционал (или багфикс) приходит от бизнеса то мы заводим feature-тест огуречного формата. Если же надо накидать edge-кейсов разных для этой фичи, то делаем unit-тесты.	2 129
12	Любопытна новость, для тех кому лень читать: SpaceX купили Cursor за $60 миллиардов. Из этого можно сделать следующие выводы: 1. В курсор добавят грок (без цензуры и ограничений) 2. Развитие грок должно ускориться (так как его обучат на дистил датасетах собранных курсором за три года) 3. Формирование ядра монопольного рынка судя по всем завершено, итого у нас будут: Anthropic, OpenAI и SpaseX (так как f**k похоже самоустранись) 4. Поднимут цены, потом что 60 миллиардов надо как-то отбивать Мне кажется, что одним из изменений которое добавят в курсор - это отказ от моделей конкурентов, но не сразу, чтобы не распугать нород, а спустя пару месяцев, как грок дообучат.	2 472
13	Намечается новый спор между исполнителем и заказчиком: кто заберет себе профит от внедрения ИИ Недавно в переговорах заказчик уже откровенно попросил скидку на основании того, что: «Ну теперь же всё стало проще с первичным анализом, меньше человеко-часов, рутина автоматизирована...». Клиент хочет скидку на основании того, что ИИ упростил жизнь исполнителя, но не учитывает затраты времени и денег на внедрение этого ускорения 🧱Но, что есть, то есть - дорогой «первый слой» работы дешевеет, и клиенты будут отказываться платить за него как раньше. Кто-то уловил эту тенденцию и уже бесплатно или условно бесплатно предлагает первичный анализ. Например, платформа от консалтинговой компании WestMonroe.ai с бесплатными ИИ-агентами. Руководство пошло на такой шаг, так как сами признают, что стратегический анализ, стоивший миллионы, теперь имеет стоимость близкую к нулю Такая откровенность подкупает клиентов. На этом фоне теневой ИИ в отношении клиентов становится опасным путем и может подорвать доверие и долгосрочное сотрудничество Спасибо "Вайбкодингу" часть клиентов уже приходят подготовленные и им уже не нужно с нуля , а важнее - доведение до ума, проверка, усиление, безопасность, одним словом довести их сырой продукт до совершенства 👤Типы Заказчиков (можно назвать по своему) Запрещающие: ИИ под запретом из-за безопасности или регуляторики. Только закрытый контур. Экономные: сразу ждут дисконт, так как «рутина стала быстрее» Контролирующие: им важен процесс - какие инструменты применяли, кто проверял и кто утвердил финальную версию ____ Ценообразование будет строиться по принципу: рутина уйдет в фикс или станет бесплатной. Проверка и сложные действия (суды, переговоры, внедрение) подорожают. Суждение, критическое мышление и опыт как и прежде в цене ❗️Не рискуйте доверием клиентов, лучше описать клиенту, что сделала модель, что проверил человек и почему цена именно такая. Скоро будем в договоре это прописывать. Прецеденты уже есть. Есть тендеры, где одним из критериев выбора для заказчика выступает описание исполнителем связки ИИ с экспертами Эпоха дорогой продажи «первого слоя» работы уходит. Деньги смещаются в опыт, доверие и способность довести решение до результата. Остальное клиент попытается забрать себе в виде скидки —	1 902
14	Мысль про дорожающие токены фронтирных моделей. Думаю, мы скоро увидим процессы, когда компании будут судиться с сотрудниками за инди-софт, созданный на токены компании.	1 827
15	Так ну если на мои решения снимают уже рилсы, и сами, без приглашения, значит мы точно что-то правильное делаем с вами! 🔥 https://www.instagram.com/reel/DZfcqCBoaMA/?igsh=MWx3ajIzY3FmbDF1Nw== А мы с вами не забываем база скиллов живет тут https://neuraldeep.ru/skills	1 818
16	Эпоха дешёвого AI походу того, тютю В апреле я писал, что цены на модели будут расти по мере того как бизнес всё сильнее и сильнее будет начинать зависеть от агентов и языковых моделей. И вот июнь похоже подтверждает мою гипотезу пачкой новостей. Как по мне слишком быстро всё это происходит, я полагал что сильный рост цен будет не раньше 27го года, но возможно то что мы сейчас наблюдаем - только цветочки. Те самые новости Anthropic с 15 июня выводит programmatic-нагрузку в отдельный пул Agent SDK credits. Pro за $20 получает $20 кредитов, Max 20x - $200. Чат и Claude Code в терминале остаются в подписке, а вот claude -p, CI, сторонние харнесы и всё что крутится в agent loop - уже по API-тарифам внутри этого пула. Кредиты не копятся, перерасход только если включить extra usage. До этого Anthropic запретила OAuth от consumer-подписок в OpenClaw и прочих сторонних агентах, а в апреле usage из харнесов уехал в extra usage. OpenAI тоже крутила тарифную сетку, только раньше. Со 2 апреля Codex у Plus, Pro и Business перешёл с биллинга "за сообщение" на списание по токенам. Business seat подешевел с $25 до $20, зато тяжёлый agentic usage теперь ест API credits внутри подписки. "Сколько угодно за фикс" закончилось. С 23 апреля то же добрали до Enterprise. OpenAI сама оценивает Codex в $100-200 на разработчика в месяц при активном использовании, разброс огромный. GitHub Copilot с 1 июня перешёл на usage-based billing. Цена Pro не изменилась ($10), но теперь это $10 GitHub AI Credits, которые жрёт каждый токен в чате и agent mode. Быстрый вопрос и многочасовая автономная сессия раньше стоили одинаково, GitHub это терпел, теперь нет. Автокомплит по-прежнему безлимитный, зато fallback на дешёвую модельку после исчерпания квоты убрали. На фоне этого DeepSeek пошёл в другую сторону, модель V4-Pro вышла в апреле по $1.74/$3.48 за 1M, а позже скидку 75% сделали постоянной - сейчас $0.435/$0.87. Flash по-прежнему $0.14/$0.28. Китайцы давят ценой, пока западные режут безлимиты. Ну а Qwen наоборот закрыл Coding Plan Lite для новых подписчиков 20 марта, свежему аккаунту остаётся Pro за $50/мес. Старые на Lite продлевают, но дешёвый вход в их экосистему для новичков исчез. Coding Plan вообще уезжает в Token Plan. Теперь про Fable 5 9 июня Anthropic выпустила топовую модель для всех подписчиков, при этом она топовая не только по бенчмаркам, но и по факту, хотя местами любила срезать острые углы. Спустя пару дней, 12 июня доступ к Fable был закрыт для всех пользователей, из-за экспортных ограничений правительства США. Точнее там более занятная формулировка: моделью нельзя пользоваться иностранным гражданам, внутри или за пределами страны. У меня есть несколько гипотез почему так произошло, но самая вероятная на мой взгляд в том, что последние два года боссы ИИ-компаний, в том числе и Амодей, рассказывали страшилки про агентов и нейросети, способные взломать что угодно и выйти за пределы песочницы, и просили государство срочно начать регулировать сферу. И вот, когда желаемое стало реальностью, что-то как-то приуныли. Чтобы не терять прибыль, полагаю Anthropic всё же добавят валидацию профилей пользователей, что-то типа сканирования лица на фоне паспорта как у "анонимных" криптобирж, учётки Apple или банков. Это в свою очередь приведёт к искусственной монополизации из-за замыкания на жителей Штатов и сокращению пользовательской базы (и конечно же созданию неофициального рынка валидированных профилей). В результате чего Anthropic придётся поднимать цены, а вслед за Anthropic потянутся и все остальные. Резюмируя Если сложить всё это, картина получается прелюбопытнейшая. Вендоры изо всех сил делают вид, что больше не могут "субсидировать" agentic-нагрузку из фиксированной подписки за $10-200. Бесконечные циклы с tool calling, ретраями, длинным контекстом и reasoning якобы утилизируют GPU так, что экономика ломается. Прибавим сюда госрегулирование и насаждение искусственных монополий. Что будет дальше? Подписочная модель никуда не денется, но "заплатил $20 и забыл" для агентов вероятно умрёт. Скорее всего будет гибрид - фикс за чат и IDE, отдельный счётчик за agentic usage. SotA не подорожает номинально в API, просто перестанет поставляться по подписке. На практике счёт вырастет, потому что agentic loop генерирует в разы больше токенов чем agentic driven development (в смысле с человеком на контроле). Все ли останутся на SotA? Маловероятно. Уже сейчас DeepSeek Flash - $0.14/$0.28 за 1M, MiMo - $0.14/$0.28, Kimi K2 - около $1/$4. Китайский API-first стек выигрывает ровно в этот момент, когда западные вендоры закручивают гайки на подписках. Я это разбирал подробно в обзоре на Хабр. Компании будут тратить на AI больше, потому что встроят агентов в процессы раньше чем поймут риски, но уже успеют сократить экспертов и инженеров, а потом обнаружат что месячный расход на токены сравним с зарплатным фондом одного мида. Компании воспримут рост цен как операционную боль, отказываться уже поздно. Именно это я наблюдал на лекции, где руководитель с техническим бэкграундом после демо Claude Code решил что "инженеры больше не нужны". Что делать? 1. Считать деньги заранее, это легко сделать, берём типовые агентные задачи, считаем расход за неделю, закладываем месячный рост в районе 5-10%. 2. Ставить жёсткие лимиты на расходы в конфиге харнеса, ну и в зависимости от расхода поднимать данные лимиты. 3. Пробовать китайские и отечественные аналоги, они скорее всего будут слабее, но как по мне лучше слабая модель, чем остановка бизнеса. 4. Начать уже наконец собирать фолбэк на on-premise моделях на своём железе. Если кажется что уже дорого - ну, я предупреждал. Дешёвым останется либо аккуратная работа с лимитами, либо отечественный или китайский API, либо своё железо. Аттракцион за $20 судя по всему доживает свой век. Пишите в комментариях сколько у вас уходит на AI в месяц и на чём режете расходы, интересно сравнить цифры.	3 448
17	Какая милота: https://www.anthropic.com/news/fable-mythos-access Странно, что так рано начали шумиху разогревать, так как выход на IPO в районе октября должен быть.	2 127
18	Опубликовал на Хабр небольшой обзор "У вайбкода два пути: Code-подписка и API" на тему стоимости подписок на разные кодовые агенты и тарифов агрегаторов моделей. Всеми агентами и агрегаторами мне доводилось пользоваться, так что что циферки выстарадал, тут всё честно. #МесяцАгентности	9 134
19	У вайбкода два пути: Code-подписка и API	2 246
20	VibeOS - The world's first hallucinated operating system Первая в мире операционная система которая состоит из галлюцинации и AI слопа, которые генерируются в реальном времени, удивлён как я на целую неделю после появления данного видео запоздал с его просмотром. Если кратко, то автор сделал базовое ядро операционки, подключил к ней кодовый агент и сделал интерфейс похожий на windows xp. Когда пользователь запускает любое приложение и пытается им пользоваться кодовый агент генерирует интерфейс и содержимое на лету, придумывая по ходу дизайн и содержимое, на презентации хорошо видно как это работает. К сожалению игры не были показаны, но с простыми приложениями агенты справляется, чувствует вайб нулевых. Посмотреть видео тут, после 9й техническая часть.	2 863

Переглянути всі дописи