Pavel Zloi
رفتن به کانال در Telegram
директор ИИ · инженер‑интегратор https://github.com/EvilFreelancer 20 лет в IT ∈ 10 лет в разработке ∈ 3 года в ML/AI ∈ 1 год - вайбмастер Бусти: https://boosty.to/evilfreelancer Пожертвования: https://pay.cloudtips.ru/p/937f48ac
نمایش بیشتر3 932
مشترکین
+1324 ساعت
+417 روز
+22030 روز
در حال بارگیری داده...
کانالهای مشابه
ابر برچسبها
اشارات ورودی و خروجی
---
---
---
---
---
---
جذب مشترکین
ژوئن '26
ژوئن '26
+254
در 12 کانالها
مه '26
+282
در 12 کانالها
Get PRO
آوریل '26
+465
در 9 کانالها
Get PRO
مارس '26
+428
در 16 کانالها
Get PRO
فوریه '26
+181
در 8 کانالها
Get PRO
ژانویه '26
+366
در 8 کانالها
Get PRO
دسامبر '25
+126
در 7 کانالها
Get PRO
نوامبر '25
+195
در 7 کانالها
Get PRO
اکتبر '25
+118
در 5 کانالها
Get PRO
سپتامبر '25
+96
در 3 کانالها
Get PRO
اوت '25
+140
در 4 کانالها
Get PRO
ژوئیه '25
+112
در 8 کانالها
Get PRO
ژوئن '25
+91
در 7 کانالها
Get PRO
مه '25
+191
در 5 کانالها
Get PRO
آوریل '25
+95
در 6 کانالها
Get PRO
مارس '25
+168
در 3 کانالها
Get PRO
فوریه '25
+44
در 1 کانالها
Get PRO
ژانویه '25
+140
در 5 کانالها
Get PRO
دسامبر '24
+60
در 4 کانالها
Get PRO
نوامبر '24
+32
در 1 کانالها
Get PRO
اکتبر '24
+40
در 1 کانالها
Get PRO
سپتامبر '24
+63
در 1 کانالها
Get PRO
اوت '24
+35
در 0 کانالها
Get PRO
ژوئیه '24
+35
در 1 کانالها
Get PRO
ژوئن '24
+47
در 0 کانالها
Get PRO
مه '24
+52
در 1 کانالها
Get PRO
آوریل '24
+38
در 2 کانالها
Get PRO
مارس '24
+37
در 0 کانالها
Get PRO
فوریه '24
+46
در 0 کانالها
Get PRO
ژانویه '24
+71
در 0 کانالها
Get PRO
دسامبر '23
+147
در 2 کانالها
Get PRO
نوامبر '23
+354
در 2 کانالها
| تاریخ | رشد مشترکین | اشارات | کانالها | |
| 28 ژوئن | +12 | |||
| 27 ژوئن | +13 | |||
| 26 ژوئن | +13 | |||
| 25 ژوئن | +3 | |||
| 24 ژوئن | +2 | |||
| 23 ژوئن | +4 | |||
| 22 ژوئن | +2 | |||
| 21 ژوئن | +6 | |||
| 20 ژوئن | +25 | |||
| 19 ژوئن | +8 | |||
| 18 ژوئن | +9 | |||
| 17 ژوئن | +17 | |||
| 16 ژوئن | +6 | |||
| 15 ژوئن | +3 | |||
| 14 ژوئن | +4 | |||
| 13 ژوئن | +27 | |||
| 12 ژوئن | +19 | |||
| 11 ژوئن | +2 | |||
| 10 ژوئن | +5 | |||
| 09 ژوئن | +6 | |||
| 08 ژوئن | +6 | |||
| 07 ژوئن | +10 | |||
| 06 ژوئن | +5 | |||
| 05 ژوئن | +8 | |||
| 04 ژوئن | +12 | |||
| 03 ژوئن | +15 | |||
| 02 ژوئن | +2 | |||
| 01 ژوئن | +10 |
پستهای کانال
Repost from Константин Доронин
Да кто такой этот ваш harness?
Свершилось! Я позвал на следующий стрим человека, который уже дважды был упомянут на предыдущих (тут и тут).
В понедельник, 29 июня, в 17:00 по Мск (GMT+3) мы с Пашей Рыковым проведём трансляцию на тему "Что же такое harness?".
Обсудим как само понятие, так и внутреннее устройство harness. На стриме запустим harness, разработанный Пашей (его зовут Coddy), и посмотрим, как он работает.
В конце будет обязательный блок вопросов из чата и комментариев к этому посту.
Стрим пройдёт на моём YouTube-канале.
Добавить событие в Google-календарь можно по ссылке.
Подключайтесь. Будет интересно!
| 2 | Прочёл:
https://openai.com/index/previewing-gpt-5-6-sol/
Увидел:
During the preview, GPT‑5.6 models will initially be available through the API and Codex to a select group of trusted partners and organizations.
Сочинил:
Мимо нейроинфополя я без шуток не хожу,
То агент в окно засуну, то модельку покажу.
Хопа, хопа срослись модель и харнес,
Этого не может быть фейбл скоро должен быть. | 1 224 |
| 3 | По мотивам больших обсуждений темы нейрослопа запилил на Хабр свеженький пост.
В нём тезисно собрал мои мысли о том, что меня раздражает в нейрослопе, как его выявлять и как вычищать.
Желаю приятного прочтения! | 1 209 |
| 4 | /goal это тема
На этих выходных у меня по плану была обкатка новинки /goal, которую решил поюзать через ClaudeCode, канва такая, у меня на работе через сеть нельзя получить доступ к рабочей почте, и приходится изобретать всякие костыли типа outlook-pst-mcp сервера, подробнее тут.
Но вместе с почтой у меня нет прямого доступа и к календарю событий ical, а я бы хотел эту историю себе настроить, чтобы быть в курсе рабочих событий не только на компе, но и на мобилке. Благо с недавних пор там настроен экспорт событий календаря в корпоративный чатику Dion (аналог Slack), а это значит, можно изучить документацию по апишке, натравить агента на неё и разобраться с протоколом.
Сижу, рефлексирую свой рефлексатор, прикидываю, как это всё запланировать и реализовать по уму. По-хорошему надо писать подробный план, архитектуру, затем делать /rpa-gen-rules и потом по юз-кейсам направлять агента через /rpa-feat на каждую фичу по отдельности. Но мне что-то таааак лень стало, потому как по прикидкам и прошлому опыту ресёрч протокола, составление плана, реализация и так должны занять примерно пару часов пинания ИИшницы.
И тут я вспомнил про /goal, решил не мудрствовать лукаво и описать план работ, что и как делать, агенту через эту команду, получился такого вида промт:
/goal
Мне нужно сделать штуку которая будет способна получить данные из календаря (определить какие из них повторяющиеся) и правильно формировать ical-файлик, который можно было бы использовать в любом календаре.
Для начала поищи информацию про работу с API Dion VC.
Посмотреть мой календарь можно тут: https://dion.vc/calendar
Ты сможешь сделать это через yandex-браузер, там я уже авторизовался, бери оттуда кукисы и токены для ресёрча.
Помимо этого есть уже установленный Dion на моей локальной машине, авторизованный профиль тут: /home/pasha/.config/Dion
Само по себе приложение Dion - это Electron-апп (браузер в котором запущен сайт-приложение), которое ходит через API на удалённый сервер.
Твоя задача реализовать API-сервер который будет отдавать ical запрашивая данные из Dion через API, после того как соберёшь спецификации и продумаешь архитектуру выполни /rpa-gen-rules, далее используй /rpa-feat под каждую отдельную фичу.
По итогу я хочу иметь протестированный и рабочий API-сервер, Dockerfile и docker-compose.yaml (плюс .env.example), readme с подробной инструкцией что это за сервер, для чего он нужен, как пользоваться, как тестировать и как запустить вручную и через docker.
Клодкод примерно 15 минут выполнял подготовительный этап, сначала полез читать доку про Dion API, затем через линуксовые тулы изучал конфиги Dion в домашней папке, нашёл профиль Yandex-браузера, вытащил из него кукисы, закинул их в тестовый профиль Playwright, потом через Playwright MCP запустил браузер и пошёл изучать апишку.
После чего агент составил такой вот план, в котором первые три пункта были уже отмечены как выполненные, и начал его делать:
- [x] Research Dion calendar API, auth, recurrence model
- [x] Clean up browser session + temp secrets; prepare sanitized test fixtures
- [x] Decide stack + write SPEC.md project brief
- [ ] /rpa-gen-rules: generate agent project rules
- [ ] /rpa-feat: domain model + recurrence detection (innermost layer)
- [ ] /rpa-feat: iCal serialization
- [ ] /rpa-feat: Dion API client + token refresh
- [ ] /rpa-feat: HTTP API server (/calendar.ics, /healthz)
- [ ] Dockerfile, docker-compose.yaml, .env.example
- [ ] README with full instructions
- [ ] Run full test suite + verify working end-to-end
Стек агент выбрал тривиальный, python, fastapi, pydantic, httpx и icalendar. Если бы я делал это руками сам, то взял бы ровно то же самое. Потом начал целенаправленно реализовывать фичи шаг за шагом, под конец выполнил автоматические и ручные тесты, выдал мне ical-файл и отрапортовал о проделанной работе.
Самое интересное, что единственная по-настоящему нетривиальная часть всплыла сама. Оказалось, Dion в апишке вообще не отдаёт правила повторений (никаких RRULE), а возвращает каждое повторяющееся событие отдельной записью с флажком repetitive. Выгрузишь как есть, получишь рабочий, но раздутый календарь с кучей дублей, да ещё и отменённые встречи будут торчать призраками. Я это обозначил одной скобочкой в промте, а агент сам развернул в полноценное восстановление серий, группирует события по названию, организатору, времени и длительности и собирает повторения обратно. Вдобавок сделал два режима, expanded (по событию на каждое повторение, всегда корректно) и collapsed (схлопывает серию в одно событие с выведенным RRULE).
В итоге получился рабочий API-сервер с ручками /calendar.ics и /healthz, 48 зелёных тестов (сеть замокана через respx, так что гоняются без интернета), Dockerfile, docker-compose, .env.example и подробный readme. Плюс по дороге /rpa-gen-rules сгенерил правила проекта сразу под два агента, Cursor и Claude Code, и держит их в синхроне. Теперь просто подписываюсь на этот ics-фид в Nextcloud и вижу рабочие встречи с мобилки, в Kontact и в Nextcloud.
Я ещё потестирую /goal на других проектах, но похоже, что в сочетании с уже готовыми скилами эта штука прям идеально под ваншотники будет заходить, что потенциально позволяет сократить ваншотинг со 120 минут (Валера, привет) до меньших значений.
Исходники тут:
https://github.com/EvilFreelancer/dion-calendar
Всем бобра.
#МесяцАгентности | 1 911 |
| 5 | Встречайте новый пост "Почём нынче токен для народа?" на Хабре, в котором я попытался составить формулу расчёта нижней границы цены токена используя стоимость электроэнергии и амортизацию оборудования.
В посте вас ожидает формулы, расчёты на примере модели GPT-OSS-120B запущенной на сервере NeuralDeep и сравнение с другими вендорами.
PS. По мотивам статьи запилил скил token-cost, с ним вы сможете попробовать выполнить расчёты на своём железе.
#МесяцАгентности | 1 923 |
| 6 | Вещаю про Coddy Agent на Podlodka
Вчера выступил с небольшим докладом (слайды презентации тут) про Coddy Agent на площадке Podlodka. Если вам захочется задать вопросы про мой проект, то не стесняйтесь, буду рад ответить.
Видос кстати с вебкой, закинул его на бусти, желаю приятного просмотра! | 1 906 |
| 7 | Правило BDD которое мы с коллегами вывели:
Если запрос на функционал (или багфикс) приходит от бизнеса то мы заводим feature-тест огуречного формата.
Если же надо накидать edge-кейсов разных для этой фичи, то делаем unit-тесты. | 1 961 |
| 8 | Любопытна новость, для тех кому лень читать: SpaceX купили Cursor за $60 миллиардов.
Из этого можно сделать следующие выводы:
1. В курсор добавят грок (без цензуры и ограничений)
2. Развитие грок должно ускориться (так как его обучат на дистил датасетах собранных курсором за три года)
3. Формирование ядра монопольного рынка судя по всем завершено, итого у нас будут: Anthropic, OpenAI и SpaseX (так как f**k похоже самоустранись)
4. Поднимут цены, потом что 60 миллиардов надо как-то отбивать
Мне кажется, что одним из изменений которое добавят в курсор - это отказ от моделей конкурентов, но не сразу, чтобы не распугать нород, а спустя пару месяцев, как грок дообучат. | 2 320 |
| 9 | Намечается новый спор между исполнителем и заказчиком: кто заберет себе профит от внедрения ИИ
Недавно в переговорах заказчик уже откровенно попросил скидку на основании того, что: «Ну теперь же всё стало проще с первичным анализом, меньше человеко-часов, рутина автоматизирована...». Клиент хочет скидку на основании того, что ИИ упростил жизнь исполнителя, но не учитывает затраты времени и денег на внедрение этого ускорения
🧱Но, что есть, то есть - дорогой «первый слой» работы дешевеет, и клиенты будут отказываться платить за него как раньше. Кто-то уловил эту тенденцию и уже бесплатно или условно бесплатно предлагает первичный анализ. Например, платформа от консалтинговой компании WestMonroe.ai с бесплатными ИИ-агентами. Руководство пошло на такой шаг, так как сами признают, что стратегический анализ, стоивший миллионы, теперь имеет стоимость близкую к нулю
Такая откровенность подкупает клиентов. На этом фоне теневой ИИ в отношении клиентов становится опасным путем и может подорвать доверие и долгосрочное сотрудничество
Спасибо "Вайбкодингу" часть клиентов уже приходят подготовленные и им уже не нужно с нуля , а важнее - доведение до ума, проверка, усиление, безопасность, одним словом довести их сырой продукт до совершенства
👤Типы Заказчиков (можно назвать по своему)
Запрещающие: ИИ под запретом из-за безопасности или регуляторики. Только закрытый контур.
Экономные: сразу ждут дисконт, так как «рутина стала быстрее»
Контролирующие: им важен процесс - какие инструменты применяли, кто проверял и кто утвердил финальную версию
____
Ценообразование будет строиться по принципу: рутина уйдет в фикс или станет бесплатной. Проверка и сложные действия (суды, переговоры, внедрение) подорожают. Суждение, критическое мышление и опыт как и прежде в цене
❗️Не рискуйте доверием клиентов, лучше описать клиенту, что сделала модель, что проверил человек и почему цена именно такая. Скоро будем в договоре это прописывать. Прецеденты уже есть. Есть тендеры, где одним из критериев выбора для заказчика выступает описание исполнителем связки ИИ с экспертами
Эпоха дорогой продажи «первого слоя» работы уходит. Деньги смещаются в опыт, доверие и способность довести решение до результата. Остальное клиент попытается забрать себе в виде скидки
— | 1 681 |
| 10 | Мысль про дорожающие токены фронтирных моделей.
Думаю, мы скоро увидим процессы, когда компании будут судиться с сотрудниками за инди-софт, созданный на токены компании. | 1 617 |
| 11 | Так ну если на мои решения снимают уже рилсы, и сами, без приглашения, значит мы точно что-то правильное делаем с вами! 🔥
https://www.instagram.com/reel/DZfcqCBoaMA/?igsh=MWx3ajIzY3FmbDF1Nw==
А мы с вами не забываем база скиллов живет тут
https://neuraldeep.ru/skills | 1 607 |
| 12 | Эпоха дешёвого AI походу того, тютю
В апреле я писал, что цены на модели будут расти по мере того как бизнес всё сильнее и сильнее будет начинать зависеть от агентов и языковых моделей. И вот июнь похоже подтверждает мою гипотезу пачкой новостей. Как по мне слишком быстро всё это происходит, я полагал что сильный рост цен будет не раньше 27го года, но возможно то что мы сейчас наблюдаем - только цветочки.
Те самые новости
Anthropic с 15 июня выводит programmatic-нагрузку в отдельный пул Agent SDK credits. Pro за $20 получает $20 кредитов, Max 20x - $200. Чат и Claude Code в терминале остаются в подписке, а вот claude -p, CI, сторонние харнесы и всё что крутится в agent loop - уже по API-тарифам внутри этого пула. Кредиты не копятся, перерасход только если включить extra usage. До этого Anthropic запретила OAuth от consumer-подписок в OpenClaw и прочих сторонних агентах, а в апреле usage из харнесов уехал в extra usage.
OpenAI тоже крутила тарифную сетку, только раньше. Со 2 апреля Codex у Plus, Pro и Business перешёл с биллинга "за сообщение" на списание по токенам. Business seat подешевел с $25 до $20, зато тяжёлый agentic usage теперь ест API credits внутри подписки. "Сколько угодно за фикс" закончилось. С 23 апреля то же добрали до Enterprise. OpenAI сама оценивает Codex в $100-200 на разработчика в месяц при активном использовании, разброс огромный.
GitHub Copilot с 1 июня перешёл на usage-based billing. Цена Pro не изменилась ($10), но теперь это $10 GitHub AI Credits, которые жрёт каждый токен в чате и agent mode. Быстрый вопрос и многочасовая автономная сессия раньше стоили одинаково, GitHub это терпел, теперь нет. Автокомплит по-прежнему безлимитный, зато fallback на дешёвую модельку после исчерпания квоты убрали.
На фоне этого DeepSeek пошёл в другую сторону, модель V4-Pro вышла в апреле по $1.74/$3.48 за 1M, а позже скидку 75% сделали постоянной - сейчас $0.435/$0.87. Flash по-прежнему $0.14/$0.28. Китайцы давят ценой, пока западные режут безлимиты.
Ну а Qwen наоборот закрыл Coding Plan Lite для новых подписчиков 20 марта, свежему аккаунту остаётся Pro за $50/мес. Старые на Lite продлевают, но дешёвый вход в их экосистему для новичков исчез. Coding Plan вообще уезжает в Token Plan.
Теперь про Fable 5
9 июня Anthropic выпустила топовую модель для всех подписчиков, при этом она топовая не только по бенчмаркам, но и по факту, хотя местами любила срезать острые углы.
Спустя пару дней, 12 июня доступ к Fable был закрыт для всех пользователей, из-за экспортных ограничений правительства США. Точнее там более занятная формулировка: моделью нельзя пользоваться иностранным гражданам, внутри или за пределами страны.
У меня есть несколько гипотез почему так произошло, но самая вероятная на мой взгляд в том, что последние два года боссы ИИ-компаний, в том числе и Амодей, рассказывали страшилки про агентов и нейросети, способные взломать что угодно и выйти за пределы песочницы, и просили государство срочно начать регулировать сферу. И вот, когда желаемое стало реальностью, что-то как-то приуныли.
Чтобы не терять прибыль, полагаю Anthropic всё же добавят валидацию профилей пользователей, что-то типа сканирования лица на фоне паспорта как у "анонимных" криптобирж, учётки Apple или банков. Это в свою очередь приведёт к искусственной монополизации из-за замыкания на жителей Штатов и сокращению пользовательской базы (и конечно же созданию неофициального рынка валидированных профилей). В результате чего Anthropic придётся поднимать цены, а вслед за Anthropic потянутся и все остальные.
Резюмируя
Если сложить всё это, картина получается прелюбопытнейшая. Вендоры изо всех сил делают вид, что больше не могут "субсидировать" agentic-нагрузку из фиксированной подписки за $10-200. Бесконечные циклы с tool calling, ретраями, длинным контекстом и reasoning якобы утилизируют GPU так, что экономика ломается. Прибавим сюда госрегулирование и насаждение искусственных монополий.
Что будет дальше?
Подписочная модель никуда не денется, но "заплатил $20 и забыл" для агентов вероятно умрёт. Скорее всего будет гибрид - фикс за чат и IDE, отдельный счётчик за agentic usage. SotA не подорожает номинально в API, просто перестанет поставляться по подписке. На практике счёт вырастет, потому что agentic loop генерирует в разы больше токенов чем agentic driven development (в смысле с человеком на контроле).
Все ли останутся на SotA? Маловероятно. Уже сейчас DeepSeek Flash - $0.14/$0.28 за 1M, MiMo - $0.14/$0.28, Kimi K2 - около $1/$4. Китайский API-first стек выигрывает ровно в этот момент, когда западные вендоры закручивают гайки на подписках. Я это разбирал подробно в обзоре на Хабр.
Компании будут тратить на AI больше, потому что встроят агентов в процессы раньше чем поймут риски, но уже успеют сократить экспертов и инженеров, а потом обнаружат что месячный расход на токены сравним с зарплатным фондом одного мида. Компании воспримут рост цен как операционную боль, отказываться уже поздно. Именно это я наблюдал на лекции, где руководитель с техническим бэкграундом после демо Claude Code решил что "инженеры больше не нужны".
Что делать?
1. Считать деньги заранее, это легко сделать, берём типовые агентные задачи, считаем расход за неделю, закладываем месячный рост в районе 5-10%.
2. Ставить жёсткие лимиты на расходы в конфиге харнеса, ну и в зависимости от расхода поднимать данные лимиты.
3. Пробовать китайские и отечественные аналоги, они скорее всего будут слабее, но как по мне лучше слабая модель, чем остановка бизнеса.
4. Начать уже наконец собирать фолбэк на on-premise моделях на своём железе.
Если кажется что уже дорого - ну, я предупреждал. Дешёвым останется либо аккуратная работа с лимитами, либо отечественный или китайский API, либо своё железо. Аттракцион за $20 судя по всему доживает свой век.
Пишите в комментариях сколько у вас уходит на AI в месяц и на чём режете расходы, интересно сравнить цифры. | 3 135 |
| 13 | Какая милота:
https://www.anthropic.com/news/fable-mythos-access
Странно, что так рано начали шумиху разогревать, так как выход на IPO в районе октября должен быть. | 2 050 |
| 14 | Опубликовал на Хабр небольшой обзор "У вайбкода два пути: Code-подписка и API" на тему стоимости подписок на разные кодовые агенты и тарифов агрегаторов моделей.
Всеми агентами и агрегаторами мне доводилось пользоваться, так что что циферки выстарадал, тут всё честно.
#МесяцАгентности | 8 915 |
| 15 | У вайбкода два пути: Code-подписка и API | 2 154 |
| 16 | VibeOS - The world's first hallucinated operating system
Первая в мире операционная система которая состоит из галлюцинации и AI слопа, которые генерируются в реальном времени, удивлён как я на целую неделю после появления данного видео запоздал с его просмотром.
Если кратко, то автор сделал базовое ядро операционки, подключил к ней кодовый агент и сделал интерфейс похожий на windows xp. Когда пользователь запускает любое приложение и пытается им пользоваться кодовый агент генерирует интерфейс и содержимое на лету, придумывая по ходу дизайн и содержимое, на презентации хорошо видно как это работает. К сожалению игры не были показаны, но с простыми приложениями агенты справляется, чувствует вайб нулевых.
Посмотреть видео тут, после 9й техническая часть. | 2 755 |
| 17 | Занятный пример LLM-инъекции в данном посте описан
Данный приём был использован против анализа кода большими языковыми моделями, авторы просто добавили в комментарии и документацию упоминания биологического и ядерного оружии и у модели проводящей аудит начали срабатывают защитные механизмы.
Как следствие она не смотрит на вредоносный код создавая тем самым белые пятна. | 7 175 |
| 18 | Вел вел вел | 2 631 |
| 19 | Возвращаясь к моему прошлому посту на Boosty (кстати подписывайтесь чтобы поддержать моё творчество) про Mythos, в конце того поста я написал:
PPS. Если через полгода Anthropic вдруг выпустит Mythos в публичный доступ без существенных изменений - знайте, что "опасность для общества" оказалась не страшнее очередного тюна квена, а если так и останется за семью печатями - то это вероятно будет ещё одно подтверждение тезиса, миф существует лишь до тех пор, пока его не проверят профильные специалисты используя научный метод.
И судя по всему я оказался прав, не такой уж и страшны оказался миф этот. | 2 773 |
| 20 | Пару дней тестил и готовил для NeuralDeep возможность регистрироваться через почтовый ящик, в качестве почтового сервера рассматривал несколько разных вариантов, но больше всего понравился on-premise сервер (а вы знаете как я обожаю софт который работает на моём железе и не лезет в облака) под названием Stalwart
У сервера есть ряд фичей, которых нет у классики, прежде всего это один Docker-образ, то есть берём и запускаем, плюс есть нативная интеграция в traefik, что очень удобно для генерации автоматических сертификатов, есть апишка для менеджмента юзеров, ну и конечно же админка тоже есть. Чтобы настроить всю эту историю достаточно запустить контейнер, открыть порты, потом через DNS добавить записи.
Короче рекомендую. | 2 409 |
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
