uk
Feedback
Pavel Zloi

Pavel Zloi

Відкрити в Telegram

директор ИИ · инженер‑интегратор @eprogrammist | https://github.com/EvilFreelancer 20 лет в IT ∈ 10 лет в разработке ∈ 3 года в ML/AI ∈ 1 год - вайбмастер Бусти: https://boosty.to/evilfreelancer Пожертвования: https://pay.cloudtips.ru/p/937f48ac

Показати більше
3 769
Підписники
+324 години
+517 днів
+14230 день

Триває завантаження даних...

Залучення підписників
червень '26
червень '26
+78
в 7 каналах
травень '26
+282
в 12 каналах
Get PRO
квітень '26
+465
в 9 каналах
Get PRO
березень '26
+428
в 16 каналах
Get PRO
лютий '26
+181
в 8 каналах
Get PRO
січень '26
+366
в 8 каналах
Get PRO
грудень '25
+126
в 7 каналах
Get PRO
листопад '25
+195
в 7 каналах
Get PRO
жовтень '25
+118
в 5 каналах
Get PRO
вересень '25
+96
в 3 каналах
Get PRO
серпень '25
+140
в 4 каналах
Get PRO
липень '25
+112
в 8 каналах
Get PRO
червень '25
+91
в 7 каналах
Get PRO
травень '25
+191
в 5 каналах
Get PRO
квітень '25
+95
в 6 каналах
Get PRO
березень '25
+168
в 3 каналах
Get PRO
лютий '25
+44
в 1 каналах
Get PRO
січень '25
+140
в 5 каналах
Get PRO
грудень '24
+60
в 4 каналах
Get PRO
листопад '24
+32
в 1 каналах
Get PRO
жовтень '24
+40
в 1 каналах
Get PRO
вересень '24
+63
в 1 каналах
Get PRO
серпень '24
+35
в 0 каналах
Get PRO
липень '24
+35
в 1 каналах
Get PRO
червень '24
+47
в 0 каналах
Get PRO
травень '24
+52
в 1 каналах
Get PRO
квітень '24
+38
в 2 каналах
Get PRO
березень '24
+37
в 0 каналах
Get PRO
лютий '24
+46
в 0 каналах
Get PRO
січень '24
+71
в 0 каналах
Get PRO
грудень '23
+147
в 2 каналах
Get PRO
листопад '23
+354
в 2 каналах
Дата
Залучення підписників
Згадування
Канали
10 червня+4
09 червня+6
08 червня+6
07 червня+10
06 червня+5
05 червня+8
04 червня+12
03 червня+15
02 червня+2
01 червня+10
Дописи каналу
Занятный пример LLM-инъекции в данном посте описан Данный приём был использован против анализа кода большими языковыми моделями, авторы просто добавили в комментарии и документацию упоминания биологического и ядерного оружии и у модели проводящей аудит начали срабатывают защитные механизмы. Как следствие она не смотрит на вредоносный код создавая тем самым белые пятна.

2
Вел вел вел
Вел вел вел
1 155
3
Возвращаясь к моему прошлому посту на Boosty (кстати подписывайтесь чтобы поддержать моё творчество) про Mythos, в конце того поста я написал: PPS. Если через полгода Anthropic вдруг выпустит Mythos в публичный доступ без существенных изменений - знайте, что "опасность для общества" оказалась не страшнее очередного тюна квена, а если так и останется за семью печатями - то это вероятно будет ещё одно подтверждение тезиса, миф существует лишь до тех пор, пока его не проверят профильные специалисты используя научный метод. И судя по всему я оказался прав, не такой уж и страшны оказался миф этот.
1 224
4
Пару дней тестил и готовил для NeuralDeep возможность регистрироваться через почтовый ящик, в качестве почтового сервера рассматривал несколько разных вариантов, но больше всего понравился on-premise сервер (а вы знаете как я обожаю софт который работает на моём железе и не лезет в облака) под названием Stalwart У сервера есть ряд фичей, которых нет у классики, прежде всего это один Docker-образ, то есть берём и запускаем, плюс есть нативная интеграция в traefik, что очень удобно для генерации автоматических сертификатов, есть апишка для менеджмента юзеров, ну и конечно же админка тоже есть. Чтобы настроить всю эту историю достаточно запустить контейнер, открыть порты, потом через DNS добавить записи. Короче рекомендую.
1 222
5
#meme
#meme
2 080
6
Много работаю с моделями Antropic и OpenAI, неоднократно замечал проседание качества работы в будние дни в зависимости от вре
Много работаю с моделями Antropic и OpenAI, неоднократно замечал проседание качества работы в будние дни в зависимости от времени. Утром обычно норм, но вот после обеда агенты будто подтупливать начинают всё чаще. Пошерстил по сети и форумам, есть отдельные комментарии что что-то такое у разных людей бывает, но вроде как официально вроде как не подтверждено, исследований тоже не попадалось больших. Короче решил составить себе памятку с расписанием о том когда лучше всего гонять агентов, надеюсь и вам пригодится. #МесяцАгентности
1 472
7
Что из этого вы использовали/встречали чаще всего?
1 293
8
Какое жаргонное название OpenAI вы чаще всего используете или встречаете на просторах этих ваших интернетов?
1 287
9
Занятный факт, в Cursor 3.7 прокачали Design Mode (это когда во встроенном браузере запускаем приложение, эдакий playwright встроенный в ide), теперь можно агенту вместо скриншотов просто мышкой через UI потыкать области в которые требуется внести правки, описать что сделать и отправить агенту.
1 371
10
Как согласовать агенты Cursor и ClaudeCode в одном проекте Когда начинаешь работать с несколькими агентами в одном проекте, быстро упираешься в одну раздражающую вещь: у каждого агента своя папка с правилами, и они ничего не знают друг о друге. В Cursor правила лежат в .cursor/rules/*.mdc (читаем про Cursor Rules), а Claude Code берёт их из.claude/rules/*.md (читаем про Claude Rules), структура там и сям плюс минус похожая, но вот формат немного отличается. Эксперименты провожу на кодовой базе coddy-agent (это мой проект, Go-харнесс поверх ACP), начинал я его на Cursor с одним лишь AGENTS, а в мае добавил DESIGN и .cursor/rules/, там описаны: архитектура, кодстайл, тестирование, HTTP-слой, порядок реализации. Cursor без лишнего тупняка их подхватывал, агент понимал проект, не лез куда не надо и сразу начинал пилить фичи. Чуть больше недели назад оплатил себе подписку на Claude Code, и обнаружил, что он эти правила не видит, .cursor/rules/ клод старательно игнорирует и лезет только когда я прямо прошу его посмотреть. Каждый раз приходилось объяснять одно и то же: слои, куда не импортировать, как прогонять тесты, что OpenAPI надо синхронизировать и что тестить фичи UI в playwright mcp. Решение проблемы очевидное, надо держать оба набора под каждый агент в репозитории, намедни добавил .claude/rules/ с почти полной копией текста правил курсора, но адаптированными под формат клода (paths: вместо globs:, .md вместо .mdc). Получилось так: .cursor/rules/ architecture.mdc workflow.mdc testing.mdc ... .claude/rules/ architecture.md workflow.md testing.md ... А чтобы агенты не забывали друг о друге в workflow.md добавил явное напоминание: если меняешь правило, не забудь синхронизировать в обе папки. Итого практика, которая у меня сложилась: 1. Пишешь правила один раз в том формате, который удобен (я начал с Cursor) 2. При изменении синхронизируешь вторую папку (происходит копипаста с заменой метадаты) 3. Оба набора коммитаем в репо Немного костыльно, но зато оба агента работают с одним и тем же контекстом, не надо объяснять проект с нуля при смене инструмента. #МесяцАгентности
1 515
11
Капибары на службе ИИ найма. Если вы видите на этом изображении резюме капибару, похвалите себя и выдайте оффер 🤩 В эксперим
Капибары на службе ИИ найма. Если вы видите на этом изображении резюме капибару, похвалите себя и выдайте оффер 🤩 В эксперименте выше ребятки запилили шуточное резюме, перемежая описание ухода за капибарами с реальными скиллами. Лучший навык был, разумеется "чесать пузики капибарам"😜 Результаты размещения CV поразили даже авторов. Ключевая статистика за неделю: 1. Отклики и просмотры. При 100 отправленных резюме они получили 240 просмотров. 2. Приглашения. Рекордные 40 приглашений на собеседования, причём лишь пара человек заметили подвох. 3. Нехватка времени. HR-специалисты были настолько активны, что автору пришлось вручную отправлять автоматические отказы с пометкой "резюме уже не актуально". 😁 Делаем выводы - современные системы найма ATS и ИИ-фильтры отлично атакуются при помощи инъекций. 🚬 Адекватные резюме реальных специалистов часто отсеиваются, в то время как откровенно шуточное, но "оптимизированное" резюме проходит все этапы. Поэтому, ребятки, имейте при себе пару AI-native резюмешек под алгоритмы с ИИ. 👍 #meme
1 041
12
Создано в разных агентах Вожусь с проектами в разных агента уже вторую неделю и заметил занятную закономерность: Если проект начат через Claude Code с Opus, то Codex его тянет плохо. И наоборот, проект который строился на GPT через Codex, Claude Code потом причёсывает с трудом. Агент как будто не понимает чужой почерк, спотыкается на архитектурных решениях, которые другой агент принял сам для себя. При этом проекты, которые изначально делались на слабых моделях предыдущего поколения или через Model: Auto в Cursor мигрируют на вендорлочные агенты без проблем, и Claude Code с ними работает, и Codex. Тут как раз вспомнился недавний пост Александра @dealerAI, он разбирал исследование про то что Claude не должен проверять свой же код, потому что узнаёт знакомые паттерны и одобряет их не через анализ а через распознавание. Я тогда в комментах вспоминал про метчинг резюме, типа если сгенерить его через LLM и потом попросить её же оценить, оценка будет выше чем у похожего резюме сгенеренного моделью другой архитектуры. Гипотеза, которая приходит в голову: Флагманские модели при генерации кода вносят в него свой "почерк", структуру, паттерны и идиомы, которые отражают как именно эта модель решает задачи, как она обучалась и как работает, а вот слабые модели походу этого не делают, код остаётся нейтральным. Вопрос к аудитории, есть ли у кого похожие наблюдения? Или замечали обратное - что флагманские модели наоборот лучше "читают" чужой код? #МесяцАгентности
1 566
13
В рамках развития вчерашней истории про мой дзен построения минималистичных агентных решений подготовил репозиторий agent-template с двумя описанными в посте подходами, через coddy и через opencode в формате docker compose и простенького харнес. Указанный шаблон интересен тем, что в нём ничего лишнего, только базовый функционал который по желанию допиливается в любом направлении.
1 525
14
Как накачать агентов к лету:
Как накачать агентов к лету:
1 073
15
Дзен построения агентных систем Ну чтож, месяц агентности предлагаю начать с базированного поста про то как я собираю агентны
Дзен построения агентных систем Ну чтож, месяц агентности предлагаю начать с базированного поста про то как я собираю агентные системы. Большинство моих решений выглядят просто и лаконично, словно конструктор лего, обычно это связка из небольших кубиков в которые входят агент, MCP-серверы, консольные тулы и скилы. Обвязку (то бишь harness) подбираю под задачу. Чем менее перегружена система, тем проще её развивать, ну и не забываю про закон Люссера, который гласит "каждый дополнительный узел в системе понижает качество её работы". Агент - ядро В качестве ядра системы обычно выбираю минималистичный кодовый агент, к примеру OpenCode, его запускаю в режиме Agent Client Protocol (ACP) и затем подключаю через OpenAI-прокси acpbox, либо использую мой Coddy Agent, так как он умеет и ACP и HTTP из коробки. Реже когда на Ralph-loop пишу кастомные решениие, когда нужна минималистичность и возможность глубокой интеграции, а иногда беру большие агенты типа Codex, Claude, Hermes, OpenClaw, но с этим есть свои риски. Кстати OpenAI-совместимая API-шка нужна если агент должен работать во внешнем интерфейсе, типа Open WebUI или LibreChat. MCP - для внешних систем Как правило подбираю готовые MCP-серверы, реже пишу кастомные решения под задачу, потому как почти все MCP-серверу уже придуманы и написаны не один раз, повторяться смысла особого нет. Для Confluence и Jira чаще всего беру mcp-atlassian, для почты и календаря беру Google Workspace MCP от Google, иногда просят интеграции во всякие Notion, Linear, MediaWiki, у каждой системы свои MCP, их тоже подбираю в зависимости от задачи. Реже нужны системы электронного документооборота навроде Мой Офис или Google Docs, файловые хранилища типа S3 и СУБД навроде MySQL, PosgtreSQL и так далее, тут уже смотрю, есть ли готовый нормальный MCP или проще через CLI всё настроить. К слову сказать избранную коллекцию MCP-серверов вы можете найти в разделе MCP портала Neuraldeep. CLI - для ёмких задач Для редких или тяжёлых операций предпочтительнее использовать консоль, например вместо GitHub MCP берём gh, для GitLab берём glab, для S3 брём aws-cli, а для скачивания видео yt-dlp и так далее. Консольные тулы удобны ещё и тем, что их легко собрать в скрипт, а его уже упаковать в skill, к примеру нам хочется сделать пайплайн вида yt-dlp -> метаданные в MySQL -> видео на S3, мы просим агента автоматизировать эту историю в виде шельника, затем выполнить и показать результат. Подборочку консольных тулов в вы можете найти в разделе CLI на Neuraldeep. Skills - когда описываю флоу Skills я использую, чтобы научить агента работать с MCP и CLI по необходимым в раках проекта правилам, фишка скилов в том что их очень удобно тюнить под задачу не ломая кукуху базовому агенту, плюс скилы позволяют подключать уже готовые реализации некоторых историй. Подборочку скилов вы сможете найти в разделе Skills, опять же, на Neuraldeep. Что и когда выбирать Если в вашем проекте есть некая частая процедура типа поиск по базе знаний или предполагается работа с защищённой системой к которой напрямую вы доступа давать не агенту не желаете, тогда лучше выбрать MCP, это безопаснее прочих вариантов, плюс тул этот всегда под рукой. Если операция редкая и/или сложная, тогда практичнее использовать консольные тулы, в своих проектах я иногда перечисляю список команд в промте, хотя и без этого будет работать, но дольше, потому что агент будет их искать сам. Если нужна сложная цепочка из нескольких MCP и CLI, тогда пишу скрипт и кладу его в скил, хотят тут тоже своя боль, промт заточенный под одну модель (скажем, написанный в условном opus 4.8), на другой (gpt 5.5, qwen 3.6) может давать осечки примерно 50 на 50, под каждую модель иногда приходится его тюнить. Итого Используя данный подход вы через любой кодовый агент сможете получить решение под свою задачу, просто пишете из каких кубиков хотите что собрать, потом проверяете результат и можете приступать к внедрению. Главное не заниматься искусством ради искусства и не раздувать систему ради красоты архитектуры. #МесяцАгентности
1 790
16
Маркеры AI Slop (от которых меня мутит (прям очень)) Пишу данный пост после чтения постов на Хабр и некоторых тг-каналов на которые подписан. В данный публикации расскажу вам про признаки текста c большой долей вероятности сгенерированного моделью, когда встречаю хотя бы три из них то обычно скипаю пост, так как с моей скромной точки зрения наличествование указанных клише говорит о том, что автор решил не заморачиваться с вычиткой и тюном, а значит и мне нет смысла напрягаться в прочтении. Начнем с банальщины… Прорывная технология Ж: Как мы сделали О через П (в заголовке статей, нейронки любят это клише) В тексте — длинные дефисы, то — вероятно — это слоп, нормальные люди — даже не знают как — их деталь (спойлер, два раза минус) Дурацкие 🤣 эмодзи 🍺 по поводу и без 👍 Горизонтальные разделители текста ——— модель будто считает, что читатель не способен различать абзацы. «слова» в таких вот фигурных кавычках, хотя можно не придуриваться и писать "нормально" Бесполезные двоеточия: по поводу, и без. Иногда: несколько, раз, за абзац Все предложения, даже у списков, оканчиваются точкой. Так же частенько встречаются: - Очень: нудные. - Списки: с бесполезной. - Структурированной: информацией. Z это Y, а не X (вот от этого мне дурно сильнее всего, хотя раньше я и сам использовал данную конструкцию, но модельки, аки Ржевский, все опошлили) Длинные, идеально грамотные и ровные абзацы текста, как правило содержащие приблизительно два или три предложения. Полагаю такой размер связан с тем, что в современном мире людям сложно удерживать внимание на более сложной структуре подачи информации. Плюс модели сами по себе не способны генерировать лаконичный текст. Есть ещё ряд признаков и клише по которым можно подмечать пост сгенерированный моделью, но это уже мелочи. А по каким признакам вы выявляете нейрослоп?
2 114
17
Партизанский рефакторинг - методоления улучшения качества кода с устранением техдолга без ведома и санкции руководства.
2 076
18
Месяц Агентности Объявляю Июнь 2026 года - месяцем агентности! Всем доброго времени суток! Наигравшись за прошлую неделю с ра
Месяц Агентности Объявляю Июнь 2026 года - месяцем агентности! Всем доброго времени суток! Наигравшись за прошлую неделю с разными агентами и попытками их подружить на общем проекте пришёл к идеи публично провести основательный тест агентных решений, по ходу дела рассказывать о своих приключениях. В планах попробовать разные агентные истории которые я отправил в долгий ящик, но так и не дошел, например хаб mcp-серверов на докерхабе, сборка роя агентов, агентные операционные системы, применение агентов в спорте, создание автономных SDLC и PDLC, ну и попытаться пожить и поработать несколько дней используя в основном какой-то один кодовый агент или харнес, в массе своей я постараюсь пробовать делать разные проекты, но не будем забывать и о проекте Coddy Agent который я активно развиваю уже более месяца, в этот месяц я найду время на проведение публичных стримов. Список агентов которыми планирую пользоваться в этом месяце: - Cursor - на тарифе Pro ($16) - бейзлайн, с ним будут сравнивать - ClaudeCode - на тарифе Max ($100) - Codex - на тарифе Plus ($20) - OpenCode - на тарифе Go ($8) - KodaCode - на тарифе Pro (1500р) - KimiCode - на тарифе Allegretto ($39) - Drift - на тарифе Pro (4900р) - CoddyAgent - это моя on-prem история, буду пробовать интеграцию с другими агентами Ну и как вы могли догадаться из названия сие меро-прия-тие буду вести весь следующий месяц, ну связанные с событием посты буду поменять тегом #МесяцАгентности в конце месяца проведём ретро и обсудим. Приглашаю всех желающих принять участие в эвенте, просто пишете пост, или видео, или подкаст в любой соцсети про ваши эксперименты с агентами, добавляете тег, ну а если поделитесь ссылочкой где-нибудь под моим постом с таким же тегом то по итогам месяца он попадёт в общий отчёт.
2 261
19
Харнесс от PewDiePie И ещё раз здравствуйте девочки и мальчики, на этот раз я пришёл к вам с новостями про harness за авторст
Харнесс от PewDiePie И ещё раз здравствуйте девочки и мальчики, на этот раз я пришёл к вам с новостями про harness за авторством PewDiePie, помните был такой игровой блогер на заре ютуба? Ему ещё канал забанили за форму одной запрещённой организации, вот этот парень. Ну и так вот, оказалось последние пару лет указанный опальный блогер развивается в направлении on-premise нейросетей и кодовых агентов, а пару часов назад он зарелизил свой собственный harness для создания автономного рабочего пространства под названием Odysseus. Как человек с опытом первым делом в интерфейсе данного проекта прииметил стиль однотипных дизайнов Claude Code да и название как-то подозрительно отсылает нас к стилизации под греческую мифологию отдалёно созвучно с агентом Mythos от Antrpoic. Скачал, полез смотреть в исходники, видно что систему делает человек который плохо представляет как подобные системы делать, много каких мелочей не учтено, плюс это всё же python код, то есть много зависимостей, проект перегружен кодом и так далее и тому подобное. При этом он всё же работает, его можно как докер поднять, а можно через systemd настроить, если скрипты ручного запуска и установки. Выдал агенту указивку скачать и сравнить с Coddy Agent, получилось вот это: Coddy Agent - это тонкий harness в одном Go-бинарнике. Он говорит по протоколу ACP (JSON-RPC over stdio), встраивается в Cursor, Zed, CI или Docker sidecar и крутит ReAct loop с native function calling, MCP, skills и project rules. UI, scheduler, memory и Telegram gateway. Философия "harness first" - coding agent это профиль поверх протокола, а не монолитное приложение. Если нужен agent-as-a-service с минимальным runtime и стандартным wire protocol, Coddy ближе к тому, что PewDiePie называл harness в контексте Aider - обвязка вокруг модели, а не весь рабочий стол. Odysseus - другая крайность, self-hosted AI workspace на Python/FastAPI. Agent loop там тоже есть (на базе opencode, fenced tool blocks + schemas), но он живёт внутри толстого приложения вместе с чатом, Cookbook для подбора моделей, Deep Research, blind Compare, редактором документов, почтой, календарём, заметками и vector memory на ChromaDB. Это не протокольный слой для IDE, а личная AI-ОС "как ChatGPT, но у себя дома". Выбор между ними - не "кто лучше", а тонкий harness для automation и редакторов против полноценного hub'а, где agent одна из многих вкладок повседневной работы. Если кратко, то минималистичный distroless противопоставляется мастхевному настольному приложению. В целом данным проектом пользоваться можно, его относительно просто настроить, есть нюански в промтах агентов, видно что систему делал новичок, но полагаю она обретёт такую же популярность как в своё время OpenClaw, а потом ещё и систему хранения заметок некоей Лилу Даллас, что лично мне намекает о том, что не так важно хороший у вас агент или нет, сколько имя его создателя. В интересное время живём.
2 475
20
Agent Reliability Engineer (ARE) Размышляя на тему разработки проектов через разные агенты пришла в голову мысль, что согласование работы разных агента в пределах одного проекта ну уж очень сильно напоминает мою прошлую работу Site Reliability Engineer (SRE), там я занимался тем что наводил мосты между командой DevOps и командой DevTeam, к примеру запускал и налаживал процессы миграций приложений в кубер, докерилизировал, делал e2e тесты, писал всякие спеки чтобы проще было новые проекты делать клауднейтив, продвигал концепцию микросервисности. И вот сижу так и думаю, а это ведь в чём-то похоже на согласование работы разных агентов, тут ведь тоже чтобы заставить их работать одновременно и в одном направлении надо понимать между ними различия, уметь писать универсальные рулесы, знать какие скилы и как будут работать, заниматься отладкой флоу. Есть мнение, что очень скоро (если ещё не) появится целая отдельная роль спецов которые будут шарить за агентов, я бы назвал их Agent Reliability Engineer, ещё и аббревиатура прикольная получается - ARE, сразу мысли типа ARE, who they are? PS. Гуглёжка в сети показывает, что уже есть AI SRE, там про классический SRE но через AI агентов, а имею ввиду немного иное.
1 954