Кружок Пономаря

Open in Telegram

Медиаменеджер, предприниматель, digital эксперт и т.д. Кофаундер агентств «Палиндром», «Фейк» и HYG, старший партнер koven.io. Экс-издатель «Лайфхакера».

Russia327 416 Marketing & PR5 980

991

Subscribers

No data24 hours

+77 days

+2330 days

461

Post views

~ 21224 hours

~ 23948 hours

46.52%

Engagement rate

No data

Posts per day

Ads index

beta

Posts Archive

991

Наша рассылка рИИдактор работает почти месяц. Немного расскажу, что из неё уже выросло. Большинство подписчиков уже получили все письма и перешли к практике. Вокруг рассылки формируется живое сообщество — пока довольно робкое, стесняющееся своей неопытности, и очень зря! Там мы (Настя, Паша, Родион и я) раскладываем подробнее отдельные нюансы, делимся скиллами, инструментами и вообще всякими находками (и мемами, конечно). Пока выглядит как нормальное профессиональное сообщество, еще совсем молодое, но с хорошим потенциалом. Из этого чата вырос отдельный канал Дорогая рИИдакция. Мы ведём его каждый под своим углом зрения и своим подходом к работе. Ещё мы провели первый вебинар для подписчиков, где поотвечали на всякие злободневные вопросы. И точно проведём ещё. Влиться в эту движуху можно в любой момент, цена участия по-прежнему привлекательна своей маленькостью 🙂 Присоединяйтесь здесь.

991

Мюнхенский суд объяснил Гуглу разницу между поиском и ИИ-ответами. За реультаты в поиске ты не отвечаешь, за ИИ-ответы — да, причем кошельком. Случилось следующее. Google AI Overviews написал про двух издателей, что они причастны к мошенничеству, подписочным ловушкам и сомнительным практикам. Ничего этого в источниках не было, ИИ сам придумал связи между компаниями. Издатели отправили досудебное требование прекратить нарушение, Гугл проигнорил, и тогда они, разумеется, подали в суд. И вот уже суд постановил, что тексты AI Overview — это собственные слова Гугла, а не агрегация чужого контента и старая защита «мы просто показываем ссылки» тут не работает. Гугл вяленько ответил, мол, пользователи могут всё проверить сами, но суд этот аругмент не принял — хотя бы потому, что есть исследования, по которым только 1% (!) пользователей вообще кликает на источники в AI Overviews. От лица паблишеров на этом месте снимаем кепки и молча сжимаем их в руках. Масштаб проблемы можно оценить по одному конкретному показателю — Gemini 3 отвечает правильно в 91% случаев. При масштабе Гугла это миллионы неправильных ответов в час. 56% правильных ответов при этом не подтверждаются источниками, на которые ссылается AI Overview. Решение временное, Гугл будет апеллировать, но прецедент создан. ChatGPT, Claude, Perplexity приготовиться — добро пожаловать в эпоху, когда галлюцинации могут бить по кошельку не только пользователей, но и владельцев моделей. — Пономарь

991

Увидел тут на PH софтинку, которая проверяет систему на предмет безопасности по чеклисту. Но лишнее приложение мне не надо, поэтому я просто взял список критериев (разработчик его не скрывает) и скормил его агенту. Результат на скриншоте. Исходное приложение мертво по прибытию. Промпт для вашего агента такой:

Проверь безопасность системы по следующим параметрам и выдай итоговый результат в формате чек-листа:

Password manager
Disk encryption
Screen lock
Antivirus / EDR
Application firewall
Gatekeeper
System integrity (SIP)
Remote login (SSH)
Local admin rights
Guest account
Automatic login
Touch ID for sudo
Sharing services
AirDrop
Automatic OS updates
OS patch status

991

Спасибо всем, шалость удалась :)

991

Еще год назад главный страх Google звучал так — ChatGPT съест поиск, ИИ-ответы наверху выдачи убьют рекламу. Мол, зачем платить за синие ссылки, если готовый ответ уже висит сверху? Уже понятно, что это не сбылось. Сундар Пичаи радостно рассказывал на I/O, что ИИ, наоборот, раздувает поиск — пользователи ИИ-функций, ищут больше, а число запросов в прошлом квартале достигло исторического максимума, AI Mode собирает миллиард пользователей в месяц, AI Overviews — 2,5 миллиарда. Выручка поиска выросла на 19% год к году. На этом фоне даже неважно, что Gemini долго проигрывал ChatGPT по популярности, потому что когда ИИ вшит в выдачу, отдельный чат-бот можно и не достраивать. Вот только платит за это весь остальной веб. AI Overviews режут переходы на сайты паблишеров, а уйти из поисковика с 90% рынка почти никто себе позволить не может. Мораль для стартапов — выйти на рынок первым круто, но решает не это, а миллиард привязанных к экосистеме пользователей и $180–190 млрд капекса в год. Такое пока что OpenAI нечем крыть. — Пономарь

991

Расскажу про продукт, к которому имею некоторое отношение. Я уже некоторое время являюсь эдвайзором в Publora, а её фаундер Сергей Булаев — мой близкий друг, с которым мы много лет делали Лайфхакер. Можно, конечно, поделить мой энтузиазм на коэффициент пристрастности. Но я правда пользуюсь Publora каждый день в нескольких своих проектах и пишу этот пост не просто из вежливости. Publora — планировщик для соцсетей, который вместо очередного «дашборда как у всех» делает ставку на две неочевидные вещи. Первая — удобный редактор и планировщик, ускоряющий и упрощающий работу с кучей каналов в соцсетях. Вторая — нормальный API и MCP-сервер. То есть постинг на кучу платформ можно отдать агенту, а не кликать руками (что я сам и сделал). По сравнению с другими игроками у Publora очень демократичные цены, плюс за последние месяцы продукт сильно прибавил в возможностях — я это вижу и снаружи, как пользователь, и изнутри. Сегодня Publora вышла на ProductHunt и любая поддержка продукту и команде сильно пригодится. Если у вас есть аккаунт на PH — зайдите, поставьте upvote, напишите пару слов. Займет пять минут, а для небольшой инди-команды в день запуска это очень важно. Поддержать Publora можно здесь.

991

Прочитал свежую статью о том, почему все существующие детекторы ИИ-текстов на самом деле работают плохо и меряют не то, что нужно. В целом, у индустрии до сих пор нет общего понимания, что вообще считать текстом, написанным ИИ. Каждая команда, которая делает детектор или собирает датасет для его обучения, придумывает своё определение. Кто-то считает текст ИИ-шным, если хотя бы абзац сгенерирован моделью. Кто-то — только если весь документ написан ИИ. Кто-то смотрит только на то, нарушает ли содержание какие-то правила (человек просил у модели идею для эссе — это одно, просил поправить грамматику — совсем другое). Получается, что разные детекторы по факту решают разные задачи, но все называются термином ИИ-детектором, а их точность сравнивают одинаково. Авторы разобрали все эти подходы и показали, для какого реального сценария годится каждый из них. Например, ловить пропагандистские бот-фермы нужен один тип детектора (грубый, на уровне всего документа), а проверять студенческие работы — совсем другой (на уровне отдельных предложений или даже «что именно человек просил у модели»). Чтобы протестировать детекторы, исследователи собрали свой особенный датасет. Обычно такие наборы делают просто — берут человеческий текст и просят модель его переписать одним заходом. Авторы вместо этого посадили 99 живых людей писать тексты в паре с разными языковыми моделями через специальный редактор, который записывал каждое действие — где человек написал сам, где попросил модель продолжить, где попросил переписать кусок и т.д. В итоге у них получилось почти 400 текстов-кейсоы с полной историей создания каждого. Затем сравнили реальные кейсы совместного письма с тем, как устроены популярные обучающие датасеты и разница оказалась огромной. В реальной жизни человек и модель постоянно чередуются — одну часть пишет человек, следующую модель, затем человек его подправил, и так много раз за один текст. Нам, регулярно пишущим совместно с нейронками этот паттерн знаком и привычен. А вот в синтетических датасетах, используемых для тренировки детекторов, всё оказалось примитивнее— либо текст почти целиком человеческий или почти целиком ИИ-шный, и это совсем не похоже на то, как люди пишут с помощью ИИ сегодня. Дальше авторы прогнали свои тексты через популярные детекторы, как бесплатных, так и коммерческих вроде GPTZero и Pangram. Оказалось, чем сложнее замешан текст, тем хуже все детекторы справляются. Ни один из инструментов не оказался лучшим во всех сценариях сразу. Вывод простой (и неприятный) — как для разработчиков детекторов, так и для их пользователей — доверять точности таких сервисов в реальной жизни сейчас не стоит. Особенно в случаях, когда от этого зависит, например, оценка важной студенческой работы. P. S. А вот, кстати, и реальный пример :) — Пономарь

991

Посмотрел на айдентику «Крестов» от Лебедева. Понравилось, как хронология положена на образ колючей проволоки.

991

#попалподлошадь с комментарием для нового исследования нативной рекламы:

Продукта в контенте все больше, имиджа исчезающе мало. Стратегический маркетинг схлопнулся — бюджетов на рассказы про ценности в нынешних условиях просто нет. Отсюда и популярность коротких форматов как прямое следствие экономии. Спецпроект - это недели работы и дорого, а статья с пятью ссылками на рекламодателя готовится за несколько дней. Нетрудно угадать, что выберет клиент.

— Пономарь

991

Товарищ вот в твиттере жалуется, что чатгпт отказывается искать торренты ему. И поэтому он решил переключиться на локальные модели. Есть у меня скилл, у которого одна работа — принять от меня ссылку на видео с ютубчика, твиттера и иных площадок и присылать в ответ мне файл в телегу (ну или положить в личное облачное хранилище, но это уже лишние подробности). Нужно мне это для безобидных личных целей, так что нарушителем чужих прав себя предпочитаю не считать. И хотя написал я этот скилл как раз с помощью чатгпт, и работал он долгое время вполне предсказуемо, но кажется, недавно в американские модели подвезли какую-то жесткую защиту копирайта. Так что и грок, и кодекс стали вместо нужного действия читать мне за мои же деньги лекции о важности защиты авторских прав. Агент у меня на VPS, локальную модель там особо не позапускаешь, поэтому я нашел решение попроще, чем предлагает гражданин в исходном твите. Если дефолтная модель отказывается выполнять задание, то я переключаю агента на китайскую модель. Deepseek и Qwen через Openrouter берут за такую работу немного, а задачку вполне себе выполняют. — Пономарь

991

Anthropic на месяц удвоила лимиты Claude Cowork. Предполагаю, младшего братишку клод кода решили пропушить на фоне растущей популярности Codex app. Ну что же, грех не воспользоваться предложением и не перевести часть рутинных задач туда. Вот вам заодно несколько предложений, что можно делать в Cowork, а не в Code.

1. Умная сортировка файлов. Мой любимый кейс — анализирует содержимое папки Downloads, определяет тип каждого документа (инструкции, документы, мемы) и сортирует без вашего участия. 2. Массовое переименование по содержимому — открывает 50 счетов вида scan_01.pdf, читает сумму/дату/поставщика и переименовывает: 2026-01-28_SNCF_1_SUM.pdf. 3. Извлечение данных из PDF в Excel. Даём папку со счетами и чеками, агент создаёт XLSX с колонками: Дата, Поставщик, Сумма без НДС, НДС, Категория расходов. 4. Консолидация отчётов. Агент читает 10 PDF-отчётов из разных отделов, выявляет общие KPI и генерирует единый executive summary с графиками. 5. Подготовка брифа перед встречей. Даём папку с историей переписки с клиентом, счета и отчёты, получаем сводку — текущие проекты, спорные вопросы, возможности для апсейла. 6. Сборка инструкций из разрозненных материалов. Скармоиваем заметки, скриншоты, транскрипции совещаний, агент пишет пошаговый мануал для сотрудников. 7. Пакетная конвертация файлов — «Конвертируй все HEIC в JPG и уменьши до 1920px». Без фотошопов и онлайн-конвертеров. 8.Регулярные задачи — утренний дайджест, автоматическая обработка новых файлов по расписанию, еженедельные отчёты без ручного запуска. 9. Аудит безопасности данных или всей системы с предложениями по оптимизации, очистке и т.д.

Это самые базовые идеи (в том числе из моей практики) а вы смело включайте фантазию и пробуйте что-то своё. — Пономарь

991

Reddit стал полем боя за место в AI-выдаче Модераторы сабреддита r/biohackers сообщили, что закрыли посты про пептиды и гормоны — выяснилось, продавцы годами засеивали сабреддит «органическими» постами, написанными так, чтобы их подхватил ChatGPT и AI-поиск Google. Посты с аккуратно вшитыми упоминаниями брендов писались аккаунтами с историей и живой активностью, так что отличить от живого человека их почти нереально. И теперь модераторы ловят их уже на глаз, так как автоматические системы обнаружения недостаточно хороши. Это очередной результат хайпа вокруг GEO/AEO, оптимизации под нейронки, занявшей место старого доброго SEO. Целые сео-конторы открыто продают как услугу AI-агентов, которые штампуют такие посты пачками сразу под Google и ChatGPT. Понятно, почему дерутся именно за Reddit. Google поднял треды с реддита на самую верхушку выдачи, плюс нейросети активно тащат оттуда ответы. Так что хорошее место в правильном треде — и ты сразу и в обычном поиске, и в ответе чат-бота. Дешевле и охватнее точки входа в англоязычном интернете сейчас просто нет. Иронично, что Reddit сначала сам продал свои данные OpenAI для обучения, а теперь вылавливает внутри себя ИИшных паразитов, которые эти самые данные пытаются отравить. — Пономарь

991

Отвлечемся от ИИ к действительно важным новостям технологического прогресса. Вышло приложение, которое блокирует вашу клавиатуру, если по ней ходит кот.

991

Большинство промптов превращают вашего агента в очень вежливого стажёра, который ждёт следующей инструкции. Решение — использовать функцию goal (появилась в клоде и кодексе, в клешню и Гермеса ее тоже подвезли), которая превращает вашего агента в того, кому реально можно делегировать. Разница в том, что промпт говорит, что сделать, а goal описывает, как выглядит успех, как его проверить, что нельзя сломать и когда остановиться. То есть всё то, что мы держим в голове, когда мы отдаём задачу живому человеку — вы же не зачитываем ему пошаговую инструкцию. Не зачитываете же? 🙂 Как использвать на практике. Вот базовая структура из шести частей: — Outcome: что должно стать правдой, когда всё готово. — Verification: как это проверить. — Constraints: что не должно сломаться. — Boundaries: какими файлами и инструментами можно пользоваться. — Iteration policy: как пробовать ещё раз, если не вышло. — Stopping condition: когда звать на помощь. Если хотите попробовать — вот шаблон. Скопируйте, подставьте свою задачу и отдайте агенту:

Преврати эту задачу в Goal, который AI-агент выполнит без присмотра.
Задача: [опишите задачу]
Распиши:
1. Outcome — что должно стать правдой, когда задача выполнена
2. Verification — каким тестом это проверить
3. Constraints — что не должно деградировать
4. Boundaries — какие файлы, инструменты и системы можно трогать
5. Iteration policy — как пробовать фиксы, если не получилось
6. Stopping condition — в какой момент остановиться и спросить меня

Такой подход, конечно сильно сложнее привычного «ты эксперт, сделай хорошо, make no mistake», но результат того стоит. — Пономарь

991

В какой-то момент у вас может возникнуть желание использовать Grok для каких-нибудь агентских задач. Крайне важно победить это желание как можно быстрее.

991

Ozon банк уверен, что Claude для работы, ChatGPT — для жизни.

991

CNN подал в суд на Perplexity за 17 тысяч скопированных материалов Perplexity отбивается аргументом «факты нельзя запатентовать», что верно технически, но не юридически. CNN предъявляет претензии на конкретные тексты, видео и фотографии, а это другой вопрос, и американские суды его решают иначе. Год назад переговоры по лицензированию контента зашли в тупик, после чего CNN закрыл ботам Perplexity доступ, но те всё равно пролезли через сторонние платформы. Кажется, что это первый иск телесети против AI-компании — до этого судились в основном печатные издания (NYT, WSJ, Chicago Tribune). Телевизионщики присоединились позже всех, зато сразу с видео и изображениями в иске. — Пономарь

991

2000x1334.webp0.51 KB

991

Bloomberg слил рендеры iOS 27 накануне WWDC, которая в этом году стартует 8 июня. Картина примерно такая — для Siri делают отдельное приложение в стиле ChatGPT — с историей диалогов, загрузкой файлов и голосовым режимом. Анимация вызова переезжает в Dynamic Island, свайп вниз открывает «Search or Ask» вместо Spotlight. Под капотом — Google Gemini (помним, что Apple не потянула собственную модель, не разобралась с интеграцией ChatGPT и вот идет уже на третий заход). И даже, вроде бы, дадут выбрать дефолтным ассистентом ChatGPT, Gemini или Claude вместо Siri. На третий год эпохи LLM громко продвигавшийся Apple Intelligence превратился в дистрибуцию чужих LLM. Сама Apple заняла роль платформы, которая решает, кому достанутся миллиарды запросов с iPhone, но не игроком со своей моделью. OpenAI уже жалуется, что их интеграцию в iOS 26 пользователи не замечают. Интересно, получится ли решить прошлые проблемы в iOS 27. Пора бы уже. — Пономарь

991

Блин, да как он сюда-то скачался