Artificial stupidity

Open in Telegram

Пишу об анализе данных и Data Science (и не только о них). Связь с автором @gofat

Russia251 266 Technologies & Applications34 528

1 516

Subscribers

No data24 hours

-17 days

-430 days

551

Post views

~ 24824 hours

~ 26748 hours

36.30%

Engagement rate

No data

Posts per day

Ads index

beta

Posts Archive

1 516

Repost from Neural Shit

1 516

#llm #agents Забавные наблюдения над мультиагентной системой. Как и обещал, расскажу. В Hermes agent есть такая тема с kanban доской. Можно настроить роли агентов и дать им создавать на доске задачки, потом их брать и выполнять, чтобы делать узкоспециализированные задачки специальной ролью со своими промптами, скиллами и т.п. И в процессе было несколько забавных наблюдений, которые весьма похожи (в шуточном смсле, хотя, как обычно, в любой шутке лишь доля шутки) на реальность. Итак: 1. Агент-менеджер сразу предложил сделать ему модельку попроще и выключит ризонинг. Вероятно, посчитал, что менеджеру думать особо и незачем. 2. У меня не было роли техписа, потому менеджер заставлял фронтенда писать доку (посчитал, что самый ненужный? я хз, если честно). 3. Менеджер вообще невзлюбил фронтенда. Каждый раз на выполненную задачку он ругался и говорил, что тот ничего не сделал. А потом я просил проверить и было "ой, а он сделал, зря быканул". 4. Бэк начал делать себе сам задачки, чтобы побольше поковыряться в библиотеках, от которых зависел проект (классика). 5. Бэк жестко отказывался от задач, которые были вне его скоупа и переводил их на других членов команды (что вполне себе тоже классика). 6. Архитектор писал какие-то доки и спецификации, которые команда дружно игнорировала (кек). Хотя они их и видели, в задачи им артефакты прокидывались. Меня здесь больше позабавило, как это все стало похоже на обычную реальность (пускай и в кривом зеркале агентской системы). Я местами прямо орнул с этих случаев (особенно с менеджера, который отказывался думать). А какой вывод? Какого-то очень умного вывода нет особо (кроме того, что у меня тут может быть skill issue и эта фича еще весьма сырая у Hermes). Но я бы все же сделал такое наблюдение — не исключено, что многим из нас придется подтянуть именно менеджерские навыки: планирование, управление (особенно кем-то, кого ты не понимаешь), установка границ и дедлайнов, настройка flow получения полезности. Потому что теперь каждый суслик в поле агроном (ну или каждый становится своего рода менеджером команды железяк).

1 516

Repost from Neural Shit

Да

1 516

#LLM И еще немного околошизы. Я тут заметил, что Qwen-3.6-35b-a3b страдает в размышлениях синдромом лейтенанта Коломбо (буду считать придуманным мною термином). Был, значит, такой сериал. Классический детективный процедуриал (если ничего не путаю). Там одна из классических фраз была у ГГ "И ещё кое-что…" ("Just one more thing…"). Обычно он ее говорил, когда чел уже под подозрением и его сейчас ловко прищучит наш летеха. Ну так вот. Qwen именно так часто в thinking и пишет, если смотреть логи. Вот постоянно "И еще один момент". И пошел на новый цикл размышлений (что местами подбешивает). Точь-в-точь как Коломбо. Я теперь думаю, а не может китайцы подмешали субтитров из старого сериала, а моделька представляет себя героем детектива? Было бы забавно. Ну и явно лучше, чем если бы она представляла себя крестным отцом ("ты пишешь мне промпт, но делаешь это без уважения"). Вот такое вот забавное наблюдение. P.S. У меня еще есть несколько наблюдений от игр с kanban в Hermes, но их я напишу как-нибдуь потом.

1 516

#LLM #шиза #agents Особо времени писать нет. Пока жду обучения модельки, накидаю быстренько небольшую шизу. Я тут подумал, что все истории с harness'ом для агентов мне что-то напоминают. И вспомнил, что именно. Помните такой фильм Memento? Там ГГ потерял память после происшествия, так что каждый сон ему стирает события за день. У него еще татуировки по телу были и 100500 фоток с подписями. А теперь по агентам: 1. Моделька ограничена своим обучением. Если ей новых данных в контекст не подкинуть — она ничего и не знает из новой информации, только что помнила до этого. Checked. 2. Если сессию вырубаем, контекст у нас нужно загружать заново. Иначе не помнит нифига. Checked. 3. Приходится прописывать всякие memory и т.п., чтобы моделька могла проснуться и снова их посмотреть, чтобы узнать, а что же с ней происходило. Checked. 4. Если подсунуть отравленный контекст, модельку можно будет обмануть. Checked. 5. Все это сделал Нолан. Вот тут проблемка, да, недосмотр. В общем, наши агенты чисто живут в Memento. Ну... тут главное, чтобы мстить никому не стали из-за фоток каких-то. Но тут уж как повезет, хехехе.

1 516

Repost from X5 Tech

Кто будет отвечать на неудобные вопросы про вайб-кодинг и разыгрывать подарки? Уже 25 июня в Сфере X5 состоится первый митап из серии AI & ML Talks. Показываем наших героев на карточках и делимся программой вечера:

18:30 — проходим регистрацию, пьём кофе и общаемся 19:00 — слушаем выступление Павла Гагарского, директора департамента «Интеграции и Парсинг», Х5Digital, на тему «Корпоративный корпус: как собрать контекст компании для AI» 19:25 — переключаем внимание на Александра Охонченко, ведущего разработчика в X5 Tech и его tech speech на тему «Лидвайбкодинг, а не шизофрения ИИ: как пускать vibe-код в прод без техдолга» 19:50 — наступает время для Hot Battle! Тема дискуссии: «Вайбкодинг — это фабрика техдолга, а не ускорение разработки». Модератор: Артем Ерохин — ведущий инженер нейросетей, Х5 Tech 20:15 — обсуждаем выступления, дискутируем и подводим итоги розыгрыша

Что разыгрываем? Пока секрет! Следи за новыми постами в канале и не забывай оставлять комментарии 🤫 Ещё раз важная информация: 📍 Сфера X5 25 июня, 18:30 🔗 регистрация на мероприятие это бесплатно

1 516

Завтра буду модератором митапа в Сфере X5 в Парке Горького. Приходите послушать про вайбкодинг, будут доклады от коллег и дискуссия про полезность вайбкодинга (ну или его бесполезность, тут уж кто лучше позицию отстоит) P.S. В пятницу буду там же, но уже в качестве выступающего. Буду шутить шутки про работу на Слайдапе.

1 516

Repost from Sberloga

🕒 Синдром «Серебряной пули» История про «эффективного менеджера» направления CVM (customer value management) Задача ребят — продавать доп. услуги клиентам и повышать конверсию. Вводные от заказчика прекрасны:

«Мы тут ходили к другой команде, они нам собрали фичу — "лучшее время отправки SMS". Мы полгода крутили пилот, получили нулевой результат. Хотим, чтобы вы сделали то же самое, но лучше».

Начинаем копать от бизнес-задачи. Выясняется: конверсия низкая. Почему? Ну, логично же: мы просто отправляем SMS не в то время! 🤡 Дальше — диалог, достойный войти в учебники по «продукт-менеджменту»: — Вы же уже проверили гипотезу на пилоте, результат нулевой. Зачем развивать безнадежную идею? — Мы в это верим. — Мы работали со многими крупными компаниями, решали эту задачу. Вы первые, кто просит именно эту фичу. — Мы переиграем рынок. — Ок, если я получу ваш пуш в 10:00 вместо 12:00, реально есть вера, что конверсия взлетит? — Разве это не очевидно? Тут мы немного выпали в осадок, но решили узнать, как устроена сегментация и выборка клиентов. — А как вы понимаете, кому слать? Есть функция ранжирования (uplift-модели, скоринг)? — Не понял вопрос. — Ну как вы понимаете, кто сконвертится лучше или хуже? — А-а-а, никак. Просто случайно выбираем из сегмента. Они же ВСЕ заинтересованы в продукте! — То есть ваш сегмент — это просто жесткие бизнес-правила (условия типа ЕСЛИ/ИЛИ)? — Если упрощенно, то да. Мы строим гипотезы и тестируем их через А/Б! То есть ребята делают А/Б тест на абсолютно случайной выборке внутри кастомного сегмента, не умеют в предсказание оттока/конверсии, но верят в тайминг. Пытаемся нащупать омниканальность. У них есть SMS, пуши и звонки. — А не пробовали выстроить каскадную стратегию? Например: сначала SMS, через день — звонок? — Ну и чем это кончится? — Оптимизацией стратегии... *(Повисла неловкая пауза)* — У нас либо звонки, либо SMS! ❌ Итог: Мы рассказали, как строим нормальный ML-пайплайн для CVM у других заказчиков (с моделированием, склонностью к покупке и оптимизацией стратегии). Продукту не зашло. Ведь у нас нет самого главного — алгоритма, который высчитывает идеальную секунду для отправки SMS человеку, которому это предложение вообще не всралось. Как называется эта болезнь? В медицине не знаем, но в ИТ это «карго-культ фичи». Когда команда игнорирует базовую математику, отсутствие нормальной сегментации и кривую коммуникацию, но свято верит, что одна «модная» фича переиграет рынок. Сталкивались с такими «верующими» заказчиками? Какую самую дикую фичу у вас просили завернуть в ML? 👇

1 516

Repost from Клуб CDO

1 516

100%

1 516

#habr О, только сейчас заметил, что попал в шорт Технотекста (вообще раз третий уже мои статьи или статьи с моим участием туда попадают). Когда-нибудь я все же его выиграю (буду в это верить). Сама статья - вот (продублирую). Вообще статьи для Хабра — это отдельный жанр. Нужно и не очень сложно писать, но совсем просто тоже не выйдет, иначе включится "режим сноба" и тебя закидают минусами. Приходится блюсти баланс. И все же круто, что такое количество специалистов делятся своими историями и идеями. Не раз статьи именно с Хабра позволяли в чем-то получше разобраться. И, надеюсь, что мои стаьти тоже кому-то позволили разобраться в той или иной теме. Короче, пишите больше, пишите лучше и увеличивайте объем доступного знания.

1 516

#random У меня есть хобби — иногда я перевожу песни (кстати, хорошая головоломка уложить текст на русском в звучание). И вот в свободное время (еще несколько месяцев назад) я решил попробовать еще и литературный перевод. Нужно было перевести романтическую поэзию XIX века. В итоге я неплохо справился, забравшись на второе место в конкурсе Artis Literae от СПбГУ. Чем, конечно же, весьма доволен. Ниже исходник и перевод LAND-LOCKED (1861) Black lie the hills; swiftly doth daylight flee; And, catching gleams of sunset's dying smile, Through the dusk land for many a changing mile The river runneth softly to the sea. O happy river, could I follow thee! O yearning heart, that never can be still! O wistful eyes, that watch the steadfast hill, Longing for level line of solemn sea! Have patience; here are flowers and songs of birds. Beauty and fragrance, wealth of sound and sight. All summer's glory thine from morn till night. And life too full of joy for uttered words. Neither am I ungrateful; but I dream Deliciously how twilight falls to-night Over the glimmering water, how the light Dies blissfully away, until I seem To feel the wind, sea-scented, on my cheek, To catch the sound of dusky flapping sail And dip of oars, and voices on the gale Afar off, calling low, —my name they speak! O Earth! thy summer song of joy may soar Binging to heaven in triumph. I but crave The sad, caressing murmur of the wave That breaks in tender music on the shore. Вдали от моря (1861) Темны холмы; день гаснет на лету; И, подхватив прощальный луч заката, Сквозь тьму земли, что тишиной объята, Река скользит в морскую широту. Счастливая! Уйти бы мне с тобой! О, сердце, что не ведает покоя! Задумчив взор, что смотрит за горою, Тоскливо ищет отблеск голубой. Терпи: здесь птичья трель, здесь дол с цветами, Богатство звуков, запахов и света. Всё яркое великолепье лета И радость, что не выразить словами. Я не ропщу; но, верная мечтам, Я вижу, будто сумерки ложатся И бледный свет, не в силах отражаться, Блаженно угасает где-то там, — Чтоб ощутить, как ветры соль несут, Услышать парус, мглою окруженный, И всплеск весла, и шторм неугомонный, И голоса, что вдалеке зовут! Земля! Твой летний гимн пускай парит, Разносит в небесах далекий рокот. А я хочу волны печальный ропот, Что нежно с берегами говорит.

1 516

#conference Всем привет! Давненько что-то не писал (работа, аспирантура, всякие новые игры повыходили). На сегодня будет анонс открытия Data Fest 2026 от X5 Tech. Я там тоже буду (может на стенде, может на сцене, тут как получится). В любом случае, регистрируйтесь и приходите послушать. Будет много треков: карьерный трек, LLM, reliable ML, Data и ML в ритейле. В общем, приключение на весь день. Будет интересно!

1 516

#random Увидел на улице плакат "Кто работает — тот ест". Вспомнил и задумался о фразе из приключений Шурика "Кто не работает — тот ест", пошел гуглить... А оказалось, что это почти буквально фраза из конституции СССР 1936 года, статья 12 (пруф). Только там было "Кто не работает — тот не ест". А что еще интереснее, так эта фраза вообще восходит к апостолу Павлу: "если кто не хочет трудиться, тот и не ешь". Что еще больше мне взрывает мозг (казалось бы, атеистические советы прямо в конституции ссылаются на библейские цитаты, а вот оно как). А вторая фраза в той же статье: "от каждого по его способности, каждому - по его труду" (что для меня фактически эквивалентно "как потопали — так и полопали"). Вывод такой получился. Никогда не знаешь, когда наткнешься на кроличью нору (пусть и не особо глубокую, но все же).

1 516

Repost from прохладная история

История в стиле Гая Ричи или Дени Бойла. Но в Российской империи 1911 года Группа аферистов оформила поддельный чек на 66 735 рублей. За баблом в банк отправили рязанского крестьянина Василия Чванкина — обаяшку 21 года, который маскировался под студента. Чванкин получил деньги. Сумма примерно равна зарплате рабочего за 330 лет. И сбежал. Товарищи-аферисты, возмущённые предательством, сдали Чванкина сыскной полиции. И его арестовали в Царицыне (Волгоград). Вот только денёг у Василия уже не было. Он тащем-то и не скрывал свой план: «Отсижу, Бог даст, в тюрьме, выйду, получу денежки и заживу припеваючи». Сыщики полагали, что Чванкин положил деньги на счета в разных банках под процент на вымышленные имена. Так что план-капкан, конечно. Поддельные паспорта в российской империи были часто дешевле и доступнее настоящих. Банковская система не отличалась надёжностью. Чванкину оставалось только пережить 2-3-года в царской тюрьме. А потом — перебраться в швейцарский Давос и лечить чахотку в окружении русских купцов и актрис. Вот вам ещё один сюжет для фикшена по мотивам русской истории. Например, Чванкин остаётся на тюремном кладбище. А его более везучие сокамерники отправляются на поиски запрятанных фальшивых документов в Поволжских пердях накануне Октябрьской революции. Или даже в момент. Часики тикуют, и со дня на день частный банк превратиться в тыкву вместе с деньгами. Счастливых голодных игр!

1 516

Давно не писал. Пока готовился к отпуску, пока был в отпуске, вот сейчас отхожу от отпуска. Полезного пока нет, потому держите небольшое путешествие Фрирен в отпуске.

1 516

Repost from Just links

You Don't Need to Run Every Eval https://fixupx.com/DimitrisPapail/status/2026531440414925307

1 516

#funfact Оказывается, что узоры, возникающие при съемке на фото с экрана, называются муаровыми узорами. Вообще, это узор, возникающий при наложении двух периодических сетчатых рисунков. Но если фоткаешь экран, выглядит примерно так же. А используется это дело в задаче Moiré Detection (собственно, детекция этого эффекта при съемке с экрана, а сама задачка детекции съемки называется Screen Recapture Detection). И есть достаточно немало решений для этого дела. Например *барабанная дробь* FFT (я не устаю поражаться гению Фурье, это реально штука, которую я видел в абсолютно разнообразных задача, и все равно вижу все новые и новые способы применения). Для FFT тут смысл такой: мы переводим картинку из пространственного домена в частотный. Обычная фотография имеет плавный спектр (много энергии в центре, мало по краям). Съемка с экрана из-за пиксельности дисплея рождает ярко выраженные «пики» (спайки) в средних и высоких частотах. Мы маскируем центр (низкие частоты), считаем количество таких аномальных пиков и метрику PAPR (Peak-to-Average Power Ratio). Тут, конечно, не без эвристики (ибо порог по метрике как-то надо подбирать), но все равно круто, люблю такие прикольные идеи. И, конечно же, там есть и много нейросетевых методов (потому что "а почему нет"). Можно глянуть репозитории и статьи по теме, если заинтересовались — раз, два, три, четыре, пять, шесть. P.S. Потом еще покопаюсь в этой тематике (вообще, там оказалось, что целая кроличья нора, начиная от того, что такие паттерны дает не только съемка с экрана (а, например, фото москитной сетки), заканчивая тем, что есть способы демуаризации изображений.

1 516

Ну... не откажешь в похожести описания автору

1 516

#libraries Навайбкодил драфт библиотеки для бутстрапирования (давно хотел что-то такое наваять). Не очень верю в качество, но выглядит не ужасно, хотя и проверить стоит (а у меня глаз что-то уже замылился). Могу точно сказать, что вайбкодинг веселее вайбдеплоя (я нафигачил лишних тегов, но вроде как справился). В общем, issues (если что не так работает) и pr приветствуются. Всяко полезно будет для сообщества в целом. P.S. Зато прошелся по пути выкладывания библиотеки на pypi и настройки github actions для обновления версии на pypi при новом теге в репозитории.