Product × Science
Open in Telegram
I diagnose with data and treat with design. More hardcore materials here – @co_intelligence @martsen | https://pxs.md
Show more5 973
Subscribers
No data24 hours
-17 days
-4130 days
Posts Archive
5 973
Repost from TechSparks
Лет десять с хвостиком назад был заметный шум вокруг Sci-Hub. Этот стартап Александры Элбакян довольно успешно пытался решить проблему доступа к научным публикациям за пейволом; для многих исследователей, работающих в не самых богатых заведениях, проблема такого доступа к необходимой по работе информации была и остается довольно болезненной (яркий пример — научная журналистика и популяризация науки; редакции соответствующих изданий редко готовы оплачивать своим авторам доступ к публикациям в журналах какого-нибудь Elsevier).
Пересказывать историю преследования Александры не буду; к счастью, полностью справиться с ней издателям не удалось несмотря на все свои старания.
Но вот новость, которую я пропустил: в духе времени Александра запустила ИИ-бот для поиска по накопленному архиву публикаций; и он знает про науку куда больше, чем многие большие ИИ-модели, которые не могут пробраться за издательские пейволы. Галлюционирует он тоже мало — как любая RAG-система. Приятно, что несмотря на все препятствия система по-настоящему открытого доступа к научному знанию продолжает жить и развиваться:)
https://cen.acs.org/policy/publishing/Sci-Hub-created-new-AI/104/web/2026/04
(Немножко про историю Sci-Hub: https://www.vice.com/en/article/academic-piracy-elsevier-sci-hub/ )
5 973
Главные мысли, после года работы над роботакси и автономными грузовиками
1. AI-продукты выходят из интерфейсов в физический мир: они принимают решения и действуют в реальности.
2. Вопрос «что умеет модель?» становится недостаточным. Для пользователей, заказчиков и бизнеса всё важнее другое: как доказано, что поведение системы безопасно, надёжно и воспроизводимо?
3. Тестирование, верификация и валидация становятся частью продуктовой стратегии, а не только инженерного процесса.
4. Аналитик проектирует методологию оценки: метрики, сегменты, датасеты, сценарии и критерии допуска к эксплуатации.
5. Продуктовый взгляд помогает формально описывать навыки робота: через поведенческую аналитику, JTBD, Job Maps, детализированные user stories и умение систематизировать хаос процессов реального мира.
Спасибо организаторам Aha'26 за возможность поделиться опытом на широкую аудиторию.
5 973
10 мая. Жена с дочкой ушли гулять. Самое время дойти до любимой кофейни, взять ноль-три фильтра и круассан с шоколадом.
Создана обстановка, близкая к идеальной, чтобы сделать презентацию к Aha’26. Осталось 12 дней до выступления – немного запоздалый, но все еще комфортный срок.
Давненько ничего не рассказывал, но уже накопилась критическая масса уникального и полезного опыта, которым не грех поделиться на широкую аудиторию.
За полчаса расскажу:
- что за такая аналитика в автономном транспорте
- в чем сходства робота и типичной growth-воронки
- про задачи safety-аналитика и чем они похожи продуктовые
- как переиспользовать известные подходы и метрики при работе с автопилотом
Программа с более формальным описанием моего доклада тут:
https://lms.matemarketing.ru/events/all/3/program
Приобрести билетик можно на этой же страничке.
Увидимся на Ахе!
5 973
Repost from Цифровой геноцид
Читая Ризона и его "Человеческую ошибку": экспертиза и предсказуемость типов ошибок
Джеймс Ризон (James Reason) - важный для нас автор, британский психолог, автор фундаментальной теории «человеческого фактора» . В своей фундаментальной книге «Человеческая ошибка» (1990) он доказал, что ошибки — это не только причина, но и следствие несовершенства систем: авария происходит, когда «дырки» (слабые места) во всех слоях выстраиваются в одну линию и возникает «траектория возможности аварии». Немного отрывка из книжки
Существует значительное количество данных , свидетельствующих о том, что на уровнях навыка и правил ошибки с высокой вероятностью принимают форму «сильного, но неверного» поведения. На уровне навыка управление действием обычно перехватывается наиболее активной моторной схемой в окрестности узла, где проверка внимания была пропущена или выполнена не вовремя. Аналогично, наиболее вероятная ошибка на уровне правил связана с неадекватным соотнесением признаков среды с ситуационной составляющей хорошо отработанных диагностических («troubleshooting») правил. В обоих случаях формы ошибок уже присутствуют в хранимом репертуаре структур знаний индивида.
Для ошибок на уровне знаний это не так. Когда проблемное пространство представляет собой в значительной степени неизведанную территорию, гораздо труднее заранее предсказать, какие именно сокращения или упрощения могут быть ошибочно применены. Поскольку ошибки на уровне знаний возникают из сложного взаимодействия «ограниченной рациональности» и неполных или неточных ментальных моделей, их конкретные формы гораздо менее предсказуемы. В лучшем случае можно прогнозировать лишь общие когнитивные и ситуационные факторы, которые совместно порождают ошибки на уровне знаний.
Ошибки на уровне знаний обладают качеством «попаданий и промахов», сходным с ошибками новичков. Как бы ни был экспертен человек в решении знакомых задач, его выполнение начинает приближаться к уровню новичка, как только запас применимых правил исчерпан требованиями новой ситуации. Важнейшие различия между новичком и экспертом лежат именно на уровнях навыка и правил. Экспертиза заключается в наличии большого запаса адекватных рутин для широкого спектра возможных обстоятельств.
Существуют убедительные данные (Adelson, 1984), показывающие, что в искусном решении задач ключевые различия между экспертами и новичками заключаются в уровне абстракции и сложности репрезентации знаний и правил. В целом эксперты представляют проблемное пространство на более абстрактном уровне, чем неэксперты. Последние больше сосредотачиваются на поверхностных признаках задачи. Классический результат об абстрактных репрезентациях экспертов получен Чейзом и Саймоном (Chase & Simon, 1973), которые продемонстрировали выраженное превосходство шахматных мастеров в реконструкции осмысленных шахматных позиций середины партии после 5-секундной презентации. Оказалось, что кластеры запоминания мастеров часто состояли из фигур, образующих атакующие или оборонительные конфигурации. Таким образом, отдельные фигуры «сворачивались» в составные части более крупных осмысленных единиц. Сходные результаты получены для мастеров игры го (Reitman, 1976), физиков (Chi, Glaser & Rees, 1981), математиков (Lewis, 1981) и программистов (Adelson, 1981, 1984).
Таким образом, эксперты обладают гораздо большим набором правил решения задач, причём эти правила сформулированы на более высоком уровне абстракции. В предельном (хотя и маловероятном) случае это означало бы, что экспертиза исключает необходимость прибегать к режиму решения задач на основе знаний. Более реалистично, однако, говорить о тесной связи между предсказуемостью ошибок и степенью экспертизы: чем выше уровень мастерства индивида в выполнении конкретной задачи, тем выше вероятность того, что его ошибки примут форму «сильного, но неверного» поведения именно на уровнях навыка и правил.
5 973
Repost from TechSparks
Toyota и Woven by Toyota показали Woven City AI Vision Engine (фундаментальную VLM для городского мониторинга), Behavior AI и Drive Sync Assist для предсказания поведения людей и синхронизации транспорта и инфраструктуры. Фактически японцы демонстрируют умный город времен развитого ИИ, где люди, машины и светофоры рассматриваются как одна координируемая системой ИИ сущность.
При этом Woven City Behavior AI interprets and predicts human behavioral patterns, while Woven City Drive Sync Assist provides driving assistance based on driver needs and surrounding conditions — то есть системы умного города начинают предсказывать поведение людей и использовать это знание, а не только данные от собственно инфраструктуры города, для оптимального управления городскими системами.
By analyzing camera data from vehicles and traffic signals, the system can understand movement, anticipate behavior, and provide that information to pedestrians and drivers to support peace of mind both on and off the road. Together, these technologies enable people, mobility technologies and infrastructure to operate as a single coordinated system, improving safety.Про support peace of mind both on and off the road мне особенно понравилось: очень японское целеполагание, вряд ли встретишь в пресс-релизе американской компании:) https://woven.toyota/en/news/20260422/
5 973
Дамы и господа, через недельку приглашаю послушать про всякое разное от коллег-аналитиков.
Особо подчеркиваю выступление своего коллеги из Автономного Транспорта. Там очень крутые слайды :)
Мероприятие строго оффлайн. Места ограничены.
Сбор в офисе Яндекса в "Бенуа".
https://events.yandex.ru/events/analytics-party-23-04-2026
P.S.
Я как раз в эти даты командируюсь в Питер. Тоже зайду на мероприятие.
5 973
FYI
Все новые посты и хорошо зарекомендовавшие себя материалы можно найти на моем сайте
http://pxs.md
5 973
Редкие моменты, когда выкладывают полный курс по теме Human-AI Interaction – это не про математику и модельки, а про то как встроить ИИ в реальную жизнь: практики дизайна, вопросы этики, экономики и правоприменения.
Стэнфорд (а точнее Дэн Рассел, автор курса) делится:
• презентацими
• практическими заданиями
• доп.материалами
• видеозаписями лекций
Программа лекций (в среднем каждая чуть больше часа):
https://docs.google.com/document/d/1BhVhXSw0ayuHNhl4iH2R4-GnujiNKx1m67zSimjxXoM/edit?tab=t.0
1. Course Introduction: Course mechanics; Definitions, history, etc. 2. Human aspects of designing AI systems 3. Designing AI with the Mind in Mind 4. Mental Models 5. Morality, Ethics, Alignment, Social Acceptability, and Trust 6. Designing for AI failure 7. Data lifecycle 8. Agentic HAI 9. The Human Side of Robotics 10. Image Generative AI 11. Self-Driving Vehicles (Guest speaker: Andrew Chatwin, Waymo) 12. IP, the Law, and AI 13. Natural Language Interfaces 14. AIs writing code 15. Acting with Urgency: the role of interpretability in the era of exponential AI growth 16. AI and Writing Prose 17. How people talk to AIs (conversational UX) 18. The Interfaces of Computer PerceptionЯ вот точно посмотрю лекцию от гостя из Waymo – интересно как они коммуницируют тему про доверия к технологии: https://www.youtube.com/watch?v=5M2yCzLvxhc&list=PLsAJkAEcPmvNcv6joFMqKskvm9gNNwj7J&index=10
5 973
Качество AI-продуктов и аналитика безопасности автономного транпорта
"Воплощенный ИИ" – это тема нишевая, которая стремительно набирает обороты. Тренд очевиден.
Верю, что через пять лет "вкусные" сервисы, продукты и вакансии будут в нише роботизированных продуктов. Собственно, поэтому я и занимаюсь этим уже сейчас и призываю присмотреться других уже сейчас.
13 марта мы лампово поговорили про эту область с Витом из @trisigma_avito (ex-ExpF).
Обсудили
- мой опыт и чем я занимался раньше: программирование, роботы, построение аналитики с нуля, стартапы и Яндекс
- роль безопасности в понятии "качество"
- популярные вопросы про роботов и автономный транспорт
- как устрона аналитика и в чем отличие от онлайн-сервисов: сбор данных, подбор метрик, симуляции и эксперименты
Запись вебинара – https://t.me/trisigma_avito/205
Готовлю текст с ответами на вопросы, которые поступили во время трансляции и в личку.
Опубликую на неделе в блоге, приправлю релевантными ссылками.
Пока рыба тут:
https://pxs.md/all/trisigma-webinar-analytics-for-autonomous-vehicles/
5 973
Repost from Телекомпания Вит
Про exp-tools.ru
Готовился на неделе к мероприятию про эксперименты и решил вместо презентации собрать интерактивные демонстрации.
Одна из тем – чувствительность метрик и статистических критериев.
Результат так понравился, что решили сделать из этого небольшой сервис.
Пока доступна только симуляция чувствительности – но в планах значительно расширять инструменты.
Про саму чувствительность и методы Монте-Карло написано и рассказано уже много. Но вопросы всё равно возникают снова и снова.
Как можно использовать симулятор:
1. Сравнить мощность двух разных метрик
2. Оценить длительность эксперимента
3. Разобраться с основами статистики на практике
Ссылка на главную – exp-tools.ru/
Ссылка на первый калькулятор – exp-tools.ru/sensitivity
5 973
Repost from TechSparks
В Дубае приостановлена работа роботакси по распоряжению местных властей, которые резонно предположили, что никто никогда не обучал свои автономные машины действовать в текущей ситуации. Все правильно, безопасность превыше всего, но разработчикам теперь, кажется, надо будет озаботиться обучением своих машин поведению в разных чрезвычайных обстоятельствах, включая военные действия. Я не ерничаю, ведь по мере роста беспилотного флота его роль в транспортном обеспечении растет, и в условиях ЧП просто выключить его пока еще можно — но скоро будет нельзя, это ж парализует перевозки.
https://cnevpost.com/2026/03/01/chinese-robotaxi-firms-halt-dubai-operations-middle-east-conflict/
5 973
Продолжая тему влияния технологии на дизайн...
Вот тоже автономный грузовик. Точнее автономная фура, которой не нужна кабина.
Как думаете, зачем такой сделано в чем тут экономический эффект?
Ответ: фуру можно загружать и разгружать с двух сторон, что ускоряет логистику.
5 973
Уровни автоматизации вождения
Читатели заметили, что у UMO 5 тоже есть автопилот. Спрашивают, это (в|н)аш или нет? Отвечаю и немного раскрываю терминологию.
Согласно стандарту Society of Automotive Engineers (SAE) J3016, существует пять уровней автоматизации (шесть, если за нулевой принять полное отсутствие). Попробую рассмотреть их с точки зрения "автопилот как продукт".
L0: Без автоматизации
- Никак не вмешивается в управление автомобилем
- При этом на нулевом уровне есть фичи для «усиливания» способностей человека воспринимать ситуацию и управлять автомобилем: антиблокировочная система, гидроусилитель руля, парктроник
- Полная ответственность за ситуацию на дороге на человеке
L1: Ассистирование
- Автоматизация одного измерения управления: продольные (газ/тормоз) ИЛИ поперечные (руль) маневры. Другой тип маневра делается человеком.
- Фичи: подруливания, удержание в полосе по дорожной разметке, корректировка скорости по впереди идущему автомобилю.
- Водитель следит за всеми действиями и готов в любой момент перехватить управление.
L2: Частичная
- Машина может самостоятельно решить задачу, комбинируя продольные и поперечные маневры, т.е. человек не нужен для совершения «динамической водительской задачи» (Dynamic Driving Task, DDT).
- Фичи: автоматическая парковка, смена полосы по всем правилам, активный круиз-контроль
- Водитель следит за всеми действиями и готов в любой момент перехватить управление.
L3: Условная
- Похоже на L2, но
- предусмотрены резервные системы для сенсоров
- отслеживается состояние водителя, чтобы в случае чего пережать ему управление. Если водитель заигрался или уснул, то L3 будет всячески стараться привлечь его внимание и отказываться ехать.
- Водитель может отвлечься, но остается ответственным за действия автомобиля.
- Фичи: мониторинг состояния водителя, движение в спец. зоне
(пробка, склад, конкретный тип шоссе).
- Широкого распространения не получили, т.к. сутево не отличаются от L2, но накладывают больше ограничений на производителя и пользователя.
4. Высокая
- Полностью оперирует в заявленных условиях эксплуатации (Operation Design Domain, ODD).
- Фичи (а скорее продуктовые сценарии с понятным коммерческим потенциалом): перевозка груза со склада на склад между городами по шоссе, такси внутри города без заезда во двор, автоматическая остановка в безопасном месте и вызов оператора
- Высокоавтоматизированное транспортное средство (ВАТС) самостоятельно оперирует в рамках ODD, человек нужен только в нештатных ситуациях (сгодится удаленный оператор).
- Именно тут сейчас разгорается битва у БигТеха и миллиардных стартапов, в которой принимает участие ваш покорный слуга.
5. Полная
- Автопилот самостоятельно действует в любых условиях, помощь человека не нужна ни в каком виде
- Интересный эффект на дизайн салона: можно рассмотреть полный отказ от руля и реорганизовать пространство
- Пока выглядит слишком утопично, т.к. непонятно, как гарантировать автономное и корректное действие в любых потенциальных ситуациях.
---
Реальные автомобили, конечно же, не разделены четко по этой схеме. Слишком много нюансов в понятиях «маневр» и «условия эксплуатации», чтобы все четко разложить по уровням. Автопроизводители могут дать фичей уровнем выше, но по документам идти как более простой автопилот.
Tesla тут ярский пример – она долгое время маркетировала себя как «полноценный автопилот», но по документам проходила как L2. Зачем это сделано? Чтобы в случае инцидента четко атрибуцировать отвественность на водителя. Подробнее про маркетинг, его влияние на доверие к технологии и что с этим делают напишу в следующих постах.
Что еще важного, но о чем не сказано в стандарте. Уровень автоматизации не равен уровню безопаности, и SAE J3016 об этом явно пишет. Безопасность автопилота (как частный случай Physical AI Safety) имеет свои критерии. Про безопасность, методы оценки и повышения поговорим отдельно, т.к. этим я пристально занимаюсь.
---
Теперь к изначальному вопросу. Конкретно YAV делает L4. Теоретически, можно и L2 сделать, но это уже другой продукт. Может и до этого доберемся :)
5 973
Тем временем, в Яндексе начали делать девайсы на колёсах
https://umo.auto/
У меня есть свой личный беклог фичей. А у вас?
5 973
Патент на симуляцию поведения юзера в случае его... хм... долгого отсутствия онлайн.
https://patents.google.com/patent/US12513102B2/en
5 973
Repost from Vlasov Vyacheslav
В файлах Эпштейна найден календарь с ежедневными 4х часовыми созвонами на 40 человек, без повестки, и с темой «быстро обсудить статус».
Больные ублюдки.
Available now! Telegram Research 2025 — the year's key insights 
