Заметки Computer Vision инженера

Открыть в Telegram

Мои статьи из разных мест. Моя телега - @wk_zb Про консультации - https://telegra.ph/Pro-konsultacii-03-19 Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19 Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11

Больше

Россия99 062 Технологии и приложения16 995

5 952

Подписчики

-124 часа

+57 дней

+2930 день

3 775

Просмотры поста

~ 1 42424 часа

~ 1 51448 часов

63.42%

Коэффициент вовлеченности

Нет данных

Постов в день

Ads index

beta

Архив постов

5 952

Офис в Норвегии резвится🤣

5 952

Поговорил с Глебом про то куда сейчас идут World Models для роботов: https://youtu.be/_acRtKuupP8 Мне было ужасно интересно. Глеб создал одно из немногих открытых комьюнити где достаточно регулярно походят онлайн семинары по тому как такие модели устроены, люди рассказывают свой экспирианс + то что у них получилось/не получилось. Собственно поговорили и про комьюнити, и про модели, и про то как это пускать на реальном железе

5 952

Так. Я сделал максимально кринжовое видео из всех что было на моём канале. Тут в PUBG (в который я с альфы с друзьями поигрываю), завезли AI ботов. Им говорить голосом команды и они их исполняют. Естественно мне стало интересно - а что они используют. А как это выяснить? Конечно же позадавать вопросы самому боту. Надо сказать что модель там крайне тупая + обложенная политиками безопасности по самое не балуйся. Но есть ощущение что какая-то простая VLA на данных присутствует. Вообще я рад этому тренду использования AI в играх. Что-то новое. И ARC был классным во многом за счет нейроночек управляющих NPC, озвучки и трансфера голоса. Ещё и тут. https://youtu.be/gPGmxWZrqxg

5 952

Собственно видео про Zero-Shot - https://youtu.be/IIyoNLB8Cnc Что самое забавное, похоже если вас заботит лицензия, то выбор надо делать тот же самый что и в One-Shot А так было интересно потыкаться и посравнивать

5 952

В последнее время я часто использую OneShot модели. И мне захотелось понять какие у каких ограничения и что где лучше работает. Думаю следующее видео сделаю про них. А пока расскажите что вы используете. А то вдруг что-то забыл.

5 952

Сделал коротенькое видео про то что сверху: 1) Добавил несколько примеров того где трекинг ломается/как себя ведёт 2) Рассказал с какими платами камера отказывается работать а с какими нет. Думаю плюс-минус полезно если где-то хотите использовать https://youtu.be/mTF31gjOXkk

5 952

Мне нравиться как прогрессируют не только VLM, но и классические алгоритмы. Вот это вот SLAM из коробки, на борту Insight9 камеры. Про камеру я рассказывал несколько месяцев назад. Очень круто что это становится как-будто бы "отдельным модулем". Понятно, что пока что всё не так просто. Но по сравнению с тем как SLAM настраивался 5 лет назад - это прямо небо и земля. То что на видео - это побаловаться. В нормальных проектах у нас тоже есть, но иначе. А у вас где-то на практике SLAM используется?

5 952

Мне давным-давно любопытно было потестить китайские GPU платы. Насколько оно сейчас PyTorch френдли, какие проблемы с инференсом и обучением, и.т.д. Но я ни знаю ни одного сервиса где есть какая-то аренда такого инстанса. Желательно почасовая. Ни immers.cloud ни salad.com ни vast.ai и никто известный их нее предлагает. Когда-то пробовал чатгпт запрячь. Он нашёл пару сервисов, но там без китайского номера никак. Да и контракты там надо было брать по месяцу а то и больше. Короче: 1) А вы тестили? Насколько оно всё любопытно? Насколько сейчас работает? Когда догонят и обгонят? 2) Знаете ли вы где-нибудь сервис где можно задёшево потыкать пальцем? 3) Может у вас есть свои GPU-шки и вы можете прокинуть SSH на них? Если сделаю ролик - обещаю там благодарностей натыкать:)

5 952

Как и обещал - основное видео. Меня, конечно, поражает прогресс который произошёл в последние пол года. Не то что нельзя делать то чего было нельзя. Но насколько удобнее! https://youtu.be/W_tR3qSTD4I

5 952

Завтра-послезавтра сделаю видео про то какая сетка One-shot-detection с visual prompting из зэ бест. А пока что коротенькое превью:)

5 952

Наконец добрался протестировать DeepX плату. Давно хотел. В целом неплохая, но нет какого-то "прорыва" и отличия от рынка. Возможно кроме цены, ибо плата достаточно дешевая. https://youtu.be/fNuI3ayaDgQ А что думаете вы? Тестировали ли уже?

5 952

Когда мы уехали из России в 2022 году, мы стали думать, куда в Европе хотим перебраться. Внезапно по совокупности факторов в нашей пятёрке появилась Греция. А грецию мы любим. На тот момент там была удобная номадская виза. Но, как видно на этой картинке, вся суть Греции — в соседних противоречащих друг другу параграфах. Тогда было, что самый простой способ получить номадскую визу — въехать в Грецию по туристической визе, а уже потом начать оформлять номадскую. Но туристические визы греки в тот момент практически перестали выдавать россиянам. В итоге с этим вариантом мы обломались и поехали в Норвегию. Сейчас у меня неделя отпуска, и мы как раз ездим по Греции. Но каждый раз, когда я снова вижу такую комбинацию знаков или чего-то похожего — а тут такого много, — мне вспоминается та самая история. Любопытно: есть ли среди подписчиков те, кто в итоге получил греческую номадскую визу? Сам я переезжать не собираюсь, но любопытно, удалось ли кому-то пройти этот квест.

5 952

Собственно сегодняшнее видео - опять тирлист (прошлый неплохо зашёл, но не отвечал на вопрос полностью). Но на этот раз я попробовал больше сфокусироваться на том какие платы более предпочтительны для робототехники и почему. Ещё, наверное, я сделаю один тирлист для "инференса для камерах". Но это скорее через пару видео доберусь. https://youtu.be/cykGngPqzro

5 952

Что-то в последний месяц меня много народу спрашивали что надо сделать чтобы переехать в разные другие страны (доки, и.т.д.). Я подумал что надо на мой второй канал бахнуть на эту тему видео чтобы в будущем просто его присылать. Собственно краткий рассказ про базовый комплект доков которые лучше подготовить заранее (~~хейтеры скажут чтобы бы не делать, только бы ВПН не настраивать!~~) 😁. Так как опыта переезда в разные страны достаточно, возможно кому-нибудь поможет. Сам был очень благодарен что мне когда-то эти базовые вещи проговорили. Ну и да. Если вопросы есть - спрашивайте в треде, попробую ответить. https://youtu.be/r2wpX6Off_0 Нормальное видео выложу завтра + одну любопытную плату тестирую, надеюсь до отпуска что-нибудь ещё выложу.

5 952

Давно не рассказывал что с RemBrain. Четыре года назад мы хотели делать мозги для роботов. "Интегрируем мозг в ваш проект". Потом поняли что это не работает. Долго экспериментировали, но кажется нашли рабочую нишу. С осени уже три интеграции. Сборка медицинских девайсов, сборка электроники. Главное что поняли - надо делать решение на уровне "воткнул в розетку - работает". Стандартизация всего и все. Максимальное упрощение интерфейсов. А дальше поверх этого можно и классический CV втыкать и VLA и вообще без моделей работать. По сути железка - это средство доставки мозгов. Чуть подробнее можно почитать в one pager. Есть серьезное подозрение что в робототехнике это единственный подход. Как только появляется интегратор или посредник он сразу начинает думать "а зачем тут мне кто-то ещё, сейчас я сделаю все сам и заберу прибыль". И, естественно, все проваливает. Видео выше - демка с последней выставки.

5 952

Меньше года назад я уже писал про галлюцинации и куда это на заведёт. Кажется что галлюцинации становятся все более эпичными и сложными. С другой стороны - люди тоже галюцинируют. Может просто модели поднимутся до их уровня? На картинках: 1) текущее качество чатгпт 2) текущее качество нанобананы Второе куда ближе, но и ошибки эпичнее:) Какую галюцинацию вы пытались пофиксить дольше всего?

5 952

Завтра и послезавтра буду на выставке про роботов в Ставангере https://erf2026.eu/ Если кто то там окажется, пишите/подходите!

5 952

Сделал видео и статью про топовые платы для VLM и LLM. В первую очередь фокусировался на том что имело NPU, но немного в GPU + RISK-V тоже!

5 952

Сегодня уникальное видео https://youtu.be/HI47y_-Af3U Looper Robotics прислали мне их камеру на обзор до официального старта продаж. И надо сказать что это определённо одна из самых интересных 3д камер сейчас на рынке:) Это не значит что она лучшая, это значит что они попробовали перепридумать парадигму. Получится у них или нет - не знаю, но выглядит круто. так же сделал статью https://medium.com/p/7965df470f60

5 952

Вчера решил таки послушаться ботов и посмотреть, не починили ли плату Radxa NIO 12L про которую у меня когда-то уже было видео на канале. Все же было бы круто если бы MediaTek тоже включился в гонку. Radxa за это время на удивление даже обновила прошивку, выложила Ubuntu сборку для ядра. Но... Там не было предустановлено никаких NPU драйверов. Так что для меня все так же и остаётся загадкой. Для кого вообще сделан NeuroPilot? На какой плате он должен работать? Кажется кроме радксы больше плат нет. Вообще есть ли у кого-то опыт с не-андроид MediaTek NPU? Расскажите!