Ai molodca 🤖
Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov. Хаб: @AIMolodcaHub «Al molodca - это канал в телеге, где какой-то чувак показывает картинки, которые делает компьютер» © Bing На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU
Більше20 666
Підписники
+424 години
+447 днів
+130 днів
- Підписники
- Перегляди допису
- ER - коефіцієнт залучення
Триває завантаження даних...
Приріст підписників
Триває завантаження даних...
Фото недоступнеДивитись в Telegram
Немного процесса из Панельска.
Помимо сотни генераций самих домов и различных ассетов, а также ретуши и композинга, попробовал несколько новых приемов.
Интеграция реальной съемки.
Здесь понял, что катастрофически не хватает навыков в видеокомпозинге, поэтому иду учить After Effects. Хорошо, что товарищ помог вырезать руки (Антон, с меня пиво). Из интересного: на напечатанный чертеж полил немного кофе и подпалил зажигалкой для фактурности, а снимал на фоне зеленого чемодана.
Апскейл сцены для разных масштабов.
Раньше пробовал такое в клипе, но здесь решил пойти еще дальше (буквально), можно увидеть на примере с панелькой на двух ногах.
Тиражирование персонажа.
Вот здесь интересно, на основе этого дома попробовал сделать 3D-модель с помощью instantmesh. Сама модель плохенькая, но прикол в том, что сервис дает картинкой несколько поз персонажа. В ужасном качестве, но ведь это можно апскейлить и доработать.
В общем, как-то так, пока не вышла SORA, а я не прокачен в AE, приходится на ходу придумывать решения из костылей.
Если есть вопросики, пишите!
#tips
👍 106🔥 42❤ 19🤯 2
00:57
Відео недоступнеДивитись в Telegram
Тридевятый архив: Панельск 💀
Давно хотел создать свою карманную вселенную, в рамках которой можно рассказывать жанровые истории.
Итак!
Тридевятый архив: это found footage (псевдодокументальный жанр) из альтернативной реальности постсоветского пространства, которое переплетается с необъяснимыми аномалиями и секретными проектами.
Этот файл посвящен проекту "Панельск" — ходячему городу, перспективной и амбициозной разработке, который, в последствии, был заброшен.
Если задумка найдет отклик, то займусь реализацией других файлов из архива, пока SORA не вышла.
Инструменты: Midjourney, Stable, Photoshop, Suno, CapCut.
❤ 305🔥 162👍 40🤯 11😱 2
Королевская серия 👑👺
Я, признаюсь, в восторге от официального портрета короля Ричарда III. Абсолютно инфернальный, но из-за этого — впечатляющий.
Представил, что еще королевского можно показать в таком стиле.
🔥 97👍 20👻 7❤ 4
00:30
Відео недоступнеДивитись в Telegram
Open AI и Google: итоги.
Специально дождался двух ключевых презентаций, чтобы собрать мысли в кучу и поделиться с вами несколькими тезисами.
1. Презентации OpenAI - это новые "те самые" презентации Apple.
Только лучше. Когда ты такой: "ЧТООООО?!" и трясущимися руками пытаешься подобрать челюсть с пола. При этом без миллионного продакшена и свистоперделок мемного диджея (привет, Гугл). Только продукт и его техномагия.
Что на самом деле показали?
Новую веху. Почему? Если убрать все рядовые (хоть и крутые) обновления текущих продуктов, то останется самое важное - нам показали новый мультимодальный способ взаимодействия с ИИ, который скоро станет новой нормой. Бесшовное и естественное общение голосом + возможность нейросети "видеть" то, что видите вы в реальном времени - это, как говорили классики, историческая ступень. Одна из важнейших областей разработки в сфере - это не сами модели, а интерфейс и опыт использования. Как этими моделями будут пользоваться? Чат-бот, например, был и остается хорошим решением. Но время двигаться дальше.
Дайте железа.
С точки зрения удобства и привычки, общение по телефону - база. Но думаю, что все же нас ждет новый тип мобильных устройств, рассчитанных на новые мультимодальные возможности. Такие уже есть, но технически провальные: Rabbit, Humane AI pin. Решение лежит в качественном симбиозе железа и софта, так что думаю, что OpenAI наверняка объединит усилия с Microsoft или Apple, чтобы сделать железяку, идеально подходящую для их моделей. А Google на этом давно руку набил (тот же Pixel), и решение с очками уже выглядит перспективно.
Что в итоге?
Очень интересно, но ничего не понятно. С одной стороны, оказываемся в реальности из фантастических фильмов, с другой, поднимается еще больше вопросов. Не усилит ли это изоляцию, когда мы предпочтем общение с идеально понимающей нас нейросетью живым людям? Какие сферы пострадают и что им делать? Те же переводчики или тьюторы? Одно можно посоветовать точно: спите 8 часов, правильно питайтесь, заботьтесь о себе и своих близких.
👍 151❤ 54👻 14🤔 2🔥 1
Фото недоступнеДивитись в Telegram
Literally me (через пару недель) 😬
❤ 164👻 36🔥 23👍 9🤔 3😱 2
Если вы пропустили, Денис уже накатал саммари презентации. От себя могу сказать, что: огонь, пушка, бомба. Жду возможность прикрутить голос Скарлет Йоханссон, чтобы полностью отказаться в фильме «Her» (усы у меня уже есть).
❤ 48🔥 14🤯 6🤔 2
Repost from Denis Sexy IT 🤖
– Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах.
– GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали.
– GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее.
– Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок).
– Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран.
Дополнительные мелочи:
— Заявленные фичи выкатят через пару недель.
— Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим);
— Во время демки ассистент тормозил хехе.
А вот что я предсказывал в посте выше и что сбылось или не сбылось:
✅ Демку ассистента как из фильма Her
✅ Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте
❓ Размер контекстного окна в 1М (мы не знаем пока)
✅ Новую архитектуру к новой модели, у которой сразу будут все фишки выше
✅ GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны)
❌ Новую версию Dalle 3, с улучшенным фотореализмом
❤ 45👍 14🔥 7👻 3😱 2
🍿 Через 10 минут начнется презентация OpenAI — смотрим, чем Альтман будет удивлять.
https://www.youtube.com/live/DQacCB9tDaw?si=rT4ow2ugBndRwm9G
OpenAI Spring Update
We’ll be streaming live at 10AM PT Monday, May 13 to demo some ChatGPT and GPT-4 updates.
🔥 20👻 2
😎 Немного контента про волшебную нейрошарманку #Suno.
1. Сделал GPT'шку для автоматической разметки текстов песен.
Указываете жанр и кидаете свой текст — получаете его обратно с проставленными [verse], [сhorus] и прочими важностями для модели. Если хотите больше контроля, то второй пункт:
2. Сделал шпаргалку по использованию метатэгов в текстах:
База: текст песни важнее метатегов. Тэги лишь помогают модели, но не гарантируют результат. Структура текста, стиль и жанр влияют сильнее. Подбирайте метатеги по жанру!
Основная структура:
Куплет [Verse] - ритмичный и сдержанный
Припев [Chorus] - мелодичный и энергичный, главный "хук" песни
Дополнительные части песни:
Предприпев [Pre-chorus] - промежуточная часть между куплетом и припевом
Бридж [Bridge] - часть песни, отличающаяся от основной структуры, создает переход
Другие части структуры:
Интро [Intro] - тег не всегда работает, лучше описать как [instrumental intro]
Хук [Hook] - повторяющаяся фраза или инструментальная часть
Брейк [Break] - короткая пауза, где ведущие инструменты или вокал замолкают
Интерлюдия [Interlude] - инструментальная секция внутри песни
Аутро [Outro] - завершающая часть песни, можно использовать теги [Refrain] или [Big Finish]
Инструментальные теги:
Можно использовать для создания инструментальных секций, например: [Instrumental Interlude], [Melodic Bass], [Percussion Break]. Важно учитывать жанр песни при использовании инструментальных тегов
Голосовые теги:
Стиль вокала и пол исполнителя могут быть описаны в промпте стиля и жанра.
Можно использовать стилевые вокальные теги, например: [Female Narrator], [Diva Solo], [Gospel Choir]
3. Выложил Шашлычок на Ютуб (кто-то просил в комментариях).
ChatGPT - SUNO lyric editor
Editing your lyric according to SUNO music generator metatags.
❤ 58👍 31🔥 14