cookie

We use cookies to improve your browsing experience. By clicking «Accept all», you agree to the use of cookies.

avatar

Ai molodca 🤖

Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov. Хаб: @AIMolodcaHub «Al molodca - это канал в телеге, где какой-то чувак показывает картинки, которые делает компьютер» © Bing На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU

Show more
Advertising posts
20 666
Subscribers
+424 hours
+447 days
+130 days
Posting time distributions

Data loading in progress...

Find out who reads your channel

This graph will show you who besides your subscribers reads your channel and learn about other sources of traffic.
Views Sources
Publication analysis
PostsViews
Shares
Views dynamics
01
Немного процесса из Панельска. Помимо сотни генераций самих домов и различных ассетов, а также ретуши и композинга, попробовал несколько новых приемов. Интеграция реальной съемки. Здесь понял, что катастрофически не хватает навыков в видеокомпозинге, поэтому иду учить After Effects. Хорошо, что товарищ помог вырезать руки (Антон, с меня пиво). Из интересного: на напечатанный чертеж полил немного кофе и подпалил зажигалкой для фактурности, а снимал на фоне зеленого чемодана. Апскейл сцены для разных масштабов. Раньше пробовал такое в клипе, но здесь решил пойти еще дальше (буквально), можно увидеть на примере с панелькой на двух ногах. Тиражирование персонажа. Вот здесь интересно, на основе этого дома попробовал сделать 3D-модель с помощью instantmesh. Сама модель плохенькая, но прикол в том, что сервис дает картинкой несколько поз персонажа. В ужасном качестве, но ведь это можно апскейлить и доработать. В общем, как-то так, пока не вышла SORA, а я не прокачен в AE, приходится на ходу придумывать решения из костылей. Если есть вопросики, пишите! #tips
5 87656Loading...
02
Тридевятый архив: Панельск 💀 Давно хотел создать свою карманную вселенную, в рамках которой можно рассказывать жанровые истории. Итак! Тридевятый архив: это found footage (псевдодокументальный жанр) из альтернативной реальности постсоветского пространства, которое переплетается с необъяснимыми аномалиями и секретными проектами. Этот файл посвящен проекту "Панельск" — ходячему городу, перспективной и амбициозной разработке, который, в последствии, был заброшен. Если задумка найдет отклик, то займусь реализацией других файлов из архива, пока SORA не вышла. Инструменты: Midjourney, Stable, Photoshop, Suno, CapCut.
8 359295Loading...
03
Королевская серия 👑👺 Я, признаюсь, в восторге от официального портрета короля Ричарда III. Абсолютно инфернальный, но из-за этого — впечатляющий. Представил, что еще королевского можно показать в таком стиле.
9 48436Loading...
04
Open AI и Google: итоги. Специально дождался двух ключевых презентаций, чтобы собрать мысли в кучу и поделиться с вами несколькими тезисами. 1. Презентации OpenAI - это новые "те самые" презентации Apple. Только лучше. Когда ты такой: "ЧТООООО?!" и трясущимися руками пытаешься подобрать челюсть с пола. При этом без миллионного продакшена и свистоперделок мемного диджея (привет, Гугл). Только продукт и его техномагия. Что на самом деле показали? Новую веху. Почему? Если убрать все рядовые (хоть и крутые) обновления текущих продуктов, то останется самое важное - нам показали новый мультимодальный способ взаимодействия с ИИ, который скоро станет новой нормой. Бесшовное и естественное общение голосом + возможность нейросети "видеть" то, что видите вы в реальном времени - это, как говорили классики, историческая ступень. Одна из важнейших областей разработки в сфере - это не сами модели, а интерфейс и опыт использования. Как этими моделями будут пользоваться? Чат-бот, например, был и остается хорошим решением. Но время двигаться дальше. Дайте железа. С точки зрения удобства и привычки, общение по телефону - база. Но думаю, что все же нас ждет новый тип мобильных устройств, рассчитанных на новые мультимодальные возможности. Такие уже есть, но технически провальные: Rabbit, Humane AI pin. Решение лежит в качественном симбиозе железа и софта, так что думаю, что OpenAI наверняка объединит усилия с Microsoft или Apple, чтобы сделать железяку, идеально подходящую для их моделей. А Google на этом давно руку набил (тот же Pixel), и решение с очками уже выглядит перспективно. Что в итоге? Очень интересно, но ничего не понятно. С одной стороны, оказываемся в реальности из фантастических фильмов, с другой, поднимается еще больше вопросов. Не усилит ли это изоляцию, когда мы предпочтем общение с идеально понимающей нас нейросетью живым людям? Какие сферы пострадают и что им делать? Те же переводчики или тьюторы? Одно можно посоветовать точно: спите 8 часов, правильно питайтесь, заботьтесь о себе и своих близких.
11 51068Loading...
05
Literally me (через пару недель) 😬
8 96428Loading...
06
Если вы пропустили, Денис уже накатал саммари презентации. От себя могу сказать, что: огонь, пушка, бомба. Жду возможность прикрутить голос Скарлет Йоханссон, чтобы полностью отказаться в фильме «Her» (усы у меня уже есть).
7 47511Loading...
07
– Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах. – GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали. – GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее. – Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок). – Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран. Дополнительные мелочи: — Заявленные фичи выкатят через пару недель. — Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим); — Во время демки ассистент тормозил хехе. А вот что я предсказывал в посте выше и что сбылось или не сбылось: ✅ Демку ассистента как из фильма Her ✅ Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте ❓ Размер контекстного окна в 1М (мы не знаем пока) ✅ Новую архитектуру к новой модели, у которой сразу будут все фишки выше ✅ GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны) ❌ Новую версию Dalle 3, с улучшенным фотореализмом
7 394219Loading...
08
Интерактив с разговором 🤯
8 3492Loading...
09
🍿 Через 10 минут начнется презентация OpenAI — смотрим, чем Альтман будет удивлять. https://www.youtube.com/live/DQacCB9tDaw?si=rT4ow2ugBndRwm9G
8 87241Loading...
10
😎 Немного контента про волшебную нейрошарманку #Suno. 1. Сделал GPT'шку для автоматической разметки текстов песен. Указываете жанр и кидаете свой текст — получаете его обратно с проставленными [verse], [сhorus] и прочими важностями для модели. Если хотите больше контроля, то второй пункт: 2. Сделал шпаргалку по использованию метатэгов в текстах: База: текст песни важнее метатегов. Тэги лишь помогают модели, но не гарантируют результат. Структура текста, стиль и жанр влияют сильнее. Подбирайте метатеги по жанру! Основная структура: Куплет [Verse] - ритмичный и сдержанный Припев [Chorus] - мелодичный и энергичный, главный "хук" песни Дополнительные части песни: Предприпев [Pre-chorus] - промежуточная часть между куплетом и припевом Бридж [Bridge] - часть песни, отличающаяся от основной структуры, создает переход Другие части структуры: Интро [Intro] - тег не всегда работает, лучше описать как [instrumental intro] Хук [Hook] - повторяющаяся фраза или инструментальная часть Брейк [Break] - короткая пауза, где ведущие инструменты или вокал замолкают Интерлюдия [Interlude] - инструментальная секция внутри песни Аутро [Outro] - завершающая часть песни, можно использовать теги [Refrain] или [Big Finish] Инструментальные теги: Можно использовать для создания инструментальных секций, например: [Instrumental Interlude], [Melodic Bass], [Percussion Break]. Важно учитывать жанр песни при использовании инструментальных тегов Голосовые теги: Стиль вокала и пол исполнителя могут быть описаны в промпте стиля и жанра. Можно использовать стилевые вокальные теги, например: [Female Narrator], [Diva Solo], [Gospel Choir] 3. Выложил Шашлычок на Ютуб (кто-то просил в комментариях).
12 191323Loading...
Photo unavailableShow in Telegram
Немного процесса из Панельска. Помимо сотни генераций самих домов и различных ассетов, а также ретуши и композинга, попробовал несколько новых приемов. Интеграция реальной съемки. Здесь понял, что катастрофически не хватает навыков в видеокомпозинге, поэтому иду учить After Effects. Хорошо, что товарищ помог вырезать руки (Антон, с меня пиво). Из интересного: на напечатанный чертеж полил немного кофе и подпалил зажигалкой для фактурности, а снимал на фоне зеленого чемодана. Апскейл сцены для разных масштабов. Раньше пробовал такое в клипе, но здесь решил пойти еще дальше (буквально), можно увидеть на примере с панелькой на двух ногах. Тиражирование персонажа. Вот здесь интересно, на основе этого дома попробовал сделать 3D-модель с помощью instantmesh. Сама модель плохенькая, но прикол в том, что сервис дает картинкой несколько поз персонажа. В ужасном качестве, но ведь это можно апскейлить и доработать. В общем, как-то так, пока не вышла SORA, а я не прокачен в AE, приходится на ходу придумывать решения из костылей. Если есть вопросики, пишите! #tips
Show all...
👍 106🔥 42 19🤯 2
00:57
Video unavailableShow in Telegram
Тридевятый архив: Панельск 💀 Давно хотел создать свою карманную вселенную, в рамках которой можно рассказывать жанровые истории. Итак! Тридевятый архив: это found footage (псевдодокументальный жанр) из альтернативной реальности постсоветского пространства, которое переплетается с необъяснимыми аномалиями и секретными проектами. Этот файл посвящен проекту "Панельск" — ходячему городу, перспективной и амбициозной разработке, который, в последствии, был заброшен. Если задумка найдет отклик, то займусь реализацией других файлов из архива, пока SORA не вышла. Инструменты: Midjourney, Stable, Photoshop, Suno, CapCut.
Show all...
305🔥 162👍 40🤯 11😱 2
Королевская серия 👑👺 Я, признаюсь, в восторге от официального портрета короля Ричарда III. Абсолютно инфернальный, но из-за этого — впечатляющий. Представил, что еще королевского можно показать в таком стиле.
Show all...
🔥 97👍 20👻 7 4
00:30
Video unavailableShow in Telegram
Open AI и Google: итоги. Специально дождался двух ключевых презентаций, чтобы собрать мысли в кучу и поделиться с вами несколькими тезисами. 1. Презентации OpenAI - это новые "те самые" презентации Apple. Только лучше. Когда ты такой: "ЧТООООО?!" и трясущимися руками пытаешься подобрать челюсть с пола. При этом без миллионного продакшена и свистоперделок мемного диджея (привет, Гугл). Только продукт и его техномагия. Что на самом деле показали? Новую веху. Почему? Если убрать все рядовые (хоть и крутые) обновления текущих продуктов, то останется самое важное - нам показали новый мультимодальный способ взаимодействия с ИИ, который скоро станет новой нормой. Бесшовное и естественное общение голосом + возможность нейросети "видеть" то, что видите вы в реальном времени - это, как говорили классики, историческая ступень. Одна из важнейших областей разработки в сфере - это не сами модели, а интерфейс и опыт использования. Как этими моделями будут пользоваться? Чат-бот, например, был и остается хорошим решением. Но время двигаться дальше. Дайте железа. С точки зрения удобства и привычки, общение по телефону - база. Но думаю, что все же нас ждет новый тип мобильных устройств, рассчитанных на новые мультимодальные возможности. Такие уже есть, но технически провальные: Rabbit, Humane AI pin. Решение лежит в качественном симбиозе железа и софта, так что думаю, что OpenAI наверняка объединит усилия с Microsoft или Apple, чтобы сделать железяку, идеально подходящую для их моделей. А Google на этом давно руку набил (тот же Pixel), и решение с очками уже выглядит перспективно. Что в итоге? Очень интересно, но ничего не понятно. С одной стороны, оказываемся в реальности из фантастических фильмов, с другой, поднимается еще больше вопросов. Не усилит ли это изоляцию, когда мы предпочтем общение с идеально понимающей нас нейросетью живым людям? Какие сферы пострадают и что им делать? Те же переводчики или тьюторы? Одно можно посоветовать точно: спите 8 часов, правильно питайтесь, заботьтесь о себе и своих близких.
Show all...
👍 151 54👻 14🤔 2🔥 1
Photo unavailableShow in Telegram
Literally me (через пару недель) 😬
Show all...
164👻 36🔥 23👍 9🤔 3😱 2
Если вы пропустили, Денис уже накатал саммари презентации. От себя могу сказать, что: огонь, пушка, бомба. Жду возможность прикрутить голос Скарлет Йоханссон, чтобы полностью отказаться в фильме «Her» (усы у меня уже есть).
Show all...
48🔥 14🤯 6🤔 2
Repost from Denis Sexy IT 🤖
– Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах. – GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали. – GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее. – Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок). – Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран. Дополнительные мелочи: — Заявленные фичи выкатят через пару недель. — Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим); — Во время демки ассистент тормозил хехе. А вот что я предсказывал в посте выше и что сбылось или не сбылось: ✅ Демку ассистента как из фильма Her ✅ Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте ❓ Размер контекстного окна в 1М (мы не знаем пока) ✅ Новую архитектуру к новой модели, у которой сразу будут все фишки выше ✅ GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны) ❌ Новую версию Dalle 3, с улучшенным фотореализмом
Show all...
45👍 14🔥 7👻 3😱 2
Интерактив с разговором 🤯
Show all...
🤯 33👍 8
🍿 Через 10 минут начнется презентация OpenAI — смотрим, чем Альтман будет удивлять. https://www.youtube.com/live/DQacCB9tDaw?si=rT4ow2ugBndRwm9G
Show all...
OpenAI Spring Update

We’ll be streaming live at 10AM PT Monday, May 13 to demo some ChatGPT and GPT-4 updates.

🔥 20👻 2
😎 Немного контента про волшебную нейрошарманку #Suno. 1. Сделал GPT'шку для автоматической разметки текстов песен. Указываете жанр и кидаете свой текст — получаете его обратно с проставленными [verse], [сhorus] и прочими важностями для модели. Если хотите больше контроля, то второй пункт: 2. Сделал шпаргалку по использованию метатэгов в текстах: База: текст песни важнее метатегов. Тэги лишь помогают модели, но не гарантируют результат. Структура текста, стиль и жанр влияют сильнее. Подбирайте метатеги по жанру! Основная структура: Куплет [Verse] - ритмичный и сдержанный Припев [Chorus] - мелодичный и энергичный, главный "хук" песни Дополнительные части песни: Предприпев [Pre-chorus] - промежуточная часть между куплетом и припевом Бридж [Bridge] - часть песни, отличающаяся от основной структуры, создает переход Другие части структуры: Интро [Intro] - тег не всегда работает, лучше описать как [instrumental intro] Хук [Hook] - повторяющаяся фраза или инструментальная часть Брейк [Break] - короткая пауза, где ведущие инструменты или вокал замолкают Интерлюдия [Interlude] - инструментальная секция внутри песни Аутро [Outro] - завершающая часть песни, можно использовать теги [Refrain] или [Big Finish] Инструментальные теги: Можно использовать для создания инструментальных секций, например: [Instrumental Interlude], [Melodic Bass], [Percussion Break]. Важно учитывать жанр песни при использовании инструментальных тегов Голосовые теги: Стиль вокала и пол исполнителя могут быть описаны в промпте стиля и жанра. Можно использовать стилевые вокальные теги, например: [Female Narrator], [Diva Solo], [Gospel Choir] 3. Выложил Шашлычок на Ютуб (кто-то просил в комментариях).
Show all...
ChatGPT - SUNO lyric editor

Editing your lyric according to SUNO music generator metatags.

58👍 31🔥 14
Go to the archive of posts