Ai molodca 🤖

Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov. Хаб: @AIMolodcaHub «Al molodca - это канал в телеге, где какой-то чувак показывает картинки, которые делает компьютер» © Bing На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU

Russia27 262Russian29 617Technologies & Applications3 923

Advertising posts

20 666

Subscribers

+424 hours

+447 days

+130 days

8 687

Post views

No data24 hours

No data48 hours

42.03%

Engagement rate

No data24 hours

No data48 hours

301

Mentions

57 days

630 days

No data

Posts per day

~ 163

Reactions

~ 28

Comments

~ 66

Reposts

Posting time distributions

Data loading in progress...

Find out who reads your channel

This graph will show you who besides your subscribers reads your channel and learn about other sources of traffic.

Publication analysis

Posts	Views	Shares	Views dynamics
01 Немного процесса из Панельска. Помимо сотни генераций самих домов и различных ассетов, а также ретуши и композинга, попробовал несколько новых приемов. Интеграция реальной съемки. Здесь понял, что катастрофически не хватает навыков в видеокомпозинге, поэтому иду учить After Effects. Хорошо, что товарищ помог вырезать руки (Антон, с меня пиво). Из интересного: на напечатанный чертеж полил немного кофе и подпалил зажигалкой для фактурности, а снимал на фоне зеленого чемодана. Апскейл сцены для разных масштабов. Раньше пробовал такое в клипе, но здесь решил пойти еще дальше (буквально), можно увидеть на примере с панелькой на двух ногах. Тиражирование персонажа. Вот здесь интересно, на основе этого дома попробовал сделать 3D-модель с помощью instantmesh. Сама модель плохенькая, но прикол в том, что сервис дает картинкой несколько поз персонажа. В ужасном качестве, но ведь это можно апскейлить и доработать. В общем, как-то так, пока не вышла SORA, а я не прокачен в AE, приходится на ходу придумывать решения из костылей. Если есть вопросики, пишите! #tips	5 876	56	Loading...
02 Тридевятый архив: Панельск 💀 Давно хотел создать свою карманную вселенную, в рамках которой можно рассказывать жанровые истории. Итак! Тридевятый архив: это found footage (псевдодокументальный жанр) из альтернативной реальности постсоветского пространства, которое переплетается с необъяснимыми аномалиями и секретными проектами. Этот файл посвящен проекту "Панельск" — ходячему городу, перспективной и амбициозной разработке, который, в последствии, был заброшен. Если задумка найдет отклик, то займусь реализацией других файлов из архива, пока SORA не вышла. Инструменты: Midjourney, Stable, Photoshop, Suno, CapCut.	8 359	295	Loading...
03 Королевская серия 👑👺 Я, признаюсь, в восторге от официального портрета короля Ричарда III. Абсолютно инфернальный, но из-за этого — впечатляющий. Представил, что еще королевского можно показать в таком стиле.	9 484	36	Loading...
04 Open AI и Google: итоги. Специально дождался двух ключевых презентаций, чтобы собрать мысли в кучу и поделиться с вами несколькими тезисами. 1. Презентации OpenAI - это новые "те самые" презентации Apple. Только лучше. Когда ты такой: "ЧТООООО?!" и трясущимися руками пытаешься подобрать челюсть с пола. При этом без миллионного продакшена и свистоперделок мемного диджея (привет, Гугл). Только продукт и его техномагия. Что на самом деле показали? Новую веху. Почему? Если убрать все рядовые (хоть и крутые) обновления текущих продуктов, то останется самое важное - нам показали новый мультимодальный способ взаимодействия с ИИ, который скоро станет новой нормой. Бесшовное и естественное общение голосом + возможность нейросети "видеть" то, что видите вы в реальном времени - это, как говорили классики, историческая ступень. Одна из важнейших областей разработки в сфере - это не сами модели, а интерфейс и опыт использования. Как этими моделями будут пользоваться? Чат-бот, например, был и остается хорошим решением. Но время двигаться дальше. Дайте железа. С точки зрения удобства и привычки, общение по телефону - база. Но думаю, что все же нас ждет новый тип мобильных устройств, рассчитанных на новые мультимодальные возможности. Такие уже есть, но технически провальные: Rabbit, Humane AI pin. Решение лежит в качественном симбиозе железа и софта, так что думаю, что OpenAI наверняка объединит усилия с Microsoft или Apple, чтобы сделать железяку, идеально подходящую для их моделей. А Google на этом давно руку набил (тот же Pixel), и решение с очками уже выглядит перспективно. Что в итоге? Очень интересно, но ничего не понятно. С одной стороны, оказываемся в реальности из фантастических фильмов, с другой, поднимается еще больше вопросов. Не усилит ли это изоляцию, когда мы предпочтем общение с идеально понимающей нас нейросетью живым людям? Какие сферы пострадают и что им делать? Те же переводчики или тьюторы? Одно можно посоветовать точно: спите 8 часов, правильно питайтесь, заботьтесь о себе и своих близких.	11 510	68	Loading...
05 Literally me (через пару недель) 😬	8 964	28	Loading...
06 Если вы пропустили, Денис уже накатал саммари презентации. От себя могу сказать, что: огонь, пушка, бомба. Жду возможность прикрутить голос Скарлет Йоханссон, чтобы полностью отказаться в фильме «Her» (усы у меня уже есть).	7 475	11	Loading...
07 – Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах. – GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали. – GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее. – Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок). – Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран. Дополнительные мелочи: — Заявленные фичи выкатят через пару недель. — Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим); — Во время демки ассистент тормозил хехе. А вот что я предсказывал в посте выше и что сбылось или не сбылось: ✅ Демку ассистента как из фильма Her ✅ Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте ❓ Размер контекстного окна в 1М (мы не знаем пока) ✅ Новую архитектуру к новой модели, у которой сразу будут все фишки выше ✅ GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны) ❌ Новую версию Dalle 3, с улучшенным фотореализмом	7 394	219	Loading...
08 Интерактив с разговором 🤯	8 349	2	Loading...
09 🍿 Через 10 минут начнется презентация OpenAI — смотрим, чем Альтман будет удивлять. https://www.youtube.com/live/DQacCB9tDaw?si=rT4ow2ugBndRwm9G	8 872	41	Loading...
10 😎 Немного контента про волшебную нейрошарманку #Suno. 1. Сделал GPT'шку для автоматической разметки текстов песен. Указываете жанр и кидаете свой текст — получаете его обратно с проставленными [verse], [сhorus] и прочими важностями для модели. Если хотите больше контроля, то второй пункт: 2. Сделал шпаргалку по использованию метатэгов в текстах: База: текст песни важнее метатегов. Тэги лишь помогают модели, но не гарантируют результат. Структура текста, стиль и жанр влияют сильнее. Подбирайте метатеги по жанру! Основная структура: Куплет [Verse] - ритмичный и сдержанный Припев [Chorus] - мелодичный и энергичный, главный "хук" песни Дополнительные части песни: Предприпев [Pre-chorus] - промежуточная часть между куплетом и припевом Бридж [Bridge] - часть песни, отличающаяся от основной структуры, создает переход Другие части структуры: Интро [Intro] - тег не всегда работает, лучше описать как [instrumental intro] Хук [Hook] - повторяющаяся фраза или инструментальная часть Брейк [Break] - короткая пауза, где ведущие инструменты или вокал замолкают Интерлюдия [Interlude] - инструментальная секция внутри песни Аутро [Outro] - завершающая часть песни, можно использовать теги [Refrain] или [Big Finish] Инструментальные теги: Можно использовать для создания инструментальных секций, например: [Instrumental Interlude], [Melodic Bass], [Percussion Break]. Важно учитывать жанр песни при использовании инструментальных тегов Голосовые теги: Стиль вокала и пол исполнителя могут быть описаны в промпте стиля и жанра. Можно использовать стилевые вокальные теги, например: [Female Narrator], [Diva Solo], [Gospel Choir] 3. Выложил Шашлычок на Ютуб (кто-то просил в комментариях).	12 191	323	Loading...

Photo unavailableShow in Telegram

Немного процесса из Панельска. Помимо сотни генераций самих домов и различных ассетов, а также ретуши и композинга, попробовал несколько новых приемов. Интеграция реальной съемки. Здесь понял, что катастрофически не хватает навыков в видеокомпозинге, поэтому иду учить After Effects. Хорошо, что товарищ помог вырезать руки (Антон, с меня пиво). Из интересного: на напечатанный чертеж полил немного кофе и подпалил зажигалкой для фактурности, а снимал на фоне зеленого чемодана. Апскейл сцены для разных масштабов. Раньше пробовал такое в клипе, но здесь решил пойти еще дальше (буквально), можно увидеть на примере с панелькой на двух ногах. Тиражирование персонажа. Вот здесь интересно, на основе этого дома попробовал сделать 3D-модель с помощью instantmesh. Сама модель плохенькая, но прикол в том, что сервис дает картинкой несколько поз персонажа. В ужасном качестве, но ведь это можно апскейлить и доработать. В общем, как-то так, пока не вышла SORA, а я не прокачен в AE, приходится на ходу придумывать решения из костылей. Если есть вопросики, пишите! #tips

Show all...

👍 106🔥 42❤ 19🤯 2

00:57

Video unavailableShow in Telegram

Тридевятый архив: Панельск 💀 Давно хотел создать свою карманную вселенную, в рамках которой можно рассказывать жанровые истории. Итак! Тридевятый архив: это found footage (псевдодокументальный жанр) из альтернативной реальности постсоветского пространства, которое переплетается с необъяснимыми аномалиями и секретными проектами. Этот файл посвящен проекту "Панельск" — ходячему городу, перспективной и амбициозной разработке, который, в последствии, был заброшен. Если задумка найдет отклик, то займусь реализацией других файлов из архива, пока SORA не вышла. Инструменты: Midjourney, Stable, Photoshop, Suno, CapCut.

Show all...

❤ 305🔥 162👍 40🤯 11😱 2

Photo unavailableShow in Telegram
Photo unavailableShow in Telegram
Photo unavailableShow in Telegram
Photo unavailableShow in Telegram
Photo unavailableShow in Telegram
Photo unavailableShow in Telegram

Королевская серия 👑👺 Я, признаюсь, в восторге от официального портрета короля Ричарда III. Абсолютно инфернальный, но из-за этого — впечатляющий. Представил, что еще королевского можно показать в таком стиле.

Show all...

🔥 97👍 20👻 7❤ 4

00:30

Video unavailableShow in Telegram

Open AI и Google: итоги. Специально дождался двух ключевых презентаций, чтобы собрать мысли в кучу и поделиться с вами несколькими тезисами. 1. Презентации OpenAI - это новые "те самые" презентации Apple. Только лучше. Когда ты такой: "ЧТООООО?!" и трясущимися руками пытаешься подобрать челюсть с пола. При этом без миллионного продакшена и свистоперделок мемного диджея (привет, Гугл). Только продукт и его техномагия. Что на самом деле показали? Новую веху. Почему? Если убрать все рядовые (хоть и крутые) обновления текущих продуктов, то останется самое важное - нам показали новый мультимодальный способ взаимодействия с ИИ, который скоро станет новой нормой. Бесшовное и естественное общение голосом + возможность нейросети "видеть" то, что видите вы в реальном времени - это, как говорили классики, историческая ступень. Одна из важнейших областей разработки в сфере - это не сами модели, а интерфейс и опыт использования. Как этими моделями будут пользоваться? Чат-бот, например, был и остается хорошим решением. Но время двигаться дальше. Дайте железа. С точки зрения удобства и привычки, общение по телефону - база. Но думаю, что все же нас ждет новый тип мобильных устройств, рассчитанных на новые мультимодальные возможности. Такие уже есть, но технически провальные: Rabbit, Humane AI pin. Решение лежит в качественном симбиозе железа и софта, так что думаю, что OpenAI наверняка объединит усилия с Microsoft или Apple, чтобы сделать железяку, идеально подходящую для их моделей. А Google на этом давно руку набил (тот же Pixel), и решение с очками уже выглядит перспективно. Что в итоге? Очень интересно, но ничего не понятно. С одной стороны, оказываемся в реальности из фантастических фильмов, с другой, поднимается еще больше вопросов. Не усилит ли это изоляцию, когда мы предпочтем общение с идеально понимающей нас нейросетью живым людям? Какие сферы пострадают и что им делать? Те же переводчики или тьюторы? Одно можно посоветовать точно: спите 8 часов, правильно питайтесь, заботьтесь о себе и своих близких.

Show all...

👍 151❤ 54👻 14🤔 2🔥 1

Photo unavailableShow in Telegram

Literally me (через пару недель) 😬

Show all...

❤ 164👻 36🔥 23👍 9🤔 3😱 2

Если вы пропустили, Денис уже накатал саммари презентации. От себя могу сказать, что: огонь, пушка, бомба. Жду возможность прикрутить голос Скарлет Йоханссон, чтобы полностью отказаться в фильме «Her» (усы у меня уже есть).

Show all...

❤ 48🔥 14🤯 6🤔 2

Repost from Denis Sexy IT 🤖

– Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах. – GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали. – GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее. – Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок). – Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран. Дополнительные мелочи: — Заявленные фичи выкатят через пару недель. — Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим); — Во время демки ассистент тормозил хехе. А вот что я предсказывал в посте выше и что сбылось или не сбылось: ✅ Демку ассистента как из фильма Her ✅ Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте ❓ Размер контекстного окна в 1М (мы не знаем пока) ✅ Новую архитектуру к новой модели, у которой сразу будут все фишки выше ✅ GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны) ❌ Новую версию Dalle 3, с улучшенным фотореализмом

Show all...

❤ 45👍 14🔥 7👻 3😱 2

Интерактив с разговором 🤯

Show all...

🤯 33👍 8

🍿 Через 10 минут начнется презентация OpenAI — смотрим, чем Альтман будет удивлять. https://www.youtube.com/live/DQacCB9tDaw?si=rT4ow2ugBndRwm9G

Show all...

OpenAI Spring Update

We’ll be streaming live at 10AM PT Monday, May 13 to demo some ChatGPT and GPT-4 updates.

🔥 20👻 2

😎 Немного контента про волшебную нейрошарманку #Suno. 1. Сделал GPT'шку для автоматической разметки текстов песен. Указываете жанр и кидаете свой текст — получаете его обратно с проставленными [verse], [сhorus] и прочими важностями для модели. Если хотите больше контроля, то второй пункт: 2. Сделал шпаргалку по использованию метатэгов в текстах: База: текст песни важнее метатегов. Тэги лишь помогают модели, но не гарантируют результат. Структура текста, стиль и жанр влияют сильнее. Подбирайте метатеги по жанру! Основная структура: Куплет [Verse] - ритмичный и сдержанный Припев [Chorus] - мелодичный и энергичный, главный "хук" песни Дополнительные части песни: Предприпев [Pre-chorus] - промежуточная часть между куплетом и припевом Бридж [Bridge] - часть песни, отличающаяся от основной структуры, создает переход Другие части структуры: Интро [Intro] - тег не всегда работает, лучше описать как [instrumental intro] Хук [Hook] - повторяющаяся фраза или инструментальная часть Брейк [Break] - короткая пауза, где ведущие инструменты или вокал замолкают Интерлюдия [Interlude] - инструментальная секция внутри песни Аутро [Outro] - завершающая часть песни, можно использовать теги [Refrain] или [Big Finish] Инструментальные теги: Можно использовать для создания инструментальных секций, например: [Instrumental Interlude], [Melodic Bass], [Percussion Break]. Важно учитывать жанр песни при использовании инструментальных тегов Голосовые теги: Стиль вокала и пол исполнителя могут быть описаны в промпте стиля и жанра. Можно использовать стилевые вокальные теги, например: [Female Narrator], [Diva Solo], [Gospel Choir] 3. Выложил Шашлычок на Ютуб (кто-то просил в комментариях).

Show all...

ChatGPT - SUNO lyric editor

Editing your lyric according to SUNO music generator metatags.

❤ 58👍 31🔥 14

Go to the archive of posts