Generative Ai
Открыть в Telegram
Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience, Generative Ai, LLM, LangChain, ChatGPT По рекламе писать @miralinka, Created by @life2film
Больше3 677
Подписчики
+424 часа
+827 дней
+9130 день
Архив постов
3 679
Repost from Machinelearning
🔥 SOTA: Stable Diffusion 3:вышла! 🔥
Stable Diffusion 3 - это новая технология преобразования текста в изображение SOTA.
Новая архитектура Multimodal Diffusion Transformer (MM Bit) использует отдельные наборы весов для изображений и языка, улучшая возможности понимания текста / правописания.
✅ Новая масштабируемая архитектура для синтеза текста в изображение
✅ Двунаправленное смешивание потоков токенов текста и изображений
✅ Самые крупные модели превосходят открытые модели SOTA, такие как SDXL
▪Blog: https://stability.ai/news/stable-diffusion-3-research-paper
▪ Paper: https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf
ai_machinelearning_big_data
3 679
Друзья, очень всем советую запись вебинара CB Insights по Generative AI - https://www.cbinsights.com/research/briefing/webinar-generative-ai-predictions-2024/recording/
кому лень - суммирую 2 словами:
1. ХАЙП
2. НЕОПРЕДЕЛЕННОСТЬ
3 679
Repost from N/a
Hey, friends!
We've made SuperDuperAI so you can make some really cool videos just by using text. https://superduperai.co/
All you need to do is describe the video you want to create, and our AI will create a fully generated video for you, crafting scenes, music, voiceovers, and much more!
3 679
Repost from Технологии | Нейросети | Боты
🥳 Stable Diffusion 3.0
Компания Stability AI выпустила предварительную версию Stable Diffusion 3.0, своей следующей флагманской модели text2image.
Улучшено качество изображений, улучшено написание текста
(?! смотрим прикреплённую пикчу), более высокая производительность и тд.
На данный момент доступ через лист ожидания.
• Подробнее
3 679
Repost from Kali Novskaya
OpenAI только что выпустили SORA— text2video модель
Генерация видео по текстовому описанию наступила!
Сегодня обещают статью
Промпт:
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
🟣https://openai.com/sora#research3 679
Всем привет! Мы с командой сегодня запускаем на Product Hunt продукт, который может быть полезен любому, кто любит делать заметки, а также генерирует контент (например, идеи для питчдека, статьи или даже просто посты для социальных сетей).
Flipner AI - это платформа, одновременно представляющая собой контент-хаб для структурирования разных заметок и AI-ассистента для генерации текстов на основе авторских идей и мыслей.
Будем очень благодарны за поддержку нашего запуска: https://www.producthunt.com/posts/flipner-ai
3 679
Repost from Machinelearning
🎉 Release Code Llama 70B!
Вышла Code Llama 70B: новая, более производительная версия LLM для генерации кода - доступная по той же лицензии, что и предыдущие модели Code Llama.
- Base https://hf.co/codellama/CodeLlama-70b-hf
- Python https://hf.co/codellama/CodeLlama-70b-Python-hf
- Instruct https://hf.co/codellama/CodeLlama-70b-Instruct-hf
CodeLlama-70B-Instruct достигает 67,8 балла в HumanEval, что делает ее одной из самых высокопроизводительных открытых моделей на сегодняшний день.
CodeLlama-70B - это самая производительная база для тонкой настройки моделей генерации кода.
✅ Разрешено коммерческое использование
➡️Скачать модели
@ai_machinelearning_big_data
3 679
Repost from ML for Value / Ваня Максимов
GPT-4 не особо впечатлил меня
Весь прошлый год хайповали LLM-ки и GenAI. Которые вроде крутые, но в массовое внедрение в бизнесы пока не вошли. Шок, но даже массовой замены поддержки на ChatGPT пока не случилось
В это же время мимо меня прошел релиз DINO-v2 🦕
И вот он уже очень меня очень удивил
Self Supervised Learning на картинках
Вдумайтесь: мы просто показали нейронке картинки без лейблов, аннотации текста и вообще чего-то еще, и получилось выучить SOTA фичи! Бьет даже OpenCLIP в zero-shot сетапе
Широта применения
Работает для классификации, сегментации, оценки карты глубины и кучи других задач
В общем, я бы ставил на подобные self-supervised encoder модели для применения в бизнесе, чем на gpt-like (вспомните бум BERT). Ну а пока можете потыкать демо DINO-v2
P.S. К посту прикреплены скрины оценки карты глубины, сегментации объектов и матчинга точек между 2умя картинками
3 679
«Нейронные сети дали новое дыхание рынку приложений и сервисов, в котором ощущалась стагнация последние несколько лет»
Из нового выпуска подкаста «Сегодня на ретро» от @Selectel узнали, насколько безопасны нейросети, как использовать их этично, с какими задачами помогает ИИ разработчикам и бизнесу уже сейчас. Бонусом в выпуске заглянули и в будущее: как понять, что ты «ямщик» и твоя профессия скоро исчезнет, как перестроиться и что делать джунам. Делились своей экспертизой, взглядами и прогнозами:
— Владимир Туров, разработчик Selectel, ИИ-энтузиаст ;
— Альфред Столяров, директор EvApps.
Смотрели выпуск на YouTube-канале Selectel и подписались, чтобы не пропустить новые выпуски подкаста: https://slc.tl/4yh5z
Реклама ООО «Селектел» erid 2VtzquXxU9C
3 679
idea2movie (VideoGPT) на OpenAI Store.
🎬 idea2movie (VideoGPT) - это готовое решение в мире создания видео. Просто напишите в чате запрос, описывая видео, которое вы хотите создать.
⏳ После отправки запроса, вам нужно будет немного подождать. Всего через 5-10 минут вы получите ссылку на скачивание вашего персонализированного видео, полностью сгенерированного с помощью нейронных сетей.
Инструмент для авторов, маркетологов, образовательных учреждений и всех, кто ищет уникальный способ для воплощения своих идей в видео.
👀Посетите idea2movie (VideoGPT) прямо сейчас!
3 679
Repost from AI для Всех
🚀 Keynote: Следующее поколения ИИ для разработчиков
На докладе был продемонстрирован ряд новых интересных инструментов для работы с искусственным интеллектом и облачными вычислениями, что подчеркивает стремление компании интегрировать искусственный интеллект в свои основные сервисы.
- Microsoft Cloud и Copilot Stack: Интеграция искусственного интеллекта в каждое облачное решение, преобразующее работу разработчиков с Azure, которая теперь предлагает платформу для приложений, данных и искусственного интеллекта.
- Copilot для Microsoft 365: Использование больших языковых моделей (LLM) OpenAI и Microsoft Graph, обеспечивающих улучшенный пользовательский опыт.
- Security Copilot: Предлагает специализированные знания для обеспечения безопасности организации.
- Microsoft Copilot Studio: No/low code решение без кода с тысячами готовых плагинов, упрощающее создание новых приложений Copilot.
- GitHub Copilot: Теперь более мощный, с такими возможностями, как объяснение кода в Visual Studio Code и быстрое исправление ошибок.
- Синергия данных и ИИ: Признавая важность данных, Microsoft подчеркнула успех ChatGPT, работающего на базе Azure Cosmos DB, и представила Microsoft Fabric для расширенной аналитики данных.
- Инновационные функции: Векторный поиск в Azure AI Search и полный доступ к лучшим моделям OpenAI.
- Партнерство с NVidia: Продвижение NeMO для расширения возможностей ИИ.
- Chat Studio: Интуитивно понятная платформа для создания и настройки решений для чатов с легкой интеграцией поиска Azure AI и озер данных.
- PromptFlow: Визуальный интерфейс для создания цепочек промптов, Python и RAG, развертываемый как Azure endpoint.
- Azure Content Safety: Внедрение фильтров контента и настраиваемых параметров допустимости для более безопасного контента.
Выводы
Акцент Microsoft на простоте использования, безопасности и надежной аналитике данных указывает на значительный сдвиг в сторону ИИ-ориентированных решений, упрощающих сложные задачи и стимулирующих инновации среди разработчиков.
3 679
imaginAIry - консольная утилита для генерация изображений и видео!
https://github.com/brycedrennan/imaginAIry
3 679
OpenVoice: Instantly clone any voice and generate speech in any style and any language!
We are trending #1 on Github!
https://research.myshell.ai/open-voice
https://github.com/myshell-ai/OpenVoice
3 679
Repost from Метаверсище и ИИще
Дримувинг - анимация людей от Алибабы или Video ControlNet.
Алибаба серьезно вваливается на рынок генераторов контента.
Вот смотрите, что они опять выкатили.
DreaMoving: A Human Video Generation Framework based on Diffusion Models
Там внутри Video ControlNet для управления движением и Content Guider для сохранения идентичности. Можно самим попробовать и даже развести локально.
На входе одно фото.
Информация и все ссылки тут: https://dreamoving.github.io/dreamoving/
Демо на попробовать тут: https://huggingface.co/spaces/jiayong/Dreamoving
И обязательно поглядите вот этот твиттор, там очень много примеров использования:
https://twitter.com/heybarsee/status/1741106778849300900
3 679
Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation
https://humanaigc.github.io/animate-anyone/
3 679
https://youtu.be/8PCn5hLKNu4
Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation
https://humanaigc.github.io/animate-anyone/
3 679
https://youtu.be/8PCn5hLKNu4
https://humanaigc.github.io/animate-anyone/
Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation
3 679
Repost from эйай ньюз
Самая мощная LLM в опесорсе, Mixtral 8x7B MoE от Mistral AI, теперь доступна во фреймворке Сandle* - с поддержкой квантизации. За счет квантизации модели могут работать локально на ноутбуке с 32 GB RAM.
Например, 4-битная Mixtral 8x7B MoE занимает всего 26.44GB памяти. Тогда как в bf16 на GPU модель бы заняла 112+ GB VRAM (то есть влезла бы только на H100).
*Candle - это минималистский ML-фреймворк для Rust, сфокусированный на производительности (включая поддержку GPU) и простоте использования.
- Поддерживает 2-bit, 3-bit, 4-bit, 5-bit, 6-bit and 8-bit int квантизованные модели в gguf and ggml форматах.
- SIMD оптимизации для Apple Silicon и x86.
Вот тут можете попробовать демки разных моделей на Candle:
- Whisper, [пост в канале]
- LLaMa-2, [пост в канале]
- T5,
- YOLOv8,
- Segment Anything [пост в канале]
@ai_newz
3 679
Оказалось, что ChatGPT прекрасно понимает всю боль мужчин при температуре 37 градусов.
Интересно, что он сделает про женщин 🤔
3 679
Топ - нейронок 2023
Ведущие искусственные нейронные сети для создания изображений, видеороликов, аудиозаписей, текстов и других полезных инструментов доступны легко и без лишних сложностей. В этом обзоре представлены самые лучшие из них, а полный список доступен по ссылке в конце статьи.
ИИ-Чат-боты
Falcon — простейшее решение для диалога. Зайдите на сайт и начните общение.
CharacterAI — позволяет создать собственного ИИ-помощника, который можно тренировать и адаптировать под личные или рабочие нужды.
Perplexity — не только поисковая система, но и чат-бот, обладающий высоким уровнем интеллекта и функциональностью, включая последнюю версию ChatGPT.
Генерация изображений с помощью ИИ
Ideogram — разработка бывших сотрудников Google, предлагает удобный интерфейс для создания изображений после простой авторизации через Google.
KREA — основной тренд конца 2023 года, позволяет генерировать изображения в реальном времени, отлично подходит для индивидуального или семейного творчества.
Fast Stable Diffusion XL— это выдающаяся версия Stable Diffusion, обеспечивающая максимальную скорость и качество. Просто введите запрос и получите результаты.
Генерация видео с помощью ИИ
SuperDuperAI - регистрируйтесь и приступайте к созданию видео. Это перспективный продукт, который пока в стадии тестирования и доступен бесплатно. Управление осуществляется через чат.
Genmo — многофункциональный инструмент с акцентом на видео, доступен бесплатно и стоит внимания.
Runway — предлагает регистрацию для создания видео с множеством функций. Начальные кредиты ограничены, далее услуги платные.
Генерация музыки с помощью ИИ
Riffusion — отличная возможность для создания музыки и сопутствующего видеоряда, идеально подходит для создания контента для TikTok, YouTube Shorts и Instagram Reels.
Suno — идеальный выбор для начала работы с музыкальной генерацией. Этот инструмент обеспечивает впечатляющие результаты.
Stable Audio — развивающийся музыкальный генератор от компании Stability, заслуживает внимания.
Другие полезные нейронные сети
Silero TTS — для генерации голоса с обширной базой различных дикторов и персонажей.
Neo Prompt — «кнопка красоты», помощник-промпт, который преобразит любой ваш запрос в привлекательный результат без необходимости обладать специальными навыками.
PixelBin — множество инструментов для ежедневных задач: улучшение качества фото, удаление фона, удаление водяных знаков и многое другое.
С какими вы уже знакомы? Если есть что добавить в список, пишите в комментариях 🤝
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
