ru
Feedback
Generative Ai

Generative Ai

Открыть в Telegram

Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience, Generative Ai, LLM, LangChain, ChatGPT По рекламе писать @miralinka, Created by @life2film

Больше
3 677
Подписчики
+424 часа
+827 дней
+9130 день
Архив постов
Repost from эйай ньюз
🔥Веса SD-3 Medium уже доступны! Stability релизнули Stable Diffusion 3 Medium. Она бесплатна для некоммерческого пользования
🔥Веса SD-3 Medium уже доступны! Stability релизнули Stable Diffusion 3 Medium. Она бесплатна для некоммерческого пользования. За коммерческое использование придётся платить: $20 в месяц для индивидуальных пользователей и небольших бизнесов, для бизнесов побольше - энтерпрайз лицензия. Блогпост Веса @ai_newz

Интро в трансформеры, LLM как операционки, модели для генерации речи и клонирования голоса, обзор Foundation models… Это и мн
Интро в трансформеры, LLM как операционки, модели для генерации речи и клонирования голоса, обзор Foundation models… Это и многое другое на Всероссийской конференции GenAI CONF! ✔️ Своими инсайтами и новейшими разработками поделятся гуру технологий из AIRI, МТС, Яндекса и Сбера. Эксклюзивная информация, плюс потрясающие возможности для нетворкинга. ✔️ Для соискателей и тех, кто ищет себя в айти — экспресс-интервью с ведущими рекрутерами крупнейших компаний — будь готов к неожиданным вопросам! ✔️ Интенсивный тренинг «Как построить карьеру в ИИ» — и не просто построить, а стремительно взлететь! ✔️Полное погружение в захватывающую ИИ-вселенную с помощью VR-шлема Pico — почувствуй себя героем цифрового мира. Всё абсолютно бесплатно 😎 Можно присоединиться и онлайн, но всё самое интересное будет на месте! 📌 Планируй своё участие на любой день: 21, 22, 23 или 24 июня. Не забудь прихватить друзей — будет незабываемо! 👣 Адрес и полную программу ищи на сайте. #десятилетиенауки #МинобрнаукиРоссии #популяризациянауки

Интро в трансформеры, LLM как операционки, модели для генерации речи и клонирования голоса, обзор Foundation models… Это и мн
Интро в трансформеры, LLM как операционки, модели для генерации речи и клонирования голоса, обзор Foundation models… Это и многое другое на Всероссийской конференции GenAI CONF! ✔️ Своими инсайтами и новейшими разработками поделятся гуру технологий из AIRI, МТС, Яндекса и Сбера. Эксклюзивная информация, плюс потрясающие возможности для нетворкинга. ✔️ Для соискателей и тех, кто ищет себя в айти — экспресс-интервью с ведущими рекрутерами крупнейших компаний — будь готов к неожиданным вопросам! ✔️ Интенсивный тренинг «Как построить карьеру в ИИ» — и не просто построить, а стремительно взлететь! ✔️Полное погружение в захватывающую ИИ-вселенную с помощью VR-шлема Pico — почувствуй себя героем цифрового мира. Всё абсолютно бесплатно 😎 Можно присоединиться и онлайн, но всё самое интересное будет на месте! 📌 Планируй своё участие на любой день: 21, 22, 23 или 24 июня. Не забудь прихватить друзей — будет незабываемо! 👣 Адрес и полную программу ищи на сайте. #десятилетиенауки #МинобрнаукиРоссии #популяризациянауки

Repost from Machinelearning
Flash Diffusion — ускорение любой диффузионной модели генерации изображений в несколько шагов Так называется работа, которую
+2
Flash Diffusion — ускорение любой диффузионной модели генерации изображений в несколько шагов Так называется работа, которую на днях опубликовали Clément Chadebec, Onur Tasar и их коллеги. Это метод дистилляции для создания быстрых диффузионных моделей. При обучении модели таким методом на наборах данных COCO2014 и COCO2017 показатели FID и CLIP-Score достигают хороших значений; при этом требуется всего несколько часов обучения на GPU и меньшее количество параметров модели, чем требуют существующие методы. 🟡 Страничка Flash Diffusion 🖥 GitHub 🤗 Flash SD 🤗 Flash SDXL @ai_machinelearning_big_data

Repost from Machinelearning
🌟 Stability AI опубликовала открытую модель Stable Audio для генерации музыки Stability AI опубликовала в открытом доступе м
🌟 Stability AI опубликовала открытую модель Stable Audio для генерации музыки Stability AI опубликовала в открытом доступе модель Stable Audio, предназначенную для генерации музыки, звуковых эффектов и окружения. Stable Audio Open — открытая модель в формате Text-to-Audio, которая генерирует 47-секундные музыкальные семплы и звуковые эффекты. К примеру, можно попросить нейросеть создать партию на фортепиано, барабанный бит, гитарный риф, пение соловья или шум дождя. Для генерации надо отправить текстовый запрос. Примечательно, что пользователи могут генерировать музыку на своих данных. К примеру, барабанщик может загрузить записи своих битов и на их основе создавать новые. В блоге компании рассказали, что открытая модель отличается от одноимённой коммерческой. Закрытая версия Stable Audio может генерировать трёхминутные треки с проработанной структурой. Также поддерживается режим Audio-to-Audio, в котором в качестве запроса можно передать уже готовый трек. Открытую модель Stable Audio Open обучили на данных сервисов FreeSound и Free Music Archive, что позволило соблюсти все требования к авторским правам. При этом для доступа к нейросети всё равно необходимо ознакомиться с лицензией использования. 🤗 Модель и веса опубликованы на Hugging Face. @ai_machinelearning_big_data

Сергей Марков дописал свою большую двухтомную книгу про ИИ «Охота на электроовец: большая книга искусственного интеллекта»! Поздравляем! Я читал ранние версии и знаю, что Сергей проделал огромную работу по сбору исторического материала. Абсолютно разумно и без хайпа, с технически достоверными обзорами архитектур. Рекомендую. Полные электронные версии книги (epub, docx, pdf) можно скачать с сайта бесплатно: https://markoff.science

Repost from Machinelearning
⚡️ Qwen2 - самый крутой релиз откртых LLM со времен Llama 3! Alibaba только что выпустили свое новое семейство мультиязычных
+4
⚡️ Qwen2 - самый крутой релиз откртых LLM со времен Llama 3! Alibaba только что выпустили свое новое семейство мультиязычных моделей, которых превосходят по производительности Llama 3 по многим параметрам. 🤯 Qwen2 выпущен в 5 размерах, обучен на 29 языках! 5️⃣ Размеры: 0.5B, 1.5B, 7B, 57B-14B (MoE), 72B. ✅ Контекст: 32k для 0.5B & 1.5B, 64k для 57B MoE, 128k для 7B и 72B ✅ Поддерживает 29 языков. 📜 Выпущены под лицензией Apache 2.0, за исключением версии 72B. 📖 BLOG: https://qwenlm.github.io/blog/qwen2/ 🤗 HF collection: https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f 🤖 https://modelscope.cn/organization/qwen 💻 GitHub: https://github.com/QwenLM/Qwen2 @ai_machinelearning_big_data

Repost from e/acc
Сегодня твиттер взорвался. Экс-сотрудник OpenAI из команды Superalignment опубликовал 165-страничный документ о будущем ИИ. Т
Сегодня твиттер взорвался. Экс-сотрудник OpenAI из команды Superalignment опубликовал 165-страничный документ о будущем ИИ. Там много деталей, фактов, индукции и вполне разумных прогнозов, поэтому прежде чем строчить гневные и безумные комментарии крайне советую прочитать сам документ. - AGI к 2027 году более чем вероятен. - После AGI переход к ASI (сверхинтеллекту) за счет самообучения будет очень быстрым, почти мгновенным - AGI — это самый существенный геополитический ресурс, куда важнее, чем ядерное оружение и страны пойдут на многое, чтобы получить его первым. В статье приводятся примеры того как китайцы шпионят за ИИ-компаниями в США. - сегодня большой дата-центр это единицы или десятки мегаватт, но с ИИ потребность вырастет на, как минимум, 4 порядка (x 10,000) - мы увидим единый вычислительный кластер стоимостью в триллион долларов в течении пяти лет. самая рациональная инвестиция со стороны state actors и big tech — это compute, атомная энергия и инфраструктура для первых двух. - NVIDIA, MSFT, AMZN, GOOG уже сегодня планируют капекс в $100B в квартал на датацентры только для ИИ - к 2030 году ежегодно и глобально будет инвестироваться $8T в ИИ (включая чипы и компьют), а так же только для ИИ будет потребляться больше чем 100% э/э генерируемой в США сегодня - к 2026 году выручка одной из big tech компаний от ИИ превысит $100B - это не безумно, и сравнимые расходы и сдвиги происходили во время Манхеттенского проекта или Промышленной революции и строительства ж/д Завтра продолжу со второй частью Если вам лень читать, то можете послушать вышедший сегодня 4-часовой подкаст о том же самом: https://www.dwarkeshpatel.com/p/leopold-aschenbrenner

Блокчейн TON ищет талантливых разработчиков! Стартует масштабный хакатон “The Open League Hackathon” с призовым пулом $2,000,
Блокчейн TON ищет талантливых разработчиков! Стартует масштабный хакатон “The Open League Hackathon” с призовым пулом $2,000,000 от команды блокчейна TON. В поддержку хакатона все Web3-энтузиасты приглашаются на трёхдневные оффлайн встречи для нетворкинга в 13 городах мира: 📍Прага, Берлин, Киев, Варшава, Тбилиси, Белград, Сеул, Тайбэй (Тайвань), Гуруграм (Индия), Гонг-Конг, Минск, Москва и Санкт-Петербург. Первые встречи начнутся уже 24 мая. Ищи свой город и регистрируйся здесь 👈 тык Что вас ждет: — 3 дня нетворка, лекций, конкурсов и работы над собственными проектами с поддержкой представителей TON Foundation и команд экосистемы TON — Призовые $5.000 для трех лучших проектов на каждом оффлайн ивенте + много мерча и других бонусов Не упусти возможность представить свое приложение 900 миллионам активных пользователей Telegram вместе с TON. Регистрируйся — https://society.ton.org/activities/open-league

Repost from Denis Sexy IT 🤖
– Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах. – GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали. – GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее. – Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок). – Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран. Дополнительные мелочи: — Заявленные фичи выкатят через пару недель. — Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим); — Во время демки ассистент тормозил хехе. А вот что я предсказывал в посте выше и что сбылось или не сбылось: ✅ Демку ассистента как из фильма Her ✅ Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте ❓ Размер контекстного окна в 1М (мы не знаем пока) ✅ Новую архитектуру к новой модели, у которой сразу будут все фишки выше ✅ GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны) ❌ Новую версию Dalle 3, с улучшенным фотореализмом

Repost from AI для Всех
Gazelle - первая open source VoiceToLLM модель TincansAI объявил о выпуске Gazelle v0.2, инновационной речевой модели, котора
Gazelle - первая open source VoiceToLLM модель TincansAI объявил о выпуске Gazelle v0.2, инновационной речевой модели, которая может может обрабатывать устные запросы и длинные аудиофайлы напрямую, без их транскрипции или распознавания речи. Благодаря прямой обработке аудио данных, модель быстрее, точнее, а также способна интерпретировать эмоции и даже сарказм в речи. Код "из коробки", с абсолютно нулевой оптимизацией и работающий с полной точностью, достигает скорости 120 миллисекунд до первого токена, что значительно быстрее, чем любой другой сопоставимый подход. По оценкам авторов, задержка более сложной системы с синтезом составит менее 300 миллисекунд, что меньше воспринимаемой человеком задержки в реальном времени Насколько известно авторам, данная модель является первой и единственной open source моделью, способной вести диалог в реальном времени. Кроме того, разработчики публично проводят оценку безопасности и сообщают об успешных атаках на речевую модель. Наконец, это первая речевая модель, в которой применяется мультимодальная оптимизация предпочтений. Производительность Gazelle оптимизирована для реальных приложений, таких как поддержка клиентов, телефонные звонки и общение в чате. 🌐 Сайт 🤗 HuggingFace 👨‍💻Демо1 ✖️ Демо2

Repost from Machinelearning
⚡️ llamafile — утилита для быстрого запуска ИИ-моделей ⏩Инструмент llamafile от Mozilla даёт возможность упаковать веса LLM в
⚡️ llamafile — утилита для быстрого запуска ИИ-моделей ⏩Инструмент llamafile от Mozilla даёт возможность упаковать веса LLM в исполняемый файл, который без установки можно запустить практически на любой современной платформе. Поддерживаются архитектуры x86-64 и ARM64, а также системы macOS, Windows, Linux, FreeBSD, OpenBSD и NetBSD. ⏩llamafile работает практически со всеми LLM, недавно была добавлена поддержка модели Phi-3 Mini 4k, а также LLaMA3, Grok, Mixtral 8x22b и Command-R. 🖥 GitHub @ai_machinelearning_big_data

SuperDuperAI - сервис генерации видео с помощью ИИ. Предназначен для упрощения создания наративного видеоконтента с помощью генеративного ИИ для маркетинга. Мы используем Stable Diffusion для генерации изображений и видео и различные LLM через Langchain (OpenAi, Mixtral). Наша архитектура разработана для масштабируемости в облаке, при поддержке Microsoft для Ai стартапов, что позволяет нам развертывать узлы OpenAI в Azure. Безопасное управление данными: использование Okta Auth0 для безопасного хранения данных. Система построена на основе Kubernetes, Airflow ETL и Python для асинхронной обработки тысяч заказов. Про сервис👇 https://vc.ru/tribuna/1141585

🗒 Стэнфордский университет выпустил ежегодный доклад об ИИ-индустрии. Главное: — Из-за дороговизны обучения нейросетей, част
🗒 Стэнфордский университет выпустил ежегодный доклад об ИИ-индустрии. Главное: — Из-за дороговизны обучения нейросетей, частные компании значительно обгоняют научные организации по выпуску ИИ; — ИИ стали чаще использовать в науке: GNoME помог открыть 380 тыс. новых стабильных материалов для производства технологий, а AlphaDev — представил более быстрые алгоритмы сортировки; — ИИ влияет на повышение качества труда: люди выполняют задачи быстрее и лучше, используя нейросети; — Открытого кода стало больше. Из 149 нейросетевых моделей 98 с исходным кодом. Однако закрытые модели остаются более производительными; — Автоматизированных рейтингов для оценки генеративных моделей уже не хватает, поэтому всё более важным становится мнение людей об ИИ. Например, та же Chatbot Arena Leaderboard; — Люди стали больше думать о нейросетях. Процент тех, кто считает, что ИИ серьезно повлияет на их жизнь, выросла с с 60% до 66%. • Полный доклад @aiaiai

Вышла Ллама 3. 8B, 70B. (8192 tokens) После тестиков в ближайшее время узнаем что в реальности по бенчам. Веса (придется формочку заполнить) https://huggingface.co/collections/meta-llama/meta-llama-3-66214712577ca38149ebb2b6 Код https://github.com/meta-llama/llama3 Обещают 400B+ модельку. Марк Цукерберг все еще тренирует её. (на видео)

Repost from эйай ньюз
Интро в Трансформеры для чайников 3Blue1Brown, популярный математический ютубер, начал выпускать серию видео о том, как работает трансформер. Первое видео посвящено эмбеддингам и тому, как моделька определяет, какой токен ей выдать. Вышло лучшее объяснение темы "для чайников", с анимациями и довольно простым языком. Обещает ещё две части: одну посвящённую Attention, другую MLP. Если после просмотра возникнет желание погрузиться в детали: - У Андрея Карпатого есть видео где он имплементирует и объясняет как саму GPT, так и её токенизатор. - Лекция Интро в большие языковые модели (LLM), тоже от Карпатого. #ликбез @ai_newz

Купить серверы по-прежнему сложно, но можно перенести приложения на платформу VK Cloud VK Cloud — безопасная и технологичная
Купить серверы по-прежнему сложно, но можно перенести приложения на платформу VK Cloud VK Cloud — безопасная и технологичная платформа с широким набором облачных сервисов для эффективной разработки и работы с данными, которая подойдет любому бизнесу. 🔹 Все, что нужно для разработки: виртуальные машины, базы данных, Kubernetes, S3-хранилище, бэкапы, решения для машинного обучения и работы с Big Data. 🔹 Аудит, миграция, мониторинг и другие лучшие практики VK от команды опытных инженеров. 🔹 Комплексная защита веб-сервисов от атак и взломов. Зарегистрируйтесь в VK Cloud и получите 3 000 ₽ для тестирования облачных сервисов в течение 60 дней!

Repost from Сиолошная
Google открыли для всех доступ к Gemini 1.5 Pro с 1М токенов контекста: https://aistudio.google.com/app/prompts/new_chat Можн
Google открыли для всех доступ к Gemini 1.5 Pro с 1М токенов контекста: https://aistudio.google.com/app/prompts/new_chat Можно загрузить видео или целую папку с файлами для анализа Го тестировать

Рады анонсировать очередной Tinkoff Lab RL Event — митап, на котором лаборанты исследовательской лаборатории Тинькофф делятся
Рады анонсировать очередной Tinkoff Lab RL Event — митап, на котором лаборанты исследовательской лаборатории Тинькофф делятся опытом и рассказывают о своих научных проектах. Если вы учитесь на технической специальности и интересуетесь задачами искусственного интеллекта, а аббревиатуры ML, DL и RL для вас уже как родные — ребята из Тинькофф ждут вас 25 марта в 19:00 в московском офисе Тинькофф. Все подробности и регистрация тут erid:2Vtzqxdtzqi Реклама, АНО ДПО “Тинькофф Образование”, ИНН 7743270426

Сейчас очень много сервисов, позиционирующих себя, как сервисы генерации видео из текста с помощью ИИ. Обычно у многих написано Text2Video. И когда начинаешь с кем-то говорить на эту тему, обычно всегда говорят, что полно аналогов. На самом деле, многие сервисы позиционируют себя одинаково, но под капотом спрятано совершенно другое. Подборка сервисов создания видео из текста https://vc.ru/964837