Градиентное погружение

@gradientdip

Обсуждаем новости, рассказываем про ML с кодом и колабом, выигрываем соревы 🏆 Контакты: @Cucu_LaPraline, @Cene655

The country is not specifiedRussian99 885Technologies & Applications14 396

Advertising posts

4 492

Subscribers

No data24 hours

No data7 days

No data30 days

No data

Post views

No data24 hours

No data48 hours

No data

Engagement rate

No data24 hours

No data48 hours

Mentions

No data7 days

No data30 days

No data

Posts per day

No data

Reactions

No data

Comments

No data

Reposts

Subscribers
Post coverage
ER - engagement ratio

Data loading in progress...

🔥TensorRT-LLM 👉Ваш любимый нейронный ускоритель получил расширение! TensorRT - движок, который применяет оптимизации для эффективного использования NVIDIA-GPU в Deep Learning. Что интересного? 💡Интеграция с NVIDIA Triton Inference Server 💡Поддержка Multiple GPU 💡Python API (очень напоминает API HF) 💡Есть поддержка 17 моделей (с примерами): Blib2, LLaMa 1/2, GPT-like, StarCoder, Bert, etc 💡Поддержка квантизации: FP32, FP16, BF16, FP8, INT8, INT4 💡Beam-search & Greedy-search ... и многое другое! @gradientdip Конечно, сейчас проект сыроват, но все впереди Github Performance (не нашел сравнения с обычным TensorRT) Документация

Show all...

GitHub - NVIDIA/TensorRT-LLM: TensorRT-LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and build TensorRT engines that contain state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT-LLM also contains components to create Python and C++ runtimes that execute those TensorRT engines.

TensorRT-LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and build TensorRT engines that contain state-of-the-art optimizations to perform inference efficie...

🔥 17

Repost from Дата-Утренник

00:35

Video unavailableShow in Telegram

🧹Scrapper Инструмент для парсинга страниц с JS. Работает в докере, можно обращаться по апи, сложнее детектируется как бот, может парсить в режиме просмотра (только текст), может использовать прокси и многое другое. @data_morning Github

Show all...

225941167-633576fa-c9e2-4c63-b1fd-879be2d137fa.mp44.39 MB

👍 21🔥 5❤ 1

Repost from Complete AI

Photo unavailableShow in Telegram

🏅А кто сегодня молодец и взял Trending paper на Hugging Face, обогнав Google DeepMind и Carnegie Mellon? Правильный ответ: статья про нашу модель Kandinsky, которую мы выложили на arxiv. ⚡А среди отметивших статью Julien Chaumond (CTO Hugging Face) и Patrick von Platten (Team lead Diffusers)! Со вторым мы активно сотрудничаем по внедрению модели в их самый крупный фреймворк генеративных моделей diffusers (18.2k⭐ на GitHub). Ссылка на hf P.S. Trending paper — лучшая статья дня в одном из крупнейших мировых комьюнити исследователей и ML разработок Hugging Face. @complete_ai

Show all...

🔥 91❤‍🔥 9👍 8⚡ 5🤯 4🤡 4❤ 1

Repost from Dealer.AI

Всем привет, мы строили строили и наконец построили! Первая супер-библиотека по spelling corruption SAGE. Работа была не простой, вместе с ребятами из команды AGI NLP- мои герои снова: @alenusch, @qwertysobaka, @go_bobert. мы сделали оч крутой инструмент. Он позволяет атаковать тексты при помощи добавления опечаток, перестановок и пр., а также делать обратное - фиксить их. Интересно? Го читать на хабр! https://habr.com/ru/companies/sberdevices/articles/763932/ Наша библиотека SAGE: https://github.com/ai-forever/sage AI-service в Клауде: https://cloud.ru/ru/datahub/generative-spell-checking

Show all...

Dealer.AI

Друзья, сегодня проходит второй день Конференции Диалог2023. Мы рады сообщить, что наша работа по атакам на текст вошла в Сборник статей, тема: Augmentation methods for spelling corruptions. Авторы мои коллеги, товарищи и подписчики:@alenusch, @qwertysobaka, @go_bobert. А также Ваш покорный слуга. Скоро, надеюсь, мы порадуем Вас открытой версией кода. А пока, смотрите интересные доклады, набирайтесь знаний и идей. UPD. Прямая ссылка на статью:

https://www.dialog-21.ru/media/5914/martynovnplusetal056.pdf

👍 12🔥 2❤ 1🥰 1

Repost from Complete AI

⚡️Началось открытое голосование за номинантов премии HighLoad++. Среди прочих достойных номинантов представлена и модель Kandinsky! Верю, что команда заслуженно сможет получить эту награду😉 Спасибо всем за фидбэки, участие в развитии модели и её применении, ценные советы🙏 Все ваши комментарии не остаются не учтёнными, мы всё внимательно собираем и постепенно стараемся исправлять. Голосовать

Show all...

👍 4

Repost from Awesome DL

Всем привет 👋 Продолжаем серию постов под авторством @TimeEscaper, посвященную применению ML в Robotics. В данном рассказе мы осветили вопрос того, как применять языковые модели для обучения роботов: - Как использовать LLM для генерации reward? - Как переводить языковые команды в действия робота? - Как использовать LLM для генерации алгоритмов роботов? Приятного чтения 🔥

Show all...

Применение LLM для синтеза и стилизации поведений агентов

TLDR: Рассмотрим, как можно использовать LLM-ки для управления роботами и какие от этого можно получить преимущества.

🔥 5

Repost from Дата-Утренник

00:04
Video unavailableShow in Telegram
00:08
Video unavailableShow in Telegram
00:06
Video unavailableShow in Telegram

Сморите что нашел 👉DragDiffusion - модель, способная редактировать изображения на основе точек, заданных юзером. Есть примеры использования, руководство по настройке и запуску модели. @data_morning github примеры

Show all...

CF3.mp45.04 KB

CF2.mp43.51 KB

CF1.mp44.50 KB

👍 9🔥 1

Repost from AbstractDL

Photo unavailableShow in Telegram

Longformer-tiny для русского языка Друг скрестил Longformer и BERT-tiny, получив крошечную модель с контекстом в 16к токенов. Детали танцев с бубном и обучения есть на хабре. А картинку нарисовала моя сестра ☺️ Хабр, Huggingface

Show all...

👍 16🔥 7⚡ 1

Repost from Нейрокузня | DreamForge

Photo unavailableShow in Telegram

Релиз новой версии AutoChar! Версия 0.9 стучится в ваши двери с новыми функциями, исправлениями ошибок и обновлённым интерфейсом. Спасибо большому сообществу за сообщения о багах и предложенные решения! https://civitai.com/models/95923 https://github.com/alexv0iceh/AutoChar ### Новые функции: • Добавлена полная поддержка Dynamic Prompts! Наслаждайтесь полностью автоматическим улучшением всех ваших рандомизированных генераций • Добавлен SD Upscale по умолчанию вместо базового Image2Image. Значительно более высокая детализация и резкость + выбор вашего любимого апскейлера • Lower LoRA: новая мера для предотвращения выгорания лиц при использовании сильных или нескольких LoRA. Включено по умолчанию • Только одно лицо: инпеинт только самого большого лица при генерации, больше никаких неожиданных ужасов на подмышках и груди, также помогает при работе с толпами на заднем плане. Включено по умолчанию • Теперь только первая и последняя генерации каждого цикла будут по умолчанию сохраняться в выходную папку Txt2img. Все остальные шаги будут сохраняться в папке Img2img ### Исправления ошибок и т.д: • Исправлена критическая ошибка OpenCV. Добавлена автоматическая проверка наличия последней версии • Исправлена ошибка с тем, что LoRA не передается на шаг Inpaint. • Обновлена версия YuNet для улучшения распознавания лиц • Переработан и улучшен пользовательский интерфейс • Опции Inpaint лица и глаз включены по умолчанию ### Грядущая версия 1.0: • Релиз в виде полноценного расширения • Полная поддержка Img2Img • Интеграция ControlNet для всех шагов алгоритма • Больше параметров для опытных пользователей

Show all...

👍 16🔥 5

Умеете обучать модели и поднимать API, но не понимаете, что происходит за пределами этих процессов? Никто не знал о GPT, пока она была просто ML-моделью без публично доступного API и продакшена, отмасштабированного на миллионы пользователей, теперь известного всем как ChatGPT. Любой, даже самый минимальный жизнеспособный продукт при таких масштабах будет содержать как ML-компоненты, так и микросервисы, базы данных, подсистемы поиска, логирования, аналитики и многого другого. Научиться проектировать такую архитектуру можно на курсе System Design от Валерия Бабушкина, Vice President, Data Science в Blockchainꓸcom. Здесь вы поработаете над реальными проектами сервиса такси, приложения для знакомств и другими системами, а также познакомитесь с типичной структурой дизайн-собеседований в Big Tech. Всего за 4 недели вы научитесь собирать требования, оценивать нагрузку, выбирать подходящие СУБД, масштабировать системы и повышать их надежность и отзывчивость, а также выделять и последовательно проектировать подсистемы для хранения данных, поиска и аналитики как своими силами, так и с помощью готовых продуктов. Новый поток стартует 14 августа! Ждём вас! [Зарегистрироваться]

Show all...

System Design

Обучение проектированию систем. Курсы System Design в онлайн-школе Karpov.Courses

Choose a Different Plan

Your current plan allows analytics for only 5 channels. To get more, please choose a different plan.