cookie

We use cookies to improve your browsing experience. By clicking «Accept all», you agree to the use of cookies.

avatar

Градиентное погружение

Обсуждаем новости, рассказываем про ML с кодом и колабом, выигрываем соревы 🏆 Контакты: @Cucu_LaPraline, @Cene655

Show more
The country is not specifiedRussian99 885Technologies & Applications14 396
Advertising posts
4 492
Subscribers
No data24 hours
No data7 days
No data30 days

Data loading in progress...

Subscriber growth rate

Data loading in progress...

🔥TensorRT-LLM 👉Ваш любимый нейронный ускоритель получил расширение! TensorRT - движок, который применяет оптимизации для эффективного использования NVIDIA-GPU в Deep Learning. Что интересного? 💡Интеграция с NVIDIA Triton Inference Server 💡Поддержка Multiple GPU 💡Python API (очень напоминает API HF) 💡Есть поддержка 17 моделей (с примерами): Blib2, LLaMa 1/2, GPT-like, StarCoder, Bert, etc 💡Поддержка квантизации: FP32, FP16, BF16, FP8, INT8, INT4 💡Beam-search & Greedy-search ... и многое другое! @gradientdip Конечно, сейчас проект сыроват, но все впереди Github Performance (не нашел сравнения с обычным TensorRT) Документация
Show all...
GitHub - NVIDIA/TensorRT-LLM: TensorRT-LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and build TensorRT engines that contain state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT-LLM also contains components to create Python and C++ runtimes that execute those TensorRT engines.

TensorRT-LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and build TensorRT engines that contain state-of-the-art optimizations to perform inference efficie...

🔥 17
00:35
Video unavailableShow in Telegram
🧹Scrapper Инструмент для парсинга страниц с JS. Работает в докере, можно обращаться по апи, сложнее детектируется как бот, может парсить в режиме просмотра (только текст), может использовать прокси и многое другое. @data_morning Github
Show all...
225941167-633576fa-c9e2-4c63-b1fd-879be2d137fa.mp44.39 MB
👍 21🔥 5 1
Repost from Complete AI
Photo unavailableShow in Telegram
🏅А кто сегодня молодец и взял Trending paper на Hugging Face, обогнав Google DeepMind и Carnegie Mellon? Правильный ответ: статья про нашу модель Kandinsky, которую мы выложили на arxiv. ⚡А среди отметивших статью Julien Chaumond (CTO Hugging Face) и Patrick von Platten (Team lead Diffusers)! Со вторым мы активно сотрудничаем по внедрению модели в их самый крупный фреймворк генеративных моделей diffusers (18.2k⭐ на GitHub). Ссылка на hf P.S. Trending paper — лучшая статья дня в одном из крупнейших мировых комьюнити исследователей и ML разработок Hugging Face. @complete_ai
Show all...
🔥 91❤‍🔥 9👍 8 5🤯 4🤡 4 1
Repost from Dealer.AI
Всем привет, мы строили строили и наконец построили! Первая супер-библиотека по spelling corruption SAGE. Работа была не простой, вместе с ребятами из команды AGI NLP- мои герои снова: @alenusch, @qwertysobaka, @go_bobert. мы сделали оч крутой инструмент. Он позволяет атаковать тексты при помощи добавления опечаток, перестановок и пр., а также делать обратное - фиксить их. Интересно? Го читать на хабр! https://habr.com/ru/companies/sberdevices/articles/763932/ Наша библиотека SAGE: https://github.com/ai-forever/sage AI-service в Клауде: https://cloud.ru/ru/datahub/generative-spell-checking
Show all...
Dealer.AI

Друзья, сегодня проходит второй день Конференции Диалог2023. Мы рады сообщить, что наша работа по атакам на текст вошла в Сборник статей, тема: Augmentation methods for spelling corruptions. Авторы мои коллеги, товарищи и подписчики:@alenusch, @qwertysobaka, @go_bobert. А также Ваш покорный слуга. Скоро, надеюсь, мы порадуем Вас открытой версией кода. А пока, смотрите интересные доклады, набирайтесь знаний и идей. UPD. Прямая ссылка на статью:

https://www.dialog-21.ru/media/5914/martynovnplusetal056.pdf

👍 12🔥 2 1🥰 1
Repost from Complete AI
⚡️Началось открытое голосование за номинантов премии HighLoad++. Среди прочих достойных номинантов представлена и модель Kandinsky! Верю, что команда заслуженно сможет получить эту награду😉 Спасибо всем за фидбэки, участие в развитии модели и её применении, ценные советы🙏 Все ваши комментарии не остаются не учтёнными, мы всё внимательно собираем и постепенно стараемся исправлять. Голосовать
Show all...
👍 4
Repost from Awesome DL
Всем привет 👋 Продолжаем серию постов под авторством @TimeEscaper, посвященную применению ML в Robotics. В данном рассказе мы осветили вопрос того, как применять языковые модели для обучения роботов: - Как использовать LLM для генерации reward? - Как переводить языковые команды в действия робота? - Как использовать LLM для генерации алгоритмов роботов? Приятного чтения 🔥
Show all...
Применение LLM для синтеза и стилизации поведений агентов

TLDR: Рассмотрим, как можно использовать LLM-ки для управления роботами и какие от этого можно получить преимущества.

🔥 5
Сморите что нашел 👉DragDiffusion - модель, способная редактировать изображения на основе точек, заданных юзером. Есть примеры использования, руководство по настройке и запуску модели. @data_morning github примеры
Show all...
CF3.mp45.04 KB
CF2.mp43.51 KB
CF1.mp44.50 KB
👍 9🔥 1
Repost from AbstractDL
Photo unavailableShow in Telegram
Longformer-tiny для русского языка Друг скрестил Longformer и BERT-tiny, получив крошечную модель с контекстом в 16к токенов. Детали танцев с бубном и обучения есть на хабре. А картинку нарисовала моя сестра ☺️ Хабр, Huggingface
Show all...
👍 16🔥 7 1
Photo unavailableShow in Telegram
Релиз новой версии AutoChar! Версия 0.9 стучится в ваши двери с новыми функциями, исправлениями ошибок и обновлённым интерфейсом. Спасибо большому сообществу за сообщения о багах и предложенные решения! https://civitai.com/models/95923 https://github.com/alexv0iceh/AutoChar ### Новые функции: • Добавлена полная поддержка Dynamic Prompts! Наслаждайтесь полностью автоматическим улучшением всех ваших рандомизированных генераций • Добавлен SD Upscale по умолчанию вместо базового Image2Image. Значительно более высокая детализация и резкость + выбор вашего любимого апскейлера • Lower LoRA: новая мера для предотвращения выгорания лиц при использовании сильных или нескольких LoRA. Включено по умолчанию • Только одно лицо: инпеинт только самого большого лица при генерации, больше никаких неожиданных ужасов на подмышках и груди, также помогает при работе с толпами на заднем плане. Включено по умолчанию • Теперь только первая и последняя генерации каждого цикла будут по умолчанию сохраняться в выходную папку Txt2img. Все остальные шаги будут сохраняться в папке Img2img ### Исправления ошибок и т.д: • Исправлена критическая ошибка OpenCV. Добавлена автоматическая проверка наличия последней версии • Исправлена ошибка с тем, что LoRA не передается на шаг Inpaint. • Обновлена версия YuNet для улучшения распознавания лиц • Переработан и улучшен пользовательский интерфейс • Опции Inpaint лица и глаз включены по умолчанию ### Грядущая версия 1.0: • Релиз в виде полноценного расширения • Полная поддержка Img2Img • Интеграция ControlNet для всех шагов алгоритма • Больше параметров для опытных пользователей
Show all...
👍 16🔥 5
Умеете обучать модели и поднимать API, но не понимаете, что происходит за пределами этих процессов? Никто не знал о GPT, пока она была просто ML-моделью без публично доступного API и продакшена, отмасштабированного на миллионы пользователей, теперь известного всем как ChatGPT. Любой, даже самый минимальный жизнеспособный продукт при таких масштабах будет содержать как ML-компоненты, так и микросервисы, базы данных, подсистемы поиска, логирования, аналитики и многого другого. Научиться проектировать такую архитектуру можно на курсе System Design от Валерия Бабушкина, Vice President, Data Science в Blockchainꓸcom. Здесь вы поработаете над реальными проектами сервиса такси, приложения для знакомств и другими системами, а также познакомитесь с типичной структурой дизайн-собеседований в Big Tech. Всего за 4 недели вы научитесь собирать требования, оценивать нагрузку, выбирать подходящие СУБД, масштабировать системы и повышать их надежность и отзывчивость, а также выделять и последовательно проектировать подсистемы для хранения данных, поиска и аналитики как своими силами, так и с помощью готовых продуктов. Новый поток стартует 14 августа! Ждём вас! [Зарегистрироваться]
Show all...
System Design

Обучение проектированию систем. Курсы System Design в онлайн-школе Karpov.Courses