Generative Ai

前往频道在 Telegram

Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience, Generative Ai, LLM, LangChain, ChatGPT По рекламе писать @miralinka, Created by @life2film

显示更多

俄罗斯143 643 技术与应用22 819

3 677

订阅者

+424 小时

+827 天

+9130 天

506

帖子浏览量

无数据24 小时

无数据48 小时

13.77%

参与率

无数据

每日帖子数

Ads index

beta

帖子存档

3 679

💬 Вступайте в сообщество MLOps-инженеров в Telegram. Там публикуем дайджесты, обсуждаем новые инструменты и технологии. В сообществе вы найдете: ▫️ Новости индустрии production ML; ▫️ Полезные статьи, инструменты и технологии; ▫️ Опыт коллег и лучшие практики. Присоединяйтесь, чтобы получать новые знания от практиков MLOps и дата-аналитики: https://t.me/+jM3sdtJQXDE2NzYy Реклама ООО «Селектел» erid 2VtzqwcU131

3 679

🤓 OpenAI представили официальное руководство по написанию промптов. Самые нужные лайфхаки в одном месте: как задать длину ответа, привести примеры, получить нужный формат и т.д. Работает с VPN. • Сохраняем тут

3 679

Repost from Агенты ИИ | AGI_and_RL

У DeepMind вышла статья, как с помощью LLM строить алгоритмы решающие математические задачи: https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large-language-models/ Сама генерации решений строится как эволюционный проецесс, добавляя решения в базу и оценивая их. Пользователь может запросить лучшее решение в любой момент. Испытали на некоторых открытых задачах из разных областей математики и смогли построить решения, которые лучше прежде известных. (в некоторых случаях) Один из плюсов в том, что решения - программы легко интерпретировать. Пока так понял :) Код: https://github.com/google-deepmind/funsearch Статья

3 679

Repost from Градиент обреченный

🔺 Новые открытые LLM #ml_news Пришло время обозреть открытые языковые модели, вышедшие за последнее время. ➕ Mixtral-8x7B Новая модель от французского стартапа Mistral. Обучили модель подходом MoE (Mixture of Experts), при котором небольшая часть модели является роутером, а остальная часть состоит из N «экспертов», из которых активируется только часть. Здесь таких частей 8, то есть суммарный вес модели ~ 45B параметров, но вычислений при инференсе столько же, как у 14B модели (активируется топ-2 «эксперта»). Благодаря этому, Mixtral превосходит Llama 70B на большинстве бенчмарков, работая в 6 раз быстрее. На днях выложили и инструктивную версию. HF | GitHub ➕ Phi-2 Продолжение экспериментов с малыми моделями от Microsoft. На этот раз модель стала больше — 2.7B. Идея, напомню, в обучении модели в основном на синтетических данных, тщательно подготовленных. Объем данных сравнительно небольшой — 1.4B токенов за ~5 эпох. На многих тестах Phi-2 показывает себя лучше чем модели размером 13B, а в некоторых случаях, типа кода, лучше Llama 70B. Также на всех тестах лучше Gemini Nano 2 (3.2B). MMLU — 56,7. HF | релиз ➕ Zephyr 3B И новая модель от StableLM, которую обучили на открытых датасетах и выровняли при помощи DPO. Ребята провели замеры на MT-Bench (тесты в которых в роли судьи играет другая LLM) и получили неплохие результаты, кое-где догоняя ChatGPT 3.5. На MMLU получили 46.3. Поигрался с Zephyr'ом, на английском понравилось, на русском очень слабо.

> Describe unexisted Martian language like in Wikipedia article > An extinct Martian language, also known as an extinct extraterrestrial language, was an ancient linguistic system used by the hypothetical intelligent, now extinct, Martian civilization that once inhabited the Red Planet. 1. Language family: ...

HF | релиз

3 679

Repost from Stable Diffusion | Text2img

Очередной (🙊) релиз от компании StabilityAI. На этот раз - генератор 3D-объектов из картинки. Релиз основан на базе другого генератора - Zero123. Чекпоинт дообучен на датасете из 800.000 3D объектов. По сути ничего нового, конечно, просто хорошая база NERF и качественный набор исходников. Поставить на локальный ПК это можно уже сейчас, но Стабильные (как всегда) просят от 24 гигабайт VRAM для его нормальной работы. Блог о релизе — https://stability.ai/news/stable-zero123-3d-generation Веса и инструкция по запуску — https://huggingface.co/stabilityai/stable-zero123 Обсудить / пообщаться Наш чат @text2image

3 679

Repost from Dmitry Legchikov

Классный визуализатор внутренностей больших языковых моделей (LLM). Если решили разобраться в LLM или повторить основы перед собеседованием - такие инструменты must have. Можно наглядно отследить процесс от подачи токенов до генерации выходного текста. Где какие матрицы умножаются, что творится внутри Attention, вплоть до умножения каждой ячейки. На сайте доступно несколько моделей: nano-gpt (85,584 параметра), GPT-2 (small), GPT-2 (XL), GPT-3. Еще есть крутое видео от Андрея Карпатого, где он с нуля пишет nano-gpt на чистом питоне. На русском языке, на мой взгляд лучше объяснение Attention механизма от @seeallochnaya в этом видео.

3 679

Repost from Derp Learning

MLC LLM - универсальный кросплатформенный GPU-accelerated фреймворк для LLM Да, 7b модели можно спокойно крутить на телефоне. git blog ios app android app desktop (win/linux/mac) in-browser @derplearning

3 679

Repost from Derp Learning

А вот такое мы любим. X-adapter для подключения controlnet, lora от 1.5 к сдохле Код За наводку спасибо a s @derplearning

3 679

Repost from gonzo-обзоры ML статей

Продолжаем линию маленьких моделей, Microsoft анонсировал phi-2 https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/ We are now releasing Phi-2, a 2.7 billion-parameter language model that demonstrates outstanding reasoning and language understanding capabilities, showcasing state-of-the-art performance among base language models with less than 13 billion parameters. On complex benchmarks Phi-2 matches or outperforms models up to 25x larger, thanks to new innovations in model scaling and training data curation.

3 679

Repost from AI для Всех

Китайские ученые запустили полностью автономных виртуальных персон-агентов This is beyond insanity🙃 берём LLM, прикручиваем к ней api calls - actions, крафтим персону - system prompt, картинку - сначала текстуры, потом уже экшенами управляем маникеном. Получаем полностью автономного ИИ способного управлять виртуальным миром. Есть шанс что первых 100% автономных роботов мы увидим сразу после Рождества. Как раз у людей появится возможность время дома провести. Проект

3 679

Repost from Агенты ИИ | AGI_and_RL

Еще фреймворк для тулов и вызовов функций. Заявляют, что быстрее и эффективнее чем через ReAct. Сейчас работает с OpenAI, подвязка LLama в роадмэпе. LLMCompiler: An LLM Compiler for Parallel Function Calling https://arxiv.org/abs/2312.04511 https://github.com/squeezeailab/llmcompiler

3 679

A platform for Reasoning systems (Reinforcement Learning, Contextual Bandits, etc.) https://ai.meta.com/tools/reagent/ https://github.com/facebookresearch/ReAgent

3 679

Thrilled to announce Pearl, our Production-ready Reinforcement Learning (RL) AI Agent Library, now open-source! Crafted by the Applied RL team, AI at Meta. GitHub: https://lnkd.in/g7mCQRHm Paper: https://lnkd.in/gPhWeJh4 Website: pearlagent.github.io

3 679

Repost from gonzo-обзоры ML статей

Gemini announced! Looks like the most capable GPT competitor with better multimodal capabilities. Site: https://deepmind.google/technologies/gemini/#introduction Blog: https://blog.google/technology/ai/google-gemini-ai/ Technical report: https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

3 679

SDXL-Turbo is a fast generative text-to-image model that can synthesize photorealistic images from a text prompt in a single network evaluation. A real-time demo is available here: http://clipdrop.co/stable-diffusion-turbo https://huggingface.co/stabilityai/sdxl-turbo

3 679

https://huggingface.co/stabilityai/sd-turbo SD-Turbo is a fast generative text-to-image model that can synthesize photorealistic images from a text prompt in a single network evaluation. We release SD-Turbo as a research artifact, and to study small, distilled text-to-image models. For increased quality and prompt understanding, we recommend SDXL-Turbo.

3 679

Repost from AI для Всех

Llamafile от Mozilla: портативный ИИ на флешке Теперь почти любое устройство можно превратить в оффлайн персонального собеседника за секунды, благодаря Llamafile от Mozilla! 📌 Что такое Llamafile? Llamafile - это опенсорс продукт от Mozilla, который позволяет распространять и запускать большие языковые модели (LLMs) с помощью одного файла. Это означает, что вы можете "поселить" умную Ламу на флешку или ноутбук. 💡 Особенности Llamafile: 1. Совместимость с различными архитектурами и ОС: Llamafile работает на множестве CPU архитектур и на всех основных операционных системах, включая macOS, Windows и Linux 2. Интеграция с разными моделями ИИ: можно загрузить любые модели, например Mistral-7B-Instruct или WizardCoder-Python-13B, и использовать их в качестве серверных или локальных бинарных файлов 3. Поддержка GPU: На Apple Silicon и Linux, Llamafile поддерживает GPU, что позволяет ускорить обработку данных и улучшить производительность. 4. Нормальная лицензия: Проект llamafile лицензирован под Apache 2.0 🌍 Выводы: Llamafile от Mozilla открывает новые горизонты для ИИ-разработчиков и пользователей. С Llamafile, ваше устройство становится не просто гаджетом, а интеллектуальным помощником, который всегда с вами (даже в самолете)! Блог-пост GitHub (Напоминаю что сегодня ровно год с выхода ChatGPT, а у нас уже есть версия для флешки 🤔)

3 679

https://huggingface.co/openchat/openchat_3.5

3 679

Repost from Machinelearning

🔥Building and Evaluating Advanced RAG Applications Вышел новый бесплатный курс от deeplearning.ai по сложным техникам RAG (Retrieval Augmented Generation).🦾 В этом курсе преподаются продвинутые техники работы с LLM, которые помогут вам генерировать хорошие и релевантные ответы и. deeplearning.ai/short-courses/building-evaluating-advanced-rag/ @ai_machinelearning_big_data

3 679

Repost from эйай ньюз

🔥Intel зарелизил самую мощную 7B LLM Модели на сотни миллиардов параметров - это, конечно, хорошо. Но прикольно и на ноутбуке погонять небольшие модели. Intel в последнее время сдал позиции, и многие их считают андердогом. Так вот теперь Intel включился в большую игру! Они затюнили Mistral 7B (писал о ней тут) и получили СОТУ среди моделей на 7 млрд параметров. И выложили все это добро под лицензией Apache 2. Для дообучения использовали: - Supervised Finetuning на SlimOrca, эо примерно 500k ответов, сгенеренных GPT-4; - DPO (Direct Preference Optimization) тюн на датасете пар, сгенерированных LLaMA-13B vs ChatGPT Gens. Обучали модель препочитать ответы ChatGPT ответам Лламы. Модель Код SlimOrca Dataset DPO Dataset @ai_newz