Generative Ai
前往频道在 Telegram
Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience, Generative Ai, LLM, LangChain, ChatGPT По рекламе писать @miralinka, Created by @life2film
显示更多3 677
订阅者
+424 小时
+827 天
+9130 天
帖子存档
3 679
💬 Вступайте в сообщество MLOps-инженеров в Telegram. Там публикуем дайджесты, обсуждаем новые инструменты и технологии.
В сообществе вы найдете:
▫️ Новости индустрии production ML;
▫️ Полезные статьи, инструменты и технологии;
▫️ Опыт коллег и лучшие практики.
Присоединяйтесь, чтобы получать новые знания от практиков MLOps и дата-аналитики: https://t.me/+jM3sdtJQXDE2NzYy
Реклама ООО «Селектел» erid 2VtzqwcU131
3 679
🤓 OpenAI представили официальное руководство по написанию промптов.
Самые нужные лайфхаки в одном месте: как задать длину ответа, привести примеры, получить нужный формат и т.д.
Работает с VPN.
• Сохраняем тут
3 679
Repost from Агенты ИИ | AGI_and_RL
У DeepMind вышла статья, как с помощью LLM строить алгоритмы решающие математические задачи:
https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large-language-models/
Сама генерации решений строится как эволюционный проецесс, добавляя решения в базу и оценивая их. Пользователь может запросить лучшее решение в любой момент.
Испытали на некоторых открытых задачах из разных областей математики и смогли построить решения, которые лучше прежде известных. (в некоторых случаях)
Один из плюсов в том, что решения - программы легко интерпретировать.
Пока так понял :)
Код: https://github.com/google-deepmind/funsearch
Статья
3 679
Repost from Градиент обреченный
🔺 Новые открытые LLM #ml_news
Пришло время обозреть открытые языковые модели, вышедшие за последнее время.
➕ Mixtral-8x7B
Новая модель от французского стартапа Mistral. Обучили модель подходом MoE (Mixture of Experts), при котором небольшая часть модели является роутером, а остальная часть состоит из N «экспертов», из которых активируется только часть.
Здесь таких частей 8, то есть суммарный вес модели ~ 45B параметров, но вычислений при инференсе столько же, как у 14B модели (активируется топ-2 «эксперта»).
Благодаря этому, Mixtral превосходит Llama 70B на большинстве бенчмарков, работая в 6 раз быстрее. На днях выложили и инструктивную версию.
HF | GitHub
➕ Phi-2
Продолжение экспериментов с малыми моделями от Microsoft. На этот раз модель стала больше — 2.7B. Идея, напомню, в обучении модели в основном на синтетических данных, тщательно подготовленных. Объем данных сравнительно небольшой — 1.4B токенов за ~5 эпох.
На многих тестах Phi-2 показывает себя лучше чем модели размером 13B, а в некоторых случаях, типа кода, лучше Llama 70B. Также на всех тестах лучше Gemini Nano 2 (3.2B). MMLU — 56,7.
HF | релиз
➕ Zephyr 3B
И новая модель от StableLM, которую обучили на открытых датасетах и выровняли при помощи DPO. Ребята провели замеры на MT-Bench (тесты в которых в роли судьи играет другая LLM) и получили неплохие результаты, кое-где догоняя ChatGPT 3.5. На MMLU получили 46.3.
Поигрался с Zephyr'ом, на английском понравилось, на русском очень слабо.
> Describe unexisted Martian language like in Wikipedia article > An extinct Martian language, also known as an extinct extraterrestrial language, was an ancient linguistic system used by the hypothetical intelligent, now extinct, Martian civilization that once inhabited the Red Planet. 1. Language family: ...HF | релиз
3 679
Repost from Stable Diffusion | Text2img
Очередной (🙊) релиз от компании StabilityAI. На этот раз - генератор 3D-объектов из картинки.
Релиз основан на базе другого генератора - Zero123. Чекпоинт дообучен на датасете из 800.000 3D объектов. По сути ничего нового, конечно, просто хорошая база NERF и качественный набор исходников. Поставить на локальный ПК это можно уже сейчас, но Стабильные (как всегда) просят от 24 гигабайт VRAM для его нормальной работы.
Блог о релизе — https://stability.ai/news/stable-zero123-3d-generation
Веса и инструкция по запуску — https://huggingface.co/stabilityai/stable-zero123
Обсудить / пообщаться
Наш чат @text2image
3 679
Repost from Dmitry Legchikov
Классный визуализатор внутренностей больших языковых моделей (LLM).
Если решили разобраться в LLM или повторить основы перед собеседованием - такие инструменты must have.
Можно наглядно отследить процесс от подачи токенов до генерации выходного текста.
Где какие матрицы умножаются, что творится внутри Attention, вплоть до умножения каждой ячейки.
На сайте доступно несколько моделей:
nano-gpt (85,584 параметра), GPT-2 (small), GPT-2 (XL), GPT-3.
Еще есть крутое видео от Андрея Карпатого, где он с нуля пишет nano-gpt на чистом питоне.
На русском языке, на мой взгляд лучше объяснение Attention механизма от @seeallochnaya в этом видео.
3 679
Repost from Derp Learning
MLC LLM - универсальный кросплатформенный GPU-accelerated фреймворк для LLM
Да, 7b модели можно спокойно крутить на телефоне.
git
blog
ios app
android app
desktop (win/linux/mac)
in-browser
@derplearning
3 679
Repost from Derp Learning
А вот такое мы любим.
X-adapter для подключения controlnet, lora от 1.5 к сдохле
Код
За наводку спасибо a s
@derplearning
3 679
Repost from gonzo-обзоры ML статей
Продолжаем линию маленьких моделей, Microsoft анонсировал phi-2
https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/
We are now releasing Phi-2, a 2.7 billion-parameter language model that demonstrates outstanding reasoning and language understanding capabilities, showcasing state-of-the-art performance among base language models with less than 13 billion parameters. On complex benchmarks Phi-2 matches or outperforms models up to 25x larger, thanks to new innovations in model scaling and training data curation.
3 679
Repost from AI для Всех
Китайские ученые запустили полностью автономных виртуальных персон-агентов
This is beyond insanity🙃
берём LLM, прикручиваем к ней api calls - actions, крафтим персону - system prompt, картинку - сначала текстуры, потом уже экшенами управляем маникеном. Получаем полностью автономного ИИ способного управлять виртуальным миром.
Есть шанс что первых 100% автономных роботов мы увидим сразу после Рождества. Как раз у людей появится возможность время дома провести.
Проект
3 679
Repost from Агенты ИИ | AGI_and_RL
Еще фреймворк для тулов и вызовов функций. Заявляют, что быстрее и эффективнее чем через ReAct.
Сейчас работает с OpenAI, подвязка LLama в роадмэпе.
LLMCompiler: An LLM Compiler for Parallel Function Calling
https://arxiv.org/abs/2312.04511
https://github.com/squeezeailab/llmcompiler
3 679
A platform for Reasoning systems (Reinforcement Learning, Contextual Bandits, etc.)
https://ai.meta.com/tools/reagent/
https://github.com/facebookresearch/ReAgent
3 679
Thrilled to announce Pearl, our Production-ready Reinforcement Learning (RL) AI Agent Library, now open-source! Crafted by the Applied RL team, AI at Meta.
GitHub: https://lnkd.in/g7mCQRHm
Paper: https://lnkd.in/gPhWeJh4
Website: pearlagent.github.io
3 679
Repost from gonzo-обзоры ML статей
Gemini announced!
Looks like the most capable GPT competitor with better multimodal capabilities.
Site: https://deepmind.google/technologies/gemini/#introduction
Blog: https://blog.google/technology/ai/google-gemini-ai/
Technical report: https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
3 679
SDXL-Turbo is a fast generative text-to-image model that can synthesize photorealistic images from a text prompt in a single network evaluation. A real-time demo is available here: http://clipdrop.co/stable-diffusion-turbo
https://huggingface.co/stabilityai/sdxl-turbo
3 679
https://huggingface.co/stabilityai/sd-turbo
SD-Turbo is a fast generative text-to-image model that can synthesize photorealistic images from a text prompt in a single network evaluation. We release SD-Turbo as a research artifact, and to study small, distilled text-to-image models. For increased quality and prompt understanding, we recommend SDXL-Turbo.
3 679
Repost from AI для Всех
Llamafile от Mozilla: портативный ИИ на флешке
Теперь почти любое устройство можно превратить в оффлайн персонального собеседника за секунды, благодаря Llamafile от Mozilla!
📌 Что такое Llamafile?
Llamafile - это опенсорс продукт от Mozilla, который позволяет распространять и запускать большие языковые модели (LLMs) с помощью одного файла. Это означает, что вы можете "поселить" умную Ламу на флешку или ноутбук.
💡 Особенности Llamafile:
1. Совместимость с различными архитектурами и ОС: Llamafile работает на множестве CPU архитектур и на всех основных операционных системах, включая macOS, Windows и Linux
2. Интеграция с разными моделями ИИ: можно загрузить любые модели, например Mistral-7B-Instruct или WizardCoder-Python-13B, и использовать их в качестве серверных или локальных бинарных файлов
3. Поддержка GPU: На Apple Silicon и Linux, Llamafile поддерживает GPU, что позволяет ускорить обработку данных и улучшить производительность.
4. Нормальная лицензия: Проект llamafile лицензирован под Apache 2.0
🌍 Выводы:
Llamafile от Mozilla открывает новые горизонты для ИИ-разработчиков и пользователей. С Llamafile, ваше устройство становится не просто гаджетом, а интеллектуальным помощником, который всегда с вами (даже в самолете)!
Блог-пост
GitHub
(Напоминаю что сегодня ровно год с выхода ChatGPT, а у нас уже есть версия для флешки 🤔)
3 679
Repost from Machinelearning
🔥Building and Evaluating Advanced RAG Applications
Вышел новый бесплатный курс от deeplearning.ai по сложным техникам
RAG (Retrieval Augmented Generation).🦾
В этом курсе преподаются продвинутые техники работы с LLM, которые помогут вам генерировать хорошие и релевантные ответы и.
deeplearning.ai/short-courses/building-evaluating-advanced-rag/
@ai_machinelearning_big_data3 679
Repost from эйай ньюз
🔥Intel зарелизил самую мощную 7B LLM
Модели на сотни миллиардов параметров - это, конечно, хорошо. Но прикольно и на ноутбуке погонять небольшие модели.
Intel в последнее время сдал позиции, и многие их считают андердогом. Так вот теперь Intel включился в большую игру! Они затюнили Mistral 7B (писал о ней тут) и получили СОТУ среди моделей на 7 млрд параметров. И выложили все это добро под лицензией Apache 2.
Для дообучения использовали:
- Supervised Finetuning на SlimOrca, эо примерно 500k ответов, сгенеренных GPT-4;
- DPO (Direct Preference Optimization) тюн на датасете пар, сгенерированных LLaMA-13B vs ChatGPT Gens. Обучали модель препочитать ответы ChatGPT ответам Лламы.
Модель
Код
SlimOrca Dataset
DPO Dataset
@ai_newz
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
