Generative Ai
前往频道在 Telegram
Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience, Generative Ai, LLM, LangChain, ChatGPT По рекламе писать @miralinka, Created by @life2film
显示更多3 677
订阅者
+424 小时
+827 天
+9130 天
帖子存档
3 677
Repost from Сиолошная
Новая модель:
— контекст длиннее. 128K токенов (365 страниц обычной книги)
— модель более аккуратна при работе с длинным текстом, не теряет то, что было в серединке
— фича для разрабов: можно заставить модель писать ответы в JSON-формате
— можно вызывать несколько функций за раз
— можно указать seed генерации, чтобы получать воспроизводимость
— скоро добавят logprobs в API
— Retrieval прямо из коробки, можно загружать документы на платформу и они будут подтягиватсья (F стартапам chatWithPDF)
— Теперь модель знает события не до сентября 2021го, а апреля 2023го
— Эта новая модель принимает картинки на вход через API
— DALLE-3 + text-to-speech (6 голосов) сегодня появятся в API
— Для GPT-4 появится файнтюнинг сегодня (но на узкую выборку пользователей)
— Custom Models: программа плотной работыт инженеров OpenAI с вашей компанией, чтобы помочь адаптировать тренировку под ваши проблемы
ЦЕНА НА GPT-4-TURBO (Sam говорит, что эта модель ещё и умнее GPT-4) уменьшена в 3 раза для промпта и в 2 раза для генерации!
Обещают скоро ещё больше ускорить GPT-4 Turbo
3 677
https://llava-vl.github.io/llava-interactive/
LLaVA-Interactive
Image Chat, Segmentation and Generation/Editing -- All-in-one
3 677
Obsidian-3B
This is likely not just a first for Nous but likely the Worlds first 3B sized open-source multi-modal model with vision+text capabilities.
This model is based on the Capybara-3B model, holds robust conversational abilities, and even competes in benchmarks with first-gen SOTA models such as WizardLM-13B and GPT4-X-Vicuna 13B.
It's efficient enough to briskly run on even a non-pro iphone, while demonstrating surprisingly accurate understanding of images and holding back and forth conversations!
Download the direct version of Obsidian here: https://huggingface.co/NousResearch/Obsidian-3B-V0.5
Or download the optimized quantized version by @nisten here: https://huggingface.co/nisten/obsidian-3b-multimodal-q6-gguf
3 677
https://huggingface.co/NousResearch/Yarn-Mistral-7b-128k
Nous-Yarn-Mistral-7b-128k is a state-of-the-art language model for long context, further pretrained on long context data for 1500 steps using the YaRN extension method. It is an extension of Mistral-7B-v0.1 and supports a 128k token context window.
Yarn Paper v2 on Arxiv: https://arxiv.org/abs/2309.00071
3 677
#PDF Summary
Major Themes in the VC Markets Today
Shutdown of the VC Factory Line and Death of the Unicorn Narrative: The traditional model of producing unicorns through factory farming has come to an end. This pipeline has stopped and is unlikely to restart, as the public market now values organic, pesticide-free, and natural growth.
Crowding into Seed Investing: Multi-stage firms, and even late-stage firms, are entering the seed investing space to deploy capital in the absence of the traditional factory line. This shift is driven by the incentives of building a track record and getting ahead, although it is fueled by extending innovation rather than disruptive technology.
Post-Pandemic Cultural Change: The pandemic has brought about fundamental cultural changes that impact startups. Economic randomization, personal reprioritization, and the search for self-reliance and security are shifting where talent goes and what it wants.
Prioritizing Financial Optionality for Investments: In the current VC landscape, it is crucial to prioritize financial optionality for investments and as a fund. Companies and funds need to focus on building sustainable businesses with seed capital and position themselves to be opportunistic when funding rounds come together. Waiting for a company to go public or be acquired is no longer responsible, and firms should actively develop liquidity options.
Capital Efficiency Over Scalability: Seed investors should prioritize capital efficiency over scalability of investment opportunities. They should focus on places where dollars are scarce and valuable to companies, rather than solely on companies that can scale their dollar demand.
Exercise Patience and Discipline: Founders, funds, and LPs need to exercise patience and discipline in the new era of VC.
3 677
Repost from e/acc
Ровно месяц назад я писал об анонсе GPT-4V, который сегодня уже доступен всем пользователям. Эта модель умеет распознавать текст, формулы, эмоции, считать объекты и ставить диагнозы по картинке, умеет в в навигацию в реальном мире.
Но, как известно, месяц в ИИ это как год в крипте и как 5 лет в любой другой индустрии. Сегодня давайте поугораем по LLaVA, новой SotA (то есть, самой клёвой) vision модели.
Из новостей:
— модель открытая и бесплатная, включая датасет для тьюнинга
— показывает более крутые результаты по сравнению с GPT-4V
— последняя версия натренирована за 1 день на кластере из 8 A100 (то есть, за $700)
— демо доступно на сайте авторов
— довольно легко тьюнить на своих данных (еще не пробовал)
— звучит как тема для нашего следующего вебинара (кстати, сегодня на mastermind сессии для участников сообщества codex.town мы будем разбирать и изучать лайфхаки для vision моделей!)
3 677
Repost from Machinelearning
🔥 Learn from Andrew Ng! Generative AI for Everyone
Instructed by AI pioneer Andrew Ng, Generative AI for Everyone offers his unique perspective on empowering you and your work with generative AI.
Узнайте, как работает генеративный искусственный интеллект в новом бесплатном курсе от легендарного Эндрю Ына. Как использовать ИИ в профессиональной или личной жизни и как он повлияет на работу, бизнес и общество.
Вы познакомитесь с реальными примерами работы ии, изучите типичные кейсы использования, получите возможность практической работы с инструментами генеративного ИИ, чтобы применить полученные знания на практике и получить представление о влиянии ИИ на бизнес и общество.
Этот курс доступен для всех и не предполагает наличия опыта кодинга или работы с искусственным интеллектом.
https://www.deeplearning.ai/courses/generative-ai-for-everyone/
@ai_machinelearning_big_data
3 677
Repost from AI для Всех
RedPajama - новый датасет на 30 триллионов токенов!
Компания Together Computer представила обновлённую версию открытого набора текстовых данных RedPajama. Теперь он содержит 30 триллионов токенов - в 30 раз больше, чем было в первой версии!
Это колоссальный объём информации, отфильтрованной из сотен миллиардов веб-страниц. Такие данные послужат фундаментом для обучения по-настоящему масштабных открытых языковых моделей.
Преимущества нового датасета не заканчиваются на внушительных размерах. В набор добавлены десятки готовых аннотаций качества текста. Они позволят исследователям гибко фильтровать и взвешивать данные под конкретные задачи.
Все это существенно упростит и ускорит разработку открытых моделей ИИ. Каждый сможет с лёгкостью создать свою собственную уникальную выборку на основе RedPajama. А значит, ждём новую волну экспериментов и прорывных результатов!
В общем, RedPajama 2 - это мощный импульс для всего сообщества ИИ. Крупные данные, гибкость, доступность - так рождается прогресс!
🦙 Блог-пост
🦙 Датасет
🐙 Git
3 677
Repost from Just links
LLM Augmented Hierarchical Agents https://openreview.net/forum?id=K5MfysX15Q
3 677
Learning Video Representations from Large Language Models
https://facebookresearch.github.io/LaViLa/
https://openaccess.thecvf.com/content/CVPR2023/papers/Zhao_Learning_Video_Representations_From_Large_Language_Models_CVPR_2023_paper.pdf
3 677
MiniGPT-v2: Large Language Model as a Unified Interface for Vision-Language Multi-task Learning
https://github.com/Vision-CAIR/MiniGPT-4
3 677
Repost from Machinelearning
📑 DocXChain: A Powerful Open-Source Toolchain for Document Parsing and Beyond
DocXChain - мощный инструментарий с открытым исходным кодом для синтаксического анализа документов, предназначенный для автоматического преобразования разнородной информации, содержащейся в неструктурированных документах, таких как текст, таблицы и диаграммы, схемы в структурированные представления, доступные для машинного чтения и манипулирования.
🖥 Github: https://github.com/alibabaresearch/advancedliteratemachinery
📕 Paper: https://arxiv.org/abs/2310.12430v1
🚀Damo: https://damo.alibaba.com/labs/language-technology
ai_machinelearning_big_data
3 677
Repost from Machinelearning
📚 Large (Language) Models and Foundation Models (LLM, LM, FM) for Time Series and Spatio-Temporal Data
Профессионально курируемый список больших языковых моделей и базовых моделей (
LLM, LM, FM) для темпоральных данных (временных рядов, пространственно-временных и событийных данных) с полезными ресурсами (статьи, код, датасеты и т.д.), целью которого является всестороннее обобщение последних достижений в этой области.
В Проекте собрана информацию о докладах, учебниках и обзорах по ИИ для временных рядов (AI4TS)с ведущих конференций и в журналов по ИИ.
🖥 Github: https://github.com/qingsongedu/awesome-timeseries-spatiotemporal-lm-llm
📝 AI4TS: https://github.com/qingsongedu/awesome-AI-for-time-series-papers
📕 Paper: https://arxiv.org/abs/2310.10196v1
ai_machinelearning_big_data3 677
https://microsoft.github.io/lida/
Automatic Generation of Visualizations and Infographics with LLMs
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
