Generative Ai

前往频道在 Telegram

Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience, Generative Ai, LLM, LangChain, ChatGPT По рекламе писать @miralinka, Created by @life2film

显示更多

俄罗斯143 643 技术与应用22 819

3 677

订阅者

+424 小时

+827 天

+9130 天

506

帖子浏览量

无数据24 小时

无数据48 小时

13.77%

参与率

无数据

每日帖子数

Ads index

beta

帖子存档

3 677

https://www.youtube.com/watch?v=U9mJuUkhUzk

3 677

Repost from Сиолошная

Новая модель: — контекст длиннее. 128K токенов (365 страниц обычной книги) — модель более аккуратна при работе с длинным текстом, не теряет то, что было в серединке — фича для разрабов: можно заставить модель писать ответы в JSON-формате — можно вызывать несколько функций за раз — можно указать seed генерации, чтобы получать воспроизводимость — скоро добавят logprobs в API — Retrieval прямо из коробки, можно загружать документы на платформу и они будут подтягиватсья (F стартапам chatWithPDF) — Теперь модель знает события не до сентября 2021го, а апреля 2023го — Эта новая модель принимает картинки на вход через API — DALLE-3 + text-to-speech (6 голосов) сегодня появятся в API — Для GPT-4 появится файнтюнинг сегодня (но на узкую выборку пользователей) — Custom Models: программа плотной работыт инженеров OpenAI с вашей компанией, чтобы помочь адаптировать тренировку под ваши проблемы ЦЕНА НА GPT-4-TURBO (Sam говорит, что эта модель ещё и умнее GPT-4) уменьшена в 3 раза для промпта и в 2 раза для генерации! Обещают скоро ещё больше ускорить GPT-4 Turbo

3 677

https://llava-vl.github.io/llava-interactive/ LLaVA-Interactive Image Chat, Segmentation and Generation/Editing -- All-in-one

3 677

Obsidian-3B This is likely not just a first for Nous but likely the Worlds first 3B sized open-source multi-modal model with vision+text capabilities. This model is based on the Capybara-3B model, holds robust conversational abilities, and even competes in benchmarks with first-gen SOTA models such as WizardLM-13B and GPT4-X-Vicuna 13B. It's efficient enough to briskly run on even a non-pro iphone, while demonstrating surprisingly accurate understanding of images and holding back and forth conversations! Download the direct version of Obsidian here: https://huggingface.co/NousResearch/Obsidian-3B-V0.5 Or download the optimized quantized version by @nisten here: https://huggingface.co/nisten/obsidian-3b-multimodal-q6-gguf

3 677

https://huggingface.co/NousResearch/Yarn-Mistral-7b-128k Nous-Yarn-Mistral-7b-128k is a state-of-the-art language model for long context, further pretrained on long context data for 1500 steps using the YaRN extension method. It is an extension of Mistral-7B-v0.1 and supports a 128k token context window. Yarn Paper v2 on Arxiv: https://arxiv.org/abs/2309.00071

3 677

#PDF Summary Major Themes in the VC Markets Today Shutdown of the VC Factory Line and Death of the Unicorn Narrative: The traditional model of producing unicorns through factory farming has come to an end. This pipeline has stopped and is unlikely to restart, as the public market now values organic, pesticide-free, and natural growth. Crowding into Seed Investing: Multi-stage firms, and even late-stage firms, are entering the seed investing space to deploy capital in the absence of the traditional factory line. This shift is driven by the incentives of building a track record and getting ahead, although it is fueled by extending innovation rather than disruptive technology. Post-Pandemic Cultural Change: The pandemic has brought about fundamental cultural changes that impact startups. Economic randomization, personal reprioritization, and the search for self-reliance and security are shifting where talent goes and what it wants. Prioritizing Financial Optionality for Investments: In the current VC landscape, it is crucial to prioritize financial optionality for investments and as a fund. Companies and funds need to focus on building sustainable businesses with seed capital and position themselves to be opportunistic when funding rounds come together. Waiting for a company to go public or be acquired is no longer responsible, and firms should actively develop liquidity options. Capital Efficiency Over Scalability: Seed investors should prioritize capital efficiency over scalability of investment opportunities. They should focus on places where dollars are scarce and valuable to companies, rather than solely on companies that can scale their dollar demand. Exercise Patience and Discipline: Founders, funds, and LPs need to exercise patience and discipline in the new era of VC.

3 677

Repost from e/acc

Ровно месяц назад я писал об анонсе GPT-4V, который сегодня уже доступен всем пользователям. Эта модель умеет распознавать текст, формулы, эмоции, считать объекты и ставить диагнозы по картинке, умеет в в навигацию в реальном мире. Но, как известно, месяц в ИИ это как год в крипте и как 5 лет в любой другой индустрии. Сегодня давайте поугораем по LLaVA, новой SotA (то есть, самой клёвой) vision модели. Из новостей: — модель открытая и бесплатная, включая датасет для тьюнинга — показывает более крутые результаты по сравнению с GPT-4V — последняя версия натренирована за 1 день на кластере из 8 A100 (то есть, за $700) — демо доступно на сайте авторов — довольно легко тьюнить на своих данных (еще не пробовал) — звучит как тема для нашего следующего вебинара (кстати, сегодня на mastermind сессии для участников сообщества codex.town мы будем разбирать и изучать лайфхаки для vision моделей!)

3 677

https://github.com/premAI-io/state-of-open-source-ai

3 677

Repost from Machinelearning

🔥 Learn from Andrew Ng! Generative AI for Everyone Instructed by AI pioneer Andrew Ng, Generative AI for Everyone offers his unique perspective on empowering you and your work with generative AI. Узнайте, как работает генеративный искусственный интеллект в новом бесплатном курсе от легендарного Эндрю Ына. Как использовать ИИ в профессиональной или личной жизни и как он повлияет на работу, бизнес и общество. Вы познакомитесь с реальными примерами работы ии, изучите типичные кейсы использования, получите возможность практической работы с инструментами генеративного ИИ, чтобы применить полученные знания на практике и получить представление о влиянии ИИ на бизнес и общество. Этот курс доступен для всех и не предполагает наличия опыта кодинга или работы с искусственным интеллектом. https://www.deeplearning.ai/courses/generative-ai-for-everyone/ @ai_machinelearning_big_data

3 677

Repost from AI для Всех

RedPajama - новый датасет на 30 триллионов токенов! Компания Together Computer представила обновлённую версию открытого набора текстовых данных RedPajama. Теперь он содержит 30 триллионов токенов - в 30 раз больше, чем было в первой версии! Это колоссальный объём информации, отфильтрованной из сотен миллиардов веб-страниц. Такие данные послужат фундаментом для обучения по-настоящему масштабных открытых языковых моделей. Преимущества нового датасета не заканчиваются на внушительных размерах. В набор добавлены десятки готовых аннотаций качества текста. Они позволят исследователям гибко фильтровать и взвешивать данные под конкретные задачи. Все это существенно упростит и ускорит разработку открытых моделей ИИ. Каждый сможет с лёгкостью создать свою собственную уникальную выборку на основе RedPajama. А значит, ждём новую волну экспериментов и прорывных результатов! В общем, RedPajama 2 - это мощный импульс для всего сообщества ИИ. Крупные данные, гибкость, доступность - так рождается прогресс! 🦙 Блог-пост 🦙 Датасет 🐙 Git

3 677

https://blog.langchain.dev/langserve-hub/ https://github.com/langchain-ai/langchain/tree/master/templates

3 677

Repost from Love. Death. Transformers.

#чтивонаночь - LLAVA 1.5 Вероятно лучшая открытая мультимодалка этой осени, которая по каким то причинам никому не интересна, а зря! teletype paper github

3 677

Repost from Just links

LLM Augmented Hierarchical Agents https://openreview.net/forum?id=K5MfysX15Q

3 677

Learning Video Representations from Large Language Models https://facebookresearch.github.io/LaViLa/ https://openaccess.thecvf.com/content/CVPR2023/papers/Zhao_Learning_Video_Representations_From_Large_Language_Models_CVPR_2023_paper.pdf

3 677

MiniGPT-v2: Large Language Model as a Unified Interface for Vision-Language Multi-task Learning https://github.com/Vision-CAIR/MiniGPT-4

3 677

Repost from Machinelearning

📑 DocXChain: A Powerful Open-Source Toolchain for Document Parsing and Beyond DocXChain - мощный инструментарий с открытым исходным кодом для синтаксического анализа документов, предназначенный для автоматического преобразования разнородной информации, содержащейся в неструктурированных документах, таких как текст, таблицы и диаграммы, схемы в структурированные представления, доступные для машинного чтения и манипулирования. 🖥 Github: https://github.com/alibabaresearch/advancedliteratemachinery 📕 Paper: https://arxiv.org/abs/2310.12430v1 🚀Damo: https://damo.alibaba.com/labs/language-technology ai_machinelearning_big_data

3 677

Repost from Machinelearning

📚 Large (Language) Models and Foundation Models (LLM, LM, FM) for Time Series and Spatio-Temporal Data Профессионально курируемый список больших языковых моделей и базовых моделей (LLM, LM, FM) для темпоральных данных (временных рядов, пространственно-временных и событийных данных) с полезными ресурсами (статьи, код, датасеты и т.д.), целью которого является всестороннее обобщение последних достижений в этой области. В Проекте собрана информацию о докладах, учебниках и обзорах по ИИ для временных рядов (AI4TS)с ведущих конференций и в журналов по ИИ. 🖥 Github: https://github.com/qingsongedu/awesome-timeseries-spatiotemporal-lm-llm 📝 AI4TS: https://github.com/qingsongedu/awesome-AI-for-time-series-papers 📕 Paper: https://arxiv.org/abs/2310.10196v1 ai_machinelearning_big_data

3 677

https://pandas-ai.com/

3 677

https://microsoft.github.io/lida/ Automatic Generation of Visualizations and Infographics with LLMs

3 677

https://microsoft.github.io/lida/