Агенты ИИ | AGI_and_RL

@agi_and_rl

Про ии, RL и в целом @tokarev_i_v

نمایش بیشتر

روسيا134 872روسی140 679فناوری و برنامه‌ها20 845

پست‌های تبلیغاتی

2 759

مشترکین

+324 ساعت

+87 روز

+5330 روز

920

نمایش های پست

~ 48624 ساعت

~ 55248 ساعت

33.35%

نرخ مشارکت

17.6%24 ساعت

20.0%48 ساعت

یادکردها

اطلاعاتی وجود ندارد7 روز

اطلاعاتی وجود ندارد30 روز

~ 1

پست های در روز

~ 15

واکنش ها

~ 1

نظرات

~ 28

بازنشرها

مشترکین
پوشش پست
ER - نسبت تعامل

در حال بارگیری داده...

00:15

Video unavailableShow in Telegram

На работу идет (счастлив)

نمایش همه...

humanoid_jump_3.mp44.23 MB

😁 24🤣 1😭 1

Немножко обзорных статей с листиками Большая обзорка мо Mixture of Experts (ну мб кому надо, хз зачем) A Survey on Mixture of Experts https://arxiv.org/abs/2407.06204 https://github.com/withinmiaov/A-Survey-on-Mixture-of-Experts Ну и дип лернинг в доказательстве теорем (это каждому надо) A Survey on Deep Learning for Theorem Proving https://arxiv.org/abs/2404.09939 https://github.com/zhaoyu-li/DL4TP

نمایش همه...

A Survey on Mixture of Experts

Large language models (LLMs) have garnered unprecedented advancements across diverse fields, ranging from natural language processing to computer vision and beyond. The prowess of LLMs is...

❤ 3

Photo unavailableShow in Telegram

Выкатили Flash Attention 3, он оптимизирован под поколение Hopper (H100, H800) Почитать https://tridao.me/publications/flash3/flash3.pdf https://tridao.me/blog/2024/flash3/ https://github.com/Dao-AILab/flash-attention Осталось купить H100/H800 ☔️

نمایش همه...

🔥 4

Photo unavailableShow in Telegram

Маленькая тулза для разметки датасетиков. (сам не пробовал, только что наткнулся) По сути опенсурсной ллмкой размечает немного данных, тренит нам классификатор и если качество не очень то будет данных досыпать.

1. LLM generates classification data from a subset of provided text 2. A classifier is trained on this LLM-generated data 3. The classifier is evaluated against a larger LLM for accuracy 4. If accuracy is insufficient, more data is added and training repeats 5. The process concludes when desired accuracy is achieved

Есть мордочка на Gradio Автор пишет, что мол без человеческой разметки (а с ллмной) смог натренить distilbert на 88% акураси. Ну ок https://github.com/e-p-armstrong/augmentoolkit

نمایش همه...

Repost from эйай ньюз

Photo unavailableShow in Telegram

Набор инструкций H100 и 4090 теперь задокументирован 👏 Умелец смог при помощи фаззера задокументировать набор инструкций актуальных карт Nvidia. Сама Nvidia такое в паблик не пускает, чтобы всё шло через CUDA, максимум PTX. Таким образом они добиваются вендорлока к картам Nvidia в целом, а не одной конкретной архитектуре. Проблема в том, что без такой документации заметно сложнее делать оптимизации под конкретные архитектуры. А вот с ней и альтернативные компиляторы для карт Nvidia делать будет проще, может, будут даже такие, что не качают пять гигов зависимостей (что-то я замечтался). Дальше автор собирается добавить данные о производительности каждой инструкции, что потребует кучу микробенчмарков. H100 RTX 4090 Код @ai_newz

نمایش همه...

🔥 9👍 2🤔 1

сохраняем листик с симуляторами и библиотекам по роботам (есть и другие но поменьше и уже сильно протухшие) https://github.com/jslee02/awesome-robotics-libraries

نمایش همه...

GitHub - jslee02/awesome-robotics-libraries: :sunglasses: A curated list of robotics libraries and software

:sunglasses: A curated list of robotics libraries and software - jslee02/awesome-robotics-libraries

⚡ 6

Он выпил кофе и уже бежит на работу, чтобы продуктивно потрудиться

نمایش همه...

media.gif14.79 MB

😁 6🔥 4❤‍🔥 1👍 1🤡 1🤪 1

Наконец-то все желающие могут делать ~~карьеры~~ llmы

نمایش همه...

😁 3👍 1

Repost from Love. Death. Transformers.

Photo unavailableShow in Telegram

Привет! Мы в ~~лабараторию ебаного ресерча~~ Vikhr models открываем летние стажировки Что по задачам: - Мержинг, стакинг, замеринг, эволюционка поверх LLM cтакинга - собирать крутые инструкт сеты, у нас много gpt4 токенов, если хочется трогать руками RAG, агентность, function calling и прочие хайповые слова - велком! - Учить Lora на разные задачи и трогать кучу очень интерсных задач (SPPO, DPO, KTO) - Есть целых! 4v100 и к конце лета приедет а6000 - Собрать самые крутые и самые мемные бенчмарки😎 - развлекатся с vllm, быстрым инференсом и при желании строить опенсуср - если вам хочется заводить свою шизо идею а на работе не дают - велком, мы сами такие Оплата: в авторах на хабре, вероятно на arxiv, уникальный опыт(сорян денег реально нет, мы реально работаем на энтузиазме) Скидывать cv, нюдсы, вопросы, ответы, предложения в: https://forms.gle/54BLnMMxZuNNboev6

نمایش همه...

👍 7💩 3🤡 2👎 1🤔 1

Photo unavailableShow in Telegram

Мы ж тут на пути к AGI, да? ~~в следующем году будет~~ Наткнулся на тредик в редите за 2020 где автор хотел услышать мнения, а будет ли обучение с подкреплением путем к AGI? Еще и запросик запилили. И вот результат забавный :)) https://www.reddit.com/r/reinforcementlearning/comments/kjntx8/rl_as_a_path_to_agi/

نمایش همه...

🌚 4😁 2👍 1

یک طرح متفاوت انتخاب کنید

طرح فعلی شما تنها برای 5 کانال تجزیه و تحلیل را مجاز می کند. برای بیشتر، لطفا یک طرح دیگر انتخاب کنید.