Агенты ИИ | AGI_and_RL

@agi_and_rl

Про ии, RL и в целом @tokarev_i_v

Больше

Россия134 872Русский140 679Технологии и приложения20 845

Рекламные посты

2 758

Подписчики

+324 часа

+87 дней

+5330 дней

920

Просмотры поста

~ 48624 часа

~ 55248 часов

33.35%

Коэффициент вовлеченности

17.6%24 часа

20.0%48 часов

Упоминания

Нет данных7 дней

Нет данных30 дней

~ 1

Постов в день

~ 15

Реакции

~ 1

Комментарии

~ 28

Репосты

Подписчики
Просмотры постов
ER - коэффициент вовлеченности

Загрузка данных...

00:15

Видео недоступноПоказать в Telegram

На работу идет (счастлив)

Показать все...

humanoid_jump_3.mp44.23 MB

😁 24🤣 1😭 1

Немножко обзорных статей с листиками Большая обзорка мо Mixture of Experts (ну мб кому надо, хз зачем) A Survey on Mixture of Experts https://arxiv.org/abs/2407.06204 https://github.com/withinmiaov/A-Survey-on-Mixture-of-Experts Ну и дип лернинг в доказательстве теорем (это каждому надо) A Survey on Deep Learning for Theorem Proving https://arxiv.org/abs/2404.09939 https://github.com/zhaoyu-li/DL4TP

Показать все...

A Survey on Mixture of Experts

Large language models (LLMs) have garnered unprecedented advancements across diverse fields, ranging from natural language processing to computer vision and beyond. The prowess of LLMs is...

❤ 3

Фото недоступноПоказать в Telegram

Выкатили Flash Attention 3, он оптимизирован под поколение Hopper (H100, H800) Почитать https://tridao.me/publications/flash3/flash3.pdf https://tridao.me/blog/2024/flash3/ https://github.com/Dao-AILab/flash-attention Осталось купить H100/H800 ☔️

Показать все...

🔥 4

Фото недоступноПоказать в Telegram

Маленькая тулза для разметки датасетиков. (сам не пробовал, только что наткнулся) По сути опенсурсной ллмкой размечает немного данных, тренит нам классификатор и если качество не очень то будет данных досыпать.

1. LLM generates classification data from a subset of provided text 2. A classifier is trained on this LLM-generated data 3. The classifier is evaluated against a larger LLM for accuracy 4. If accuracy is insufficient, more data is added and training repeats 5. The process concludes when desired accuracy is achieved

Есть мордочка на Gradio Автор пишет, что мол без человеческой разметки (а с ллмной) смог натренить distilbert на 88% акураси. Ну ок https://github.com/e-p-armstrong/augmentoolkit

Показать все...

Repost from эйай ньюз

Фото недоступноПоказать в Telegram

Набор инструкций H100 и 4090 теперь задокументирован 👏 Умелец смог при помощи фаззера задокументировать набор инструкций актуальных карт Nvidia. Сама Nvidia такое в паблик не пускает, чтобы всё шло через CUDA, максимум PTX. Таким образом они добиваются вендорлока к картам Nvidia в целом, а не одной конкретной архитектуре. Проблема в том, что без такой документации заметно сложнее делать оптимизации под конкретные архитектуры. А вот с ней и альтернативные компиляторы для карт Nvidia делать будет проще, может, будут даже такие, что не качают пять гигов зависимостей (что-то я замечтался). Дальше автор собирается добавить данные о производительности каждой инструкции, что потребует кучу микробенчмарков. H100 RTX 4090 Код @ai_newz

Показать все...

🔥 9👍 2🤔 1

сохраняем листик с симуляторами и библиотекам по роботам (есть и другие но поменьше и уже сильно протухшие) https://github.com/jslee02/awesome-robotics-libraries

Показать все...

GitHub - jslee02/awesome-robotics-libraries: :sunglasses: A curated list of robotics libraries and software

:sunglasses: A curated list of robotics libraries and software - jslee02/awesome-robotics-libraries

⚡ 6

Он выпил кофе и уже бежит на работу, чтобы продуктивно потрудиться

Показать все...

media.gif14.79 MB

😁 6🔥 4❤‍🔥 1👍 1🤡 1🤪 1

Наконец-то все желающие могут делать ~~карьеры~~ llmы

Показать все...

😁 3👍 1

Repost from Love. Death. Transformers.

Фото недоступноПоказать в Telegram

Привет! Мы в ~~лабараторию ебаного ресерча~~ Vikhr models открываем летние стажировки Что по задачам: - Мержинг, стакинг, замеринг, эволюционка поверх LLM cтакинга - собирать крутые инструкт сеты, у нас много gpt4 токенов, если хочется трогать руками RAG, агентность, function calling и прочие хайповые слова - велком! - Учить Lora на разные задачи и трогать кучу очень интерсных задач (SPPO, DPO, KTO) - Есть целых! 4v100 и к конце лета приедет а6000 - Собрать самые крутые и самые мемные бенчмарки😎 - развлекатся с vllm, быстрым инференсом и при желании строить опенсуср - если вам хочется заводить свою шизо идею а на работе не дают - велком, мы сами такие Оплата: в авторах на хабре, вероятно на arxiv, уникальный опыт(сорян денег реально нет, мы реально работаем на энтузиазме) Скидывать cv, нюдсы, вопросы, ответы, предложения в: https://forms.gle/54BLnMMxZuNNboev6

Показать все...

👍 7💩 3🤡 2👎 1🤔 1

Фото недоступноПоказать в Telegram

Мы ж тут на пути к AGI, да? ~~в следующем году будет~~ Наткнулся на тредик в редите за 2020 где автор хотел услышать мнения, а будет ли обучение с подкреплением путем к AGI? Еще и запросик запилили. И вот результат забавный :)) https://www.reddit.com/r/reinforcementlearning/comments/kjntx8/rl_as_a_path_to_agi/

Показать все...

🌚 4😁 2👍 1

Выберите другой тариф

Ваш текущий тарифный план позволяет посмотреть аналитику только 5 каналов. Чтобы получить больше, выберите другой план.