cookie

Мы используем файлы cookie для улучшения сервиса. Нажав кнопку «Принять все», вы соглашаетесь с использованием cookies.

avatar

Агенты ИИ | AGI_and_RL

Про ии, RL и в целом @tokarev_i_v

Больше
Рекламные посты
2 758
Подписчики
+324 часа
+87 дней
+5330 дней

Загрузка данных...

Прирост подписчиков

Загрузка данных...

00:15
Видео недоступноПоказать в Telegram
На работу идет (счастлив)
Показать все...
humanoid_jump_3.mp44.23 MB
😁 24🤣 1😭 1
Немножко обзорных статей с листиками Большая обзорка мо Mixture of Experts (ну мб кому надо, хз зачем) A Survey on Mixture of Experts https://arxiv.org/abs/2407.06204 https://github.com/withinmiaov/A-Survey-on-Mixture-of-Experts Ну и дип лернинг в доказательстве теорем (это каждому надо) A Survey on Deep Learning for Theorem Proving https://arxiv.org/abs/2404.09939 https://github.com/zhaoyu-li/DL4TP
Показать все...
A Survey on Mixture of Experts

Large language models (LLMs) have garnered unprecedented advancements across diverse fields, ranging from natural language processing to computer vision and beyond. The prowess of LLMs is...

3
Фото недоступноПоказать в Telegram
Выкатили Flash Attention 3, он оптимизирован под поколение Hopper (H100, H800) Почитать https://tridao.me/publications/flash3/flash3.pdf https://tridao.me/blog/2024/flash3/ https://github.com/Dao-AILab/flash-attention Осталось купить H100/H800 ☔️
Показать все...
🔥 4
Фото недоступноПоказать в Telegram
Маленькая тулза для разметки датасетиков. (сам не пробовал, только что наткнулся) По сути опенсурсной ллмкой размечает немного данных, тренит нам классификатор и если качество не очень то будет данных досыпать.
1. LLM generates classification data from a subset of provided text 2. A classifier is trained on this LLM-generated data 3. The classifier is evaluated against a larger LLM for accuracy 4. If accuracy is insufficient, more data is added and training repeats 5. The process concludes when desired accuracy is achieved
Есть мордочка на Gradio Автор пишет, что мол без человеческой разметки (а с ллмной) смог натренить distilbert на 88% акураси. Ну ок https://github.com/e-p-armstrong/augmentoolkit
Показать все...
Repost from эйай ньюз
Фото недоступноПоказать в Telegram
Набор инструкций H100 и 4090 теперь задокументирован 👏 Умелец смог при помощи фаззера задокументировать набор инструкций актуальных карт Nvidia. Сама Nvidia такое в паблик не пускает, чтобы всё шло через CUDA, максимум PTX. Таким образом они добиваются вендорлока к картам Nvidia в целом, а не одной конкретной архитектуре. Проблема в том, что без такой документации заметно сложнее делать оптимизации под конкретные архитектуры. А вот с ней и альтернативные компиляторы для карт Nvidia делать будет проще, может, будут даже такие, что не качают пять гигов зависимостей (что-то я замечтался). Дальше автор собирается добавить данные о производительности каждой инструкции, что потребует кучу микробенчмарков. H100 RTX 4090 Код @ai_newz
Показать все...
🔥 9👍 2🤔 1
сохраняем листик с симуляторами и библиотекам по роботам (есть и другие но поменьше и уже сильно протухшие) https://github.com/jslee02/awesome-robotics-libraries
Показать все...
GitHub - jslee02/awesome-robotics-libraries: :sunglasses: A curated list of robotics libraries and software

:sunglasses: A curated list of robotics libraries and software - jslee02/awesome-robotics-libraries

6
Он выпил кофе и уже бежит на работу, чтобы продуктивно потрудиться
Показать все...
media.gif14.79 MB
😁 6🔥 4❤‍🔥 1👍 1🤡 1🤪 1
Наконец-то все желающие могут делать карьеры llmы
Показать все...
😁 3👍 1
Фото недоступноПоказать в Telegram
Привет! Мы в лабараторию ебаного ресерча Vikhr models открываем летние стажировки Что по задачам: - Мержинг, стакинг, замеринг, эволюционка поверх LLM cтакинга - собирать крутые инструкт сеты, у нас много gpt4 токенов, если хочется трогать руками RAG, агентность, function calling и прочие хайповые слова - велком! - Учить Lora на разные задачи и трогать кучу очень интерсных задач (SPPO, DPO, KTO) - Есть целых! 4v100 и к конце лета приедет а6000 - Собрать самые крутые и самые мемные бенчмарки😎 - развлекатся с vllm, быстрым инференсом и при желании строить опенсуср - если вам хочется заводить свою шизо идею а на работе не дают - велком, мы сами такие Оплата: в авторах на хабре, вероятно на arxiv, уникальный опыт(сорян денег реально нет, мы реально работаем на энтузиазме) Скидывать cv, нюдсы, вопросы, ответы, предложения в: https://forms.gle/54BLnMMxZuNNboev6
Показать все...
👍 7💩 3🤡 2👎 1🤔 1
Фото недоступноПоказать в Telegram
Мы ж тут на пути к AGI, да? в следующем году будет Наткнулся на тредик в редите за 2020 где автор хотел услышать мнения, а будет ли обучение с подкреплением путем к AGI? Еще и запросик запилили. И вот результат забавный :)) https://www.reddit.com/r/reinforcementlearning/comments/kjntx8/rl_as_a_path_to_agi/
Показать все...
🌚 4😁 2👍 1
Выберите другой тариф

Ваш текущий тарифный план позволяет посмотреть аналитику только 5 каналов. Чтобы получить больше, выберите другой план.