cookie

ما از کوکی‌ها برای بهبود تجربه مرور شما استفاده می‌کنیم. با کلیک کردن بر روی «پذیرش همه»، شما با استفاده از کوکی‌ها موافقت می‌کنید.

avatar

Агенты ИИ | AGI_and_RL

Про ии, RL и в целом @tokarev_i_v

نمایش بیشتر
پست‌های تبلیغاتی
2 759
مشترکین
+324 ساعت
+87 روز
+5330 روز

در حال بارگیری داده...

معدل نمو المشتركين

در حال بارگیری داده...

00:15
Video unavailableShow in Telegram
На работу идет (счастлив)
نمایش همه...
humanoid_jump_3.mp44.23 MB
😁 24🤣 1😭 1
Немножко обзорных статей с листиками Большая обзорка мо Mixture of Experts (ну мб кому надо, хз зачем) A Survey on Mixture of Experts https://arxiv.org/abs/2407.06204 https://github.com/withinmiaov/A-Survey-on-Mixture-of-Experts Ну и дип лернинг в доказательстве теорем (это каждому надо) A Survey on Deep Learning for Theorem Proving https://arxiv.org/abs/2404.09939 https://github.com/zhaoyu-li/DL4TP
نمایش همه...
A Survey on Mixture of Experts

Large language models (LLMs) have garnered unprecedented advancements across diverse fields, ranging from natural language processing to computer vision and beyond. The prowess of LLMs is...

3
Photo unavailableShow in Telegram
Выкатили Flash Attention 3, он оптимизирован под поколение Hopper (H100, H800) Почитать https://tridao.me/publications/flash3/flash3.pdf https://tridao.me/blog/2024/flash3/ https://github.com/Dao-AILab/flash-attention Осталось купить H100/H800 ☔️
نمایش همه...
🔥 4
Photo unavailableShow in Telegram
Маленькая тулза для разметки датасетиков. (сам не пробовал, только что наткнулся) По сути опенсурсной ллмкой размечает немного данных, тренит нам классификатор и если качество не очень то будет данных досыпать.
1. LLM generates classification data from a subset of provided text 2. A classifier is trained on this LLM-generated data 3. The classifier is evaluated against a larger LLM for accuracy 4. If accuracy is insufficient, more data is added and training repeats 5. The process concludes when desired accuracy is achieved
Есть мордочка на Gradio Автор пишет, что мол без человеческой разметки (а с ллмной) смог натренить distilbert на 88% акураси. Ну ок https://github.com/e-p-armstrong/augmentoolkit
نمایش همه...
Repost from эйай ньюз
Photo unavailableShow in Telegram
Набор инструкций H100 и 4090 теперь задокументирован 👏 Умелец смог при помощи фаззера задокументировать набор инструкций актуальных карт Nvidia. Сама Nvidia такое в паблик не пускает, чтобы всё шло через CUDA, максимум PTX. Таким образом они добиваются вендорлока к картам Nvidia в целом, а не одной конкретной архитектуре. Проблема в том, что без такой документации заметно сложнее делать оптимизации под конкретные архитектуры. А вот с ней и альтернативные компиляторы для карт Nvidia делать будет проще, может, будут даже такие, что не качают пять гигов зависимостей (что-то я замечтался). Дальше автор собирается добавить данные о производительности каждой инструкции, что потребует кучу микробенчмарков. H100 RTX 4090 Код @ai_newz
نمایش همه...
🔥 9👍 2🤔 1
сохраняем листик с симуляторами и библиотекам по роботам (есть и другие но поменьше и уже сильно протухшие) https://github.com/jslee02/awesome-robotics-libraries
نمایش همه...
GitHub - jslee02/awesome-robotics-libraries: :sunglasses: A curated list of robotics libraries and software

:sunglasses: A curated list of robotics libraries and software - jslee02/awesome-robotics-libraries

6
Он выпил кофе и уже бежит на работу, чтобы продуктивно потрудиться
نمایش همه...
media.gif14.79 MB
😁 6🔥 4❤‍🔥 1👍 1🤡 1🤪 1
Наконец-то все желающие могут делать карьеры llmы
نمایش همه...
😁 3👍 1
Photo unavailableShow in Telegram
Привет! Мы в лабараторию ебаного ресерча Vikhr models открываем летние стажировки Что по задачам: - Мержинг, стакинг, замеринг, эволюционка поверх LLM cтакинга - собирать крутые инструкт сеты, у нас много gpt4 токенов, если хочется трогать руками RAG, агентность, function calling и прочие хайповые слова - велком! - Учить Lora на разные задачи и трогать кучу очень интерсных задач (SPPO, DPO, KTO) - Есть целых! 4v100 и к конце лета приедет а6000 - Собрать самые крутые и самые мемные бенчмарки😎 - развлекатся с vllm, быстрым инференсом и при желании строить опенсуср - если вам хочется заводить свою шизо идею а на работе не дают - велком, мы сами такие Оплата: в авторах на хабре, вероятно на arxiv, уникальный опыт(сорян денег реально нет, мы реально работаем на энтузиазме) Скидывать cv, нюдсы, вопросы, ответы, предложения в: https://forms.gle/54BLnMMxZuNNboev6
نمایش همه...
👍 7💩 3🤡 2👎 1🤔 1
Photo unavailableShow in Telegram
Мы ж тут на пути к AGI, да? в следующем году будет Наткнулся на тредик в редите за 2020 где автор хотел услышать мнения, а будет ли обучение с подкреплением путем к AGI? Еще и запросик запилили. И вот результат забавный :)) https://www.reddit.com/r/reinforcementlearning/comments/kjntx8/rl_as_a_path_to_agi/
نمایش همه...
🌚 4😁 2👍 1
یک طرح متفاوت انتخاب کنید

طرح فعلی شما تنها برای 5 کانال تجزیه و تحلیل را مجاز می کند. برای بیشتر، لطفا یک طرح دیگر انتخاب کنید.