cookie

Ми використовуємо файли cookie для покращення вашого досвіду перегляду. Натиснувши «Прийняти все», ви погоджуєтеся на використання файлів cookie.

avatar

Dealer.AI

Жоский ИИ дядя. Твой личный поставщик AI 💊💉🤖 Канал о мире интересного AI: ML, DL, NLP/NLU, RL, Retrieval, RecSys. Для связи @dealer_ai Habr @Andriljo

Більше
Рекламні дописи
5 239
Підписники
+924 години
+217 днів
+16030 днів

Триває завантаження даних...

Приріст підписників

Триває завантаження даних...

Фото недоступнеДивитись в Telegram
Когда пытаешься воспроизвести sota пейперы. *пятница развратница-sota юмор* Спасибо @FuturioFranklin
Показати все...
😁 32 2
Вокруг всякие там FA3 анонсы а тут HF под шумок с Кекасом-Керасом колабятся.. https://huggingface.co/blog/keras-nlp-integration
Показати все...
Announcing New Hugging Face and Keras NLP integration

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

7
Repost from Den4ik Research
embds_corr.py0.01 KB
👍 3
Repost from Den4ik Research
Фото недоступнеДивитись в Telegram
1
Repost from Den4ik Research
В копилку эмбеддинг моделей - deepvk/USER-bge-m3 Модель позиционируется как сентенс энкодер для русского языка, инициализированная на основе TatonkaHF/bge-m3_en_ru (урезанной версии baai/bge-m3). Однако близость с эмбдами оригинального BGE-M3 довольно высока:
Avg Cosine Similarity: 0.9666
Такая схожесть наводит на мысль о возможной дистилляции оригинальной BGE-M3, а что, так можно было?)) Вот он такой современный дистиллят рисерч)) При этом авторы описывают процесс обучения, включающий файнтюн на русскоязычных датасетах и применение техники LM-Cocktail для объединения моделей. Ниже приложу код замеров и ссылка на датасет: Датасет: en-ru-corpus Поддержать автора: cloudtips @den4ikresearch
Показати все...
Den4ikAI/yandex_parallel_ruen_corpus at main

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥 6
Тут конечно вопрос, скок видел BGE и этот тюн. Мб там шифт минимальный от родителя, а еще там мерджа, ну мб и дистилл. Интересное👇
Показати все...
Фото недоступнеДивитись в Telegram
метрики дваз
Показати все...
👍 3🔥 1
Фото недоступнеДивитись в Telegram
схема раз
Показати все...
👍 3🤔 2🔥 1
Когда роутят mom LLM, RouteLLM Уже во всю гуляет тренд роутить LLM. Дядя писал даже идейку тут. И вот очередная поделка, для этого. RouteLLM - это либа для эффективной маршрутизации нескольких LLM. Обещают как всегда скорость, и рост метрик аля mtbench и mmlu. В фреймворке реализована интеграция с API (OpenAI, Anthropic, Google, Amazon Bedrock) и локальным бекэндом (Ollama) Имеются 4 преднастроенные стратегии роутинга: х2 с LLM , одна на bert и святой random:) https://github.com/lm-sys/RouteLLM https://arxiv.org/pdf/2406.18665 https://huggingface.co/routellm
Показати все...
GitHub - lm-sys/RouteLLM: A framework for serving and evaluating LLM routers - save LLM costs without compromising quality!

A framework for serving and evaluating LLM routers - save LLM costs without compromising quality! - lm-sys/RouteLLM

🔥 4👍 2 1🥴 1
Фото недоступнеДивитись в Telegram
По легенде, особи AI противоположенного пола сбегаются на ДСов с Axe AI. Не реклама. Просто кек. Жена подогнала.
Показати все...
😁 66🙈 6
Оберіть інший тариф

На вашому тарифі доступна аналітика тільки для 5 каналів. Щоб отримати більше — оберіть інший тариф.