cookie

ما از کوکی‌ها برای بهبود تجربه مرور شما استفاده می‌کنیم. با کلیک کردن بر روی «پذیرش همه»، شما با استفاده از کوکی‌ها موافقت می‌کنید.

avatar

Dealer.AI

Жоский ИИ дядя. Твой личный поставщик AI 💊💉🤖 Канал о мире интересного AI: ML, DL, NLP/NLU, RL, Retrieval, RecSys. Для связи @dealer_ai Habr @Andriljo

نمایش بیشتر
پست‌های تبلیغاتی
5 239
مشترکین
+924 ساعت
+217 روز
+16030 روز

در حال بارگیری داده...

معدل نمو المشتركين

در حال بارگیری داده...

Photo unavailableShow in Telegram
Когда пытаешься воспроизвести sota пейперы. *пятница развратница-sota юмор* Спасибо @FuturioFranklin
نمایش همه...
😁 32 2
Вокруг всякие там FA3 анонсы а тут HF под шумок с Кекасом-Керасом колабятся.. https://huggingface.co/blog/keras-nlp-integration
نمایش همه...
Announcing New Hugging Face and Keras NLP integration

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

7
Repost from Den4ik Research
embds_corr.py0.01 KB
👍 3
Repost from Den4ik Research
Photo unavailableShow in Telegram
1
Тут конечно вопрос, скок видел BGE и этот тюн. Мб там шифт минимальный от родителя, а еще там мерджа, ну мб и дистилл. Интересное👇
نمایش همه...
Repost from Den4ik Research
В копилку эмбеддинг моделей - deepvk/USER-bge-m3 Модель позиционируется как сентенс энкодер для русского языка, инициализированная на основе TatonkaHF/bge-m3_en_ru (урезанной версии baai/bge-m3). Однако близость с эмбдами оригинального BGE-M3 довольно высока:
Avg Cosine Similarity: 0.9666
Такая схожесть наводит на мысль о возможной дистилляции оригинальной BGE-M3, а что, так можно было?)) Вот он такой современный дистиллят рисерч)) При этом авторы описывают процесс обучения, включающий файнтюн на русскоязычных датасетах и применение техники LM-Cocktail для объединения моделей. Ниже приложу код замеров и ссылка на датасет: Датасет: en-ru-corpus Поддержать автора: cloudtips @den4ikresearch
نمایش همه...
Den4ikAI/yandex_parallel_ruen_corpus at main

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥 6
Photo unavailableShow in Telegram
метрики дваз
نمایش همه...
👍 3🔥 1
Photo unavailableShow in Telegram
схема раз
نمایش همه...
👍 3🤔 2🔥 1
Когда роутят mom LLM, RouteLLM Уже во всю гуляет тренд роутить LLM. Дядя писал даже идейку тут. И вот очередная поделка, для этого. RouteLLM - это либа для эффективной маршрутизации нескольких LLM. Обещают как всегда скорость, и рост метрик аля mtbench и mmlu. В фреймворке реализована интеграция с API (OpenAI, Anthropic, Google, Amazon Bedrock) и локальным бекэндом (Ollama) Имеются 4 преднастроенные стратегии роутинга: х2 с LLM , одна на bert и святой random:) https://github.com/lm-sys/RouteLLM https://arxiv.org/pdf/2406.18665 https://huggingface.co/routellm
نمایش همه...
GitHub - lm-sys/RouteLLM: A framework for serving and evaluating LLM routers - save LLM costs without compromising quality!

A framework for serving and evaluating LLM routers - save LLM costs without compromising quality! - lm-sys/RouteLLM

🔥 4👍 2 1🥴 1
Photo unavailableShow in Telegram
По легенде, особи AI противоположенного пола сбегаются на ДСов с Axe AI. Не реклама. Просто кек. Жена подогнала.
نمایش همه...
😁 66🙈 6
یک طرح متفاوت انتخاب کنید

طرح فعلی شما تنها برای 5 کانال تجزیه و تحلیل را مجاز می کند. برای بیشتر، لطفا یک طرح دیگر انتخاب کنید.