cookie

ما از کوکی‌ها برای بهبود تجربه مرور شما استفاده می‌کنیم. با کلیک کردن بر روی «پذیرش همه»، شما با استفاده از کوکی‌ها موافقت می‌کنید.

avatar

Старший Авгур

Сохраненки и шитпост про ML от @YallenGusev

نمایش بیشتر
پست‌های تبلیغاتی
2 258
مشترکین
+2724 ساعت
+587 روز
+31530 روز

در حال بارگیری داده...

معدل نمو المشتركين

در حال بارگیری داده...

Photo unavailableShow in Telegram
Тут 2 новости: - У меня наконец получилось сварить SFT модель лучше, чем v4. А надо было всего лишь использовать простой советский weight_decay - phi3-medium вполне хороша из коробки, тюн на Сайге уменьшает длину ответов, но тоже ничего не портит
نمایش همه...
🔥 24🆒 4👏 2👍 1 1🫡 1
Photo unavailableShow in Telegram
Вот примерно вот так это работает, системные промпты локальны для чатов.
نمایش همه...
👍 43😁 23 2
@saiga_igusev_bot можно добавлять в чаты! Картинки там не поддерживаются, но всю историю чата бот запоминает. Можно использовать для чего угодно: для суммаризации, для справки, для озвучивания мнения. Пока в тестовом режиме, собираю баги.
نمایش همه...
18👍 7🤔 2👎 1🔥 1🤯 1🤝 1
Photo unavailableShow in Telegram
Неполный список команд.
نمایش همه...
👍 25🔥 5👏 1
/settopp
نمایش همه...
Добавил задание температуры (/settemperature) и top-p (/settopp) в боте и узнавание текущего лимита (/getcount). Настройки применяются только к текущей модели. Все команды показываются по "/".
نمایش همه...
Добавил Opus в бота. Не написав не одной строчки кода в самом боте! Однако пришлось написать прокси, чтобы привести формат API к OpenAI виду. За основу взял вот эту штуку: claude-to-chatgpt, но там старый формат API, поэтому пришлось немного переписать. Финальный вариант: anthropic2openai.js Задеплоил прокси на Cloudfare Workers, и оно работает.
نمایش همه...
👍 37 2👏 1🤔 1
Мини-пост на ночь. Всю свою работу, за которую я не получаю деньги, я выкладываю в open source. Так было всегда. Вот, например, мои решения задачек с 1 курса универа 11-летней давности. Были бы и крестики-нолики на Паскале из 9 класса, но я их хостил на Bitbucket, и он их сожрал 😭 Для меня моей список репозиториев — это своеобразный фотоальбом с разными этапами и событиями из моей жизни. Я не вижу ни одной причины как-либо скрывать свой код/данные/модели. Люди, чего вы стесняетесь? HR всё равно туда не посмотрят, а для любого технического специалиста что-то всегда лучше, чем ничего. Какого бы качества не был код. Зато плюсов дофига: - Всегда можно вспомнить "о, я это писал" и скинуть ссылку. - Всегда есть что показать и рассказать. - Даже для любого самого мелкого проекта может найтись человек, которому это пригодится. Ко мне до сих пор приходят люди по поводу богом забытого rnnmorph. Но всё равно я регулярно вижу, что кто-то делает пет-проекты в приватных репозиториях. Зачем?..
نمایش همه...
👍 75 31🤔 4
Два момента: - Перенёс все нужные скрипты и конфиги в отдельный репозиторий: saiga. Старый репо превратился в файлопомойку с тыщей ответов моделей, конфигов, ненужных скриптов и вот этого всего. Плюс сам репо уже старше BERT'а (6 лет!). Напоминаю, что код бота в saiga_bot. - Saiga-Aya на моём бенче довольно низко. Но я глазами посмотрел ответы, и у неё довольно хороший русский. Я скорее всего её выложу, потому что по-моему и для неё найдутся применения.
نمایش همه...
GitHub - IlyaGusev/saiga

Contribute to IlyaGusev/saiga development by creating an account on GitHub.

👍 26🔥 10 2🏆 1
Photo unavailableShow in Telegram
Предварительные результаты по phi3 medium. Почему предварительные: 4к контекста, AWQ, скорее всего косяки с форматом. Можно ещё заметить новую схему версионирования. d = версия датасета, m = версия конфига модели. Конфиги датасетов тут.
نمایش همه...
👍 21🔥 5🤝 2 1🤔 1