nlp_daily
nlp_daily - это канал о крутой части машинного обучения, связанной с обработкой естественного языка (NLP). Здесь будут последние новости, исследования и туториалы. Ничего лишнего, только самое необходимое для NLP самурая. Контакт админа: @Markus85
Больше- Подписчики
- Просмотры постов
- ER - коэффициент вовлеченности
Загрузка данных...
Загрузка данных...
Все ссылки:
https://abdullin.com/e/df-2024Давайте поговорим про борьбу с галлюцинациями в современных RAG системах. Почему возникают галлюцинации, и как нам с ними бороться? Мы возьмем в качестве примера галлюцинации классическую систему на базе векторной RAG-системы и посмотрим, как она безудержно выдумывает ответы на простейший вопрос. Потом мы заглянем под капот в поисках источника ошибок и используем подход Knowledge Mapping для исправления этой ситуации. В завершение мы посмотрим на применение этого подхода в разных кейсах.
https://r.jina.ai/
к любому url, и получите контент страницы в чистом и удобном формате.
Бесплатно: Для доступа по апишке дают 1М бесплатных токенов, просто как ридер работает вообще бесплатно (видимо пока есть баблишко от инвесторов).
Веб-поиск: Можно включить https://s.jina.ai/
к запросу. Например, если ваш запрос Когда будет релиз gpt-5?
, url будет выглядеть так: https://s.jina.ai/Когда%20будет%20релиз%20gpt-5%3F
. Reader извлекает топ-5 результатов, посещает каждый url и применяет r.jina.ai
к каждому из них.
Можно потыкать ноутбукT5-based (russian) text normalization. Contribute to saarus72/text_normalization development by creating an account on GitHub.