NewSpace Times
NewSpace Times — Вселенная новостей о космосе и технологиях — будь в курсе.
Больше6 298
Подписчики
-1624 часа
-3877 дней
-1 61130 дней
- Подписчики
- Просмотры постов
- ER - коэффициент вовлеченности
Загрузка данных...
Прирост подписчиков
Загрузка данных...
🌟 Lance — современный колоночный формат данных для ML-приложений, реализованный на Rust
—
pip install pylance
Lance идеально подходит для создания поисковых систем и хранилищ данных, для масштабного обучения ML-моделей, для хранения таких данных как облака точек.
Поддерживает конвертацию из Parquet в 2 строки кода, при этом он быстрее Parquet в 100 раз.
Lance можно без проблем использовать с pandas, DuckDB, Polars, pyarrow и не только.
🖥 GitHub
🟡 Примеры использованияФото недоступноПоказать в Telegram
🌟 «Баннерная крутилка» — сервис, позволяющий выбрать несколько релевантных документов из базы в миллиард объявлений за 200 миллисекунд
Сервис выдерживает 700 тысяч RPS и более.
Решения для построения систем ранжирования подробно описаны в статье «Как устроен рекомендательный сервис, который выдерживает 700 тысяч запросов в секунду».
🟡Habr
Фото недоступноПоказать в Telegram
🌟 RAGapp — простой способ использовать Agentic RAG
—
docker run -p 8000:8000 ragapp/ragapp
RAGapp позволяет легко использовать Agentic RAG в любом продакшене.
Так же прост в настройке, как и пользовательские GPT OpenAI, но в отличии от них RAGapp может быть развернут в вашей собственной облачной инфраструктуре с помощью Docker.
RAGapp создан с использованием LlamaIndex.
После запуска контейнера, нужно перейти на localhost:8000
и настроить RAGapp.
Можно подключить любые модели, в том числе и локальные (с помощью Ollama)
🖥 GitHubФото недоступноПоказать в Telegram
❓Устали от скучных и статичных дашбордов?
👉🏻Хотите создавать интерактивные и визуально привлекательные дашборды, которые оживят ваши данные?
Тогда вам сюда!
На открытом уроке «Создание кастомных дэшбордов с помощью Plotly Dash» вы:
- познакомитесь с Plotly Dash — мощной библиотекой для создания интерактивных веб-приложений и дэшбордов;
- научитесь превращать сырые данные в понятные и красивые визуальные единицы;
- сможете создавать удобные и функциональные интерфейсы для взаимодействия с данными.
Присоединяйтесь 9 июля в 20:00 мск и станьте мастером визуализации в аналитике данных!
⚡️Регистрируйстесь сейчас по ссылке: https://otus.pw/3OSi/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8K4Qbi
Фото недоступноПоказать в Telegram
🌟 Kubeflow — экосистема open-source проектов для решения задач на каждом этапе развития ML-системы
Kubeflow делает ML на Kubernetes простым, переносимым и масштабируемым.
Цель Kubeflow — облегчить оркестрацию рабочих нагрузок ML в Kubernetes и предоставить возможность развертывать лучшие в своем классе инструменты в любой облачной инфраструктуре.
🖥 GitHub
🟡 Доки
Фото недоступноПоказать в Telegram
Станьте профессионалом в области Data Science и машинного обучения в магистратуре от Центрального университета!
Центральный университет — современный вуз, созданный при поддержке ведущих компаний России: Т-Банка, Авито и других.
Получите диплом магистра в области математики и компьютерных наук и обучайтесь на основе реальных кейсов ведущих ИТ-компаний у профессоров из МГУ, МФТИ, РЭШ и практиков из индустрии. Хорошая новость для тех, кто уже имеет опыт в Data Science и машинном обучении — вы можете пропустить базовое обучение и закончить магистратуру за 3 семестра.
У каждого студента будет:
- личный ментор по траектории обучения;
- доступ к карьерному центру с коучами и консультантами;
- опыт работы в проектах партнеров уже во время обучения.
Участвуйте в онлайн-отборе, чтобы выиграть грант на обучение до 1,2 млн рублей. Больше подробностей про университет и конкурс грантов по ссылке!
erid:2VtzqwTkpP2
Реклама, АНО ВО «Центральный университет», ИНН 7743418023
🖥 AutoGluon — библиотека Python, которая позволяет писать лаконичный код для задач ML
—
pip install autogluon
AutoGluon помогает несколькими строками кода обучать и использовать ML-модели;
позволяет решать задачи, связанные с изображениями, текстом, временными рядами и табличными данными.
🖥 GitHub
🟡 ДокиФото недоступноПоказать в Telegram
👨🎓Курс МФК МГУ "Нейронные сети и их применение в научных исследованиях"
Лекции:
- Новая суперспособность науки
- Как учить машины
- Линейные модели
- Сверточные сети
- Рекуррентные сети
- Трансформеры (часть 1)
- Трансформеры (часть 2). GPT
- Генеративные модели
- Обучение с подкреплением
- Нейрорендеринг
- Графовые сети
- Заключительная лекция
👉 Плейлист на Youtube
🌟 Scikit-LLM — библиотека Python, призванная упростить разработку сложных и готовых к продакшену конвейеров NLP
—
pip install scikit-llm
Scikit-LLM может взаимодействовать с различными провайдерами LLM, независимо от того, работают ли они локально (например, GPT4All) или в облаке (включая Azure, OpenAI и Vertex AI).
Scikit-LLM поддерживает широкий спектр задач анализа текста, включая классификацию, анализ эмоциональной составляющей и т.д. Для сложных сценариев можно объединить несколько задач в конвейер scikit-learn.
🖥 GitHub
🟡 Доки🖥 Unstructured — библиотека Python для предобработки сырых данных
—
pip install "unstructured[all-docs]"
Unstructured предоставляет компоненты для предобработки изображений, текстовых документов; поддерживает многие форматы: PDF, HTML, Word docs и др.
Запустить библиотеку в контейнере:
docker run -dt --name unstructured downloads.unstructured.io/unstructured-io/unstructured:latest
docker exec -it unstructured bash
🖥 GitHub
🟡 ДокиВыберите другой тариф
Ваш текущий тарифный план позволяет посмотреть аналитику только 5 каналов. Чтобы получить больше, выберите другой план.