Data Science | Machinelearning [ru]
Статьи на тему data science, machine learning, big data, python, математика, нейронные сети, искусственный интеллект (artificial intelligence) По сотрудничеству - @g_abashkin
Більше16 377
Підписники
-1224 години
-717 днів
-18630 днів
- Підписники
- Перегляди допису
- ER - коефіцієнт залучення
Триває завантаження даних...
Приріст підписників
Триває завантаження даних...
⚡️Cover-Agent — инструмент с открытым исходным кодом, включающий в себя реализацию TestGen-LLM от Meta для автоматического улучшения наборов тестов
Cover-Agent использует генеративный искусственный интеллект для автоматизации и улучшения генерации тестов (сейчас в основном юнит-тестов).
Cover-Agent может запускаться через терминал, в будущем его планируется интегрировать в популярные CI-платформы.
Cover-Agent может работать через терминал, и его планируется интегрировать в популярные CI-платформы.
🖥GitHub
🟡Связанная статья Arxiv
@Devsp — Подписаться
🫖 Как стать топовым Data-инженером?
Хотите развиваться в Data-инжиниринге, но не знаете, что для этого нужно?
Подключайтесь к вебинару от Слёрм «ИИ и инструменты Data-специалиста» и получите инсайдерские знания о том, как улучшить свои навыки и стать лидером в области обработки данных.
Когда? 27 мая в 19:00
➡ Зарегистрироваться
В программе:
- Вкатились в Data-инжиниринг. Что дальше?
- Управление знаниями: персональная Data-инженерная вики.
- Где и как рисовать диаграммы и схемы?
- Чат-боты и ChatOps: персональный помощник Data-инженера.
- Какие софт скиллы нужны Data-инженеру?
- Нужны ли Data-инженеру пет-проекты и участие в хакатонах?
- Как влиться в DE-комьюнити?
Спикеры:
Николай Марков, Data Platform Lead в компании Altenar, спикер курса Слёрма «Data-инженер», 11 лет опыта в разработке и проектировании.
Игорь Мосягин, Data-*разработчик в shrimpsizemoose AB, PhD по теоретической физике.
❓ А еще на вебинаре вас ждёт анонс нового и пока секретного проекта. Приходите, чтобы узнать подробности!
До встречи 27 мая!
➡ Регистрируйтесь в боте
Реклама ООО «Слёрм» ИНН 3652901451, erid: 2VtzqusiBw1
🚀 MoRA: High-Rank Updating for Parameter-Efficient Fine-Tuning
MoRA - новый метод использования высокоранговых обновлений весов для файнтюнига моделей при сохранении того же количества обучаемых параметров, как и при использовании матриц низкого ранга.
▪repo: https://github.com/kongds/MoRA
▪abs: https://arxiv.org/abs/2405.12130
@Devsp — Подписаться
⚡️Phi-3-medium-4k-instruct
Phi-3 Vision — это легкая, современная открытая мультимодальная модель, построенная на наборах данных, которые включают в себя синтетические данные и отфильтрованные общедоступные веб-сайты с упором на очень высококачественные, аргументированные и плотные данные как в текстовом, так и в визуальном виде.
Модель прошла тщательный процесс усовершенствования, включающий как контролируемую точную настройку, так и прямую оптимизацию предпочтений, чтобы обеспечить точное соблюдение инструкций и надежные меры безопасности.
- Phi-3-Vision: https://huggingface.co/microsoft/Phi-3-vision-128k-instruct
- Phi-3-Small:
~8k: https://huggingface.co/microsoft/Phi-3-small-8k-instruct
~128k: https://huggingface.co/microsoft/Phi-3-small-128k-instruct
- Phi-3-Medium:
~4k: https://huggingface.co/microsoft/Phi-3-medium-4k-instruct
~128k: https://huggingface.co/microsoft/Phi-3-medium-128k-instruct
@Devsp — Подписаться
⚡️Devon — open-source AI-программист
Devon — AI-помощник, которого можно использовать для парного программирования;
open-source аналог Devin.
Использует API Anthropic, или OpenAI, или Groq.
🖥GitHub
🟡Пример использования
@Devsp — Подписаться
⚡️ Layer-Condensed KV Cache
Layer-Condensed KV Cache — новый вариант декодеров-трансформеров, в котором запросы всех уровней сочетаются с ключами и значениями только верхнего уровня.
Обеспечивает в 26 раз более высокую пропускную способность по сравнению со стандартными трансформерами и помогает увеличить производительность больших языковых моделей.
▪repo: https://github.com/whyNLP/LCKV
▪abs: https://arxiv.org/abs/2405.10637
@Devsp — Подписаться
Фото недоступнеДивитись в Telegram
Стать сотрудником Яндекса быстрее и проще, чем кажется. Участвуйте в днях быстрого найма: решите тестовое, пройдите несколько секций собеседования и получите офер за несколько дней.
Ближайшее Fast Track мероприятие:
• 8–9 июня — для дата-инженеров, офер за 2 дня в DWH команды Маркета.
Зарегистрироваться
🔥 GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting
GaussianObject — платформа для представления и рендеринга 3D-объектов с помощью гауссовских пятен, которая обеспечивает высокое качество рендеринга всего с четырьмя входными изображениями.
▪️Github: https://github.com/GaussianObject/GaussianObject
▪️Colab: https://colab.research.google.com/drive/1WIZgM--tJ3aq25t9g238JAuAoXrQYVMs?usp=sharing#scrollTo=TlrxF62GNePB
▪️Project: https://gaussianobject.github.io
@Devsp — Подписаться
⚡️PHUDGE3: Phi-3 как масштабируемая система оценивания LLM
PHUDGE — тонко настроенная модель Phi3, которая достигла результатов SOTA в 4 задачах: Feedback Test, Feedback OOD, MT Human, Preference Test, превзойдя все существующие модели по задержке и пропускной способности.
PHUDGE демонстрирует очень сильную корреляцию не только с GPT4, но и с человеческими аннотаторами на непросмотренных данных, а также в задачах абсолютного и относительного оценивания.
📎Arxiv
@Devsp — Подписаться
Фото недоступнеДивитись в Telegram
Академия Аналитиков Авито открывает новый набор.
Учись у практиков. Решай задачи бигтеха.
Прокачайся как аналитик данных или DS-инженер.
Такая строчка в резюме = буст к карьере.