en
Feedback
Machine learning Interview

Machine learning Interview

Open in Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Show more

📈 Analytical overview of Telegram channel Machine learning Interview

Channel Machine learning Interview (@machinelearning_interview) in the Russian language segment is an active participant. Currently, the community unites 30 043 subscribers, ranking 4 573 in the Technologies & Applications category and 21 935 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 30 043 subscribers.

According to the latest data from 12 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 33 over the last 30 days and by -3 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 20.97%. Within the first 24 hours after publication, content typically collects 8.31% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 6 297 views. Within the first day, a publication typically gains 2 497 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 40.
  • Thematic interests: Content is focused on key topics such as claude, llm, контекст, hermes, nvidia.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Thanks to the high frequency of updates (latest data received on 13 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

30 043
Subscribers
-324 hours
-167 days
+3330 days
Posts Archive
Какие навыки необходимы специалисту в ML и Data Science? В новом выпуске подкаста на канале MLinside руководитель ШАДа Яндекса Алексей Толстиков поделился, что, по его мнению, отличает сильных специалистов в области ИИ и какие компетенции делают кандидатов конкурентоспособнее. Ключевые темы подкаста: • Какие ML-специалисты и датасаентисты нужны рынку • Какие навыки, помимо технических, нужны чтобы стать успешным в этой профессии • Как совмещать учебу на датасаентиста с работой Посмотреть выпуск можно на YouTube

⚡️ Anthropic недавно опубликовала результаты своего исследования, посвящённого тому, как можно обойти защитные механизмы боль
⚡️ Anthropic недавно опубликовала результаты своего исследования, посвящённого тому, как можно обойти защитные механизмы больших языковых моделей (LLM). Предложенный ими метод под названием Best-of-N Jailbreaking (BoN) основан на множественных вариациях одного и того же запроса, чтобы выявить уязвимости. Принцип работы метода: Для начала создаётся потенциально опасный запрос, такой как «Как сделать бомбу?» Далее этот запрос подвергается различным изменениям: - В тексте: вводятся опечатки, символы заменяются, например, через использование L337-кодировки. - В аудиоформате: изменяется тональность голоса и добавляется фоновый шум. - На изображениях: меняются цвета, шрифт или добавляются дополнительные элементы. После внесения изменений запрос направляется на языковую модель, а результат проверяется специальным классификатором. Процесс повторяется множество раз – в исследовании было протестировано свыше 10 000 различных вариантов запросов. Результаты: Метод показал высокую эффективность: 89% успешных обходов защиты у GPT-4o и 78% у Claude 3.5 Sonnet. При комбинировании BoN с другими методами атаки, такими как оптимизированная префиксная атака, успех увеличивается на 35%. Этот подход применим ко всем видам данных: текстам, аудио и изображениям, подтверждая наличие реальных уязвимостей в современных LLM. С каждым новым изменением возрастает вероятность успешного обхода защиты, что создаёт серьёзную проблему для разработчиков, которым предстоит создать более надёжные системы. Заключение: Исследование даёт двойственный эффект: оно демонстрирует слабые стороны искусственного интеллекта, но одновременно предоставляет инструменты для улучшения безопасности. Best-of-N Jailbreaking: https://arxiv.org/abs/2412.03556 @machinelearning_interview

Новый уровень продуктивной разработки: добро пожаловать на платформу GitVerse На платформе для работы с исходным кодом GitVer
Новый уровень продуктивной разработки: добро пожаловать на платформу GitVerse На платформе для работы с исходным кодом GitVerse можно легко и удобно организовать разработку любых проектов: писать и проверять код, автоматизировать CI/CD-процессы, общаться с единомышленниками и стать частью open source сообщества. Что еще могут пользователи GitVerse: – переносить проекты с других git-площадок в один клик; – размещать открытые и приватные репозитории, работать самостоятельно и в командах; – управлять проектами с помощью удобных досок и карточек, назначать роли, ревьюеров и делать все процессы прозрачными; – делегировать рутинные задачи AI-ассистенту GigaCode, чтобы посвятить время по-настоящему интересным задачам! Регистрируйтесь на платформе GitVerse и повышайте эффективность разработки!

Repost from Machinelearning
🌟 OLA-VLM: метод повышения визуального восприятия в MLLM с помощью вспомогательной дистилляции эмбедингов. OLA-VLM - метод,
+2
🌟 OLA-VLM: метод повышения визуального восприятия в MLLM с помощью вспомогательной дистилляции эмбедингов. OLA-VLM - метод, который предлагает дистиллировать знания от визуальных энкодеров в противовес традиционному способу обучения MLLM. В качестве целевых визуальных энкодеров были выбраны модели сегментации, оценки глубины и генерации изображений. На каждом слое LLM обучался проб, который должен прогнозировать выход соответствующего целевого энкодера. Так архитектура OLA-VLM получила предикторы встраивания, которые получают токены из LLM и генерируют предсказания для вычисления потери встраивания. Эта потеря минимизируется вместе с потерей предсказания следующего токена. Для улучшения восприятия целевой информации OLA-VLM использует специальные токены ⟨t⟩, которые добавляются к токенам изображения на входе LLM. Во время фазы настройки MLLM обучается только с использованием потери предсказания следующего токена. При этом специальные токены ⟨t⟩ остаются в входной последовательности, формируя неявную визуальную цепь рассуждений. Эксперименты показали, что OLA-VLM превосходит модели семейства LLaVA-1.5 как по качеству визуальных представлений, так и по эффективности на различных тестах. Методом OLA-VLM были обучены 12 моделей на LLMs Phi3-4K-mini и Llama3-8b с разными базовыми (ViT, CLIP-ConvNeXT) и целевыми (depth, segmentation, generation) энкодерами. Доступны версии PT (Pre-Training) и IFT (Instruction Fine-Tuning). ▶️ Локальная установка и запуск web demo c GrarioUI:
# Clone repo
git clone https://github.com/SHI-Labs/OLA-VLM
cd OLA-VLM

# Create conda env
conda create -n ola_vlm -y
conda activate ola_vlm

# Install dependencies
pip install -e .["demo"]
pip install flash-attn --no-build-isolation
pip install scikit-learn icecream datasets pytorch-fid lpips opencv-python-headless
pip install setuptools==61.0.0
pip install huggingface_hub==0.24.7
pip install transformers==4.41.1

# Run webUI with one of models
CUDA_VISIBLE_DEVICES=0 python demo.py --model-path %path_to_model% --PT-model-path %path_to_model%
📌Лицензирование моделей: Apache 2.0 License. 🟡Страница проекта 🟡Набор моделей 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #MMLM #OLA-VLM

🖥 Воскресное чтиво: Краткая история Intel Intel, intel, intel… Это не просто текст на упаковке процессора – это целая эпоха
🖥 Воскресное чтиво: Краткая история Intel Intel, intel, intel… Это не просто текст на упаковке процессора – это целая эпоха в мире вычислительной техники. Intel, зародившийся в 1968 году, смог прийти от производителя полупроводников в бигтех компанию, основу современного IT-мира. В истории этой компании бывали взлеты и падения, плохие и хорошие времена, но одно можно сказать точно – без intel мы бы не смогли представить современный мир. Но читая последние новости, можно с уверенностью заявить – у Intel сейчас тяжелые времена. Финансовая катастрофа на одном фронте, “горячие” новинки с другого (топовые процессоры Intel i7 и i9 могут очень сильно перегреваться, а также некоторые имеют проблемы с микрокодом). Целый комплекс проблем, акции упали до рекордно низкого показателя – около 20-24 долларов за штуку. Также компания столкнулась с убытком в размере 1.61 миллиардов долларов. В этой статье я рассмотрю историю Intel, с небольших микропроцессоров, до целых линеек, таких как Pentium, Celeron, Dual Core, Xeon (храни его Си Цзиньпинь) и современные i-Core процессоры. А также затронем современные проблемы Intel и может ли она отдать позиции AMD. А также кратко рассмотрим как работает процессор, историю зарождения компьютеров и их архитектуру. Будет интересно. Все мы знаем Intel. Для одних многомиллиардная корпорация зла, для других компания, производящая лучшие в мире процессоры, третьи считают что AMD лучше, четвертые называют процессором весь блок компьютера. Эта компания буквально пропитана атмосферой кремниевой долины (причем даже буквально). Но intel далеко не с самого начала паяла процессоры, все начиналось намного прозаичнее. Но об этом мы поговорим немного позже. 📌 Читать статью

🔥 Полезный сайт, на котором собрано более двухсот различных материалов по машинному обучению! 🔗 Ссылка: *клик* @machinelear
🔥 Полезный сайт, на котором собрано более двухсот различных материалов по машинному обучению! 🔗 Ссылка: *клик* @machinelearning_interview

Repost from Machinelearning
📌Онлайн курс "Преобразование Фурье и его приложения" Преобразование Фурье – это математический метод, который широко применя
📌Онлайн курс "Преобразование Фурье и его приложения" Преобразование Фурье – это математический метод, который широко применяется в науке и технике для анализа сигналов. Этот метод основан на представлении сигнала в виде суммы синусоидальных и косинусоидальных функций разных частот. Анализ Фурье оказал значительное влияние на развитие математики, стимулируя развитие теории обобщенных функций. Применение преобразования Фурье основано на принципе линейности, который позволяет анализировать сложные сигналы путем разложения их на более простые составляющие. Курс «EE 261 Преобразование Фурье и его приложения», предлагаемый онлайн-платформой Stanford Engineering Everywhere Университета Стэнфорда, посвящен изучению преобразования Фурье и его практическому применению. Цель курса – научить студентов применять преобразование Фурье для решения практических задач в различных областях науки и техники. В рамках курса рассматриваются темы: 🟢Ряды Фурье; 🟢Основные свойства преобразования Фурье; 🟢Свертка; 🟢Обобщенные функции; 🟢Дискретизация; 🟢Линейные системы; 🟢Дискретное преобразование Фурье; 🟢Алгоритм быстрого преобразования Фурье; 🟢Двумерное преобразование Фурье. Курс состоит из 30 лекций, дополнительных материалов к ним и предназначен для студентов с разным уровнем подготовки, для тех, кто впервые знакомится с преобразованием Фурье, так и для тех, кто уже изучал его в других курсах. @ai_machinelearning_big_data #AI #ML #FourierTransform #Stanford #Course

⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь: МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data C++ t.me/cpluspluc Python: t.me/pro_python_code Linux: t.me/linuxacademiya Хакинг: t.me/linuxkalii Devops: t.me/DevOPSitsec АНАЛИЗ Данных: t.me/data_analysis_ml Javascript: t.me/javascriptv C#: t.me/csharp_ci Java: t.me/javatg Базы данных: t.me/sql_lib Python собеседования: t.me/python_job_interview Мобильная разработка: t.me/mobdevelop Docker: t.me/DevopsDocker Golang: t.me/Golang_google React: t.me/react_tg Rust: t.me/rust_code ИИ: t.me/vistehno PHP: t.me/phpshka Android: t.me/android_its Frontend: t.me/front Big Data: t.me/bigdatai Собеседования МЛ: t.me/machinelearning_interview МАТЕМАТИКА: t.me/data_math Kubernets: t.me/kubernetc Разработка игр: https://t.me/gamedev Haskell: t.me/haskell_tg 💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy 😆ИТ-Мемы: t.me/memes_prog 🇬🇧Английский: t.me/english_forprogrammers 🧠ИИ: t.me/vistehno 🎓954ГБ ОПЕНСОРС КУРСОВ: @courses 📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy

📚 Гарвардский университет совместно с Google готовят к выпуску базу данных, содержащую 1 миллион книг для обучения искусственного интеллекта. В эту базу включены книги различных жанров, языков и авторов, среди которых такие известные имена, как Диккенс, Данте и Шекспир. Эти произведения уже не охраняются авторскими правами ввиду их возраста. База создана на основе длительного проекта оцифровки книг Google Books, а сам Google будет участвовать в её дальнейшем распространении. Цель базы данных – обеспечить «равный доступ» ко всему массиву информации для всех желающих, будь то исследовательские лаборатории или стартапы в сфере ИИ, занимающиеся обучением языковых моделей. На данный момент база находится в процессе доработки и вскоре станет доступной для широкой аудитории. institutionaldatainitiative.org @machinelearning_interview

Repost from Machinelearning
🌟 MD4: Маскированная диффузия для дискретных данных. Маскированная (или абсорбирующая) диффузия - перспективный подход в ген
+2
🌟 MD4: Маскированная диффузия для дискретных данных. Маскированная (или абсорбирующая) диффузия - перспективный подход в генеративном моделировании дискретных данных, предлагающий альтернативу авторегрессионным моделям. MD4 (Masked Discrete Diffusion for Discrete Data) - метод, разработанный в Google DeepMind предлагает упрощенный и обобщенный подход к маскированной диффузии. Структура метода позволяет обучать обобщенные модели маскированной диффузии с гибкими схемами маскировки, зависящими от состояния данных. В основе MD4 лежит «маскирующий» процесс, превращающий исходные данные в состояние «маски» в случайный момент времени. Обращение этого процесса позволяет синтезировать новые данные, сохраняющие распределение обучающей выборки. Математически прямой процесс описывается как марковская последовательность дискретных случайных величин, индексируемых временным параметром от 0 до 1. MD4 продемонстрировал превосходство над диффузионными языковыми моделями по показателю перплексии на наборе данных OpenWebText и значительно обошел существующие дискретные диффузионные модели по качеству пиксельного моделирования изображений, достигая 2,75 бит на измерение для CIFAR-10 и 3,40 бит на измерение для ImageNet 64 × 64. Эти результаты выше, чем показатели авторегрессионных моделей сопоставимого размера (GPT-2, PixelRNN, Gated PixelCNN, PixelCNN++, PixelSNAIL, Image Transformer, Sparse Transformer). Несмотря на все преимущества метода, MD4 склонен к переобучению, что снижает его эффективность для задач с нулевой выборкой по сравнению с более простыми моделями. Прикладная реализация MD4 опубликована в репозитории Google Deepmind, в котором представлена возможность повторить экспериментальное обучение на тексте или изображениях. ⚠️ Batch size зависит от вычислительных ресурсов. Для обучения модели MD4-S с длиной последовательности 1024, 8 GPU A100 могут поддерживать максимальный batch size=128. При запуске на TPU, 8 чипов v5litepod, batch size=32. ▶️Локальная установка и пример обучения на тексте и изображениях:
# Create & activate env
python -m venv md4_venv
source md4_venv/bin/activate

# Install required packages
pip install -r requirements_gpu.txt

# Include a path dir in the Python path
export PYTHONPATH="$PYTHONPATH:~/path/to/md4"

# Prepare openwebtext for training
mkdir data_dir
python prepare_openwebtext_data.py

# Train a MD4-S model over text data
python md4/main.py --config=md4/configs/md4/openwebtext.py --sharded=false --workdir=./expt

# Train a MD4-S model over image data via cifar10
python md4/main.py --config=md4/configs/md4/cifar10.py --sharded=false --workdir=./expt
📌Лицензирование: Apache 2.0 License. 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #Diffusion #MD4 #GoogleDeepMind

🌟 Новые российские открытые модели: T-Lite с 7 млрд. параметров и T-Pro — с 32. Доступ к T-Pro и обновленной T-Lite от “Т-Те
+2
🌟 Новые российские открытые модели: T-Lite с 7 млрд. параметров и T-Pro — с 32. Доступ к T-Pro и обновленной T-Lite от “Т-Технологий (в составе Т-Банк) открыт для всех на платформе Hugging Face. Многочисленные индустриальные бенчмарки, в том числе ruMMLU, Ru Arena Hard, MT Bench и AlpacaEval, подтверждают статус лучших в мире открытых LLM на русском языке. По общему уровню знаний, умению вести диалог и справляться с практическими задачами T-Lite и T-Pro превосходят остальные российские и зарубежные модели. Также T-Pro и T-Lite обгоняют проприетарные модели OpenAI, Google и Anthropic. Увеличенное число параметров у T-Pro до 32 млр. параметров делает модель более мощной и производительной, а также позволяет ей учитывать больше контекста и особенностей языка, лучше запоминать информацию, делать более точные и сложные выводы ▶️Модели входят в семейство специализированных языковых моделей “Т-Технологий” – Gen-T, которые справляются с решением конкретных задач, что не может предложить, например, ChatGPT. ▶️При разработке моделей используются технологии продолженного предобучения (Continual Pretraining). Таким образом, уже обученную на больших объемах информации модель можно достаточно дообучить под конкретные задачи. @ai_machinelearning_big_data #AI #ML #LLM

🌟 Новые российские открытые модели: T-Lite с 7 млрд. параметров и T-Pro — с 32. Доступ к T-Pro и обновленной T-Lite от “Т-Те
+2
🌟 Новые российские открытые модели: T-Lite с 7 млрд. параметров и T-Pro — с 32. Доступ к T-Pro и обновленной T-Lite от “Т-Технологий (в составе Т-Банк) открыт для всех на платформе Hugging Face. Многочисленные индустриальные бенчмарки, в том числе ruMMLU, Ru Arena Hard, MT Bench и AlpacaEval, подтверждают статус лучших в мире открытых LLM на русском языке. По общему уровню знаний, умению вести диалог и справляться с практическими задачами T-Lite и T-Pro превосходят остальные российские и зарубежные модели. Также T-Pro и T-Lite обгоняют проприетарные модели OpenAI, Google и Anthropic. Увеличенное число параметров у T-Pro до 32 млр. параметров делает модель более мощной и производительной, а также позволяет ей учитывать больше контекста и особенностей языка, лучше запоминать информацию, делать более точные и сложные выводы ▶️Модели входят в семейство специализированных языковых моделей “Т-Технологий” – Gen-T, которые справляются с решением конкретных задач, что не может предложить, например, ChatGPT. ▶️При разработке моделей используются технологии продолженного предобучения (Continual Pretraining). Таким образом, уже обученную на больших объемах информации модель можно достаточно дообучить под конкретные задачи. @ai_machinelearning_big_data #AI #ML #LLM

Repost from Machinelearning
✔️ Проект vLLM присоединился к экосистеме PyTorch. vLLM, движок для запуска LLM, стал частью экосистемы PyTorch. vLLM обеспеч
✔️ Проект vLLM присоединился к экосистеме PyTorch. vLLM, движок для запуска LLM, стал частью экосистемы PyTorch. vLLM обеспечивает высокую пропускную способность и эффективное использование памяти при работе с моделями, содержащими сотни миллиардов параметров. vLLM поддерживает аппаратные платформы NVIDIA, AMD, Google Cloud TPU, Intel и AWS. Установить vLLM теперь можно простой командой: pip install vllm. pytorch.org ✔️ OpenAI запускает Canvas для совместной работы с ChatGPT. Canvas предоставляет возможность совместного редактирования текстов и кода в режиме реального времени. Новая функция позволяет пользователям добавлять текст, вносить изменения и давать обратную связь ChatGPT. Интеграция с Python позволяет запускать код непосредственно в Canvas и визуализировать результаты, включая графику. OpenAI также объявила о поддержке Canvas в пользовательских GPT, что позволит расширить их функциональность и адаптировать к конкретным задачам. openai.com ✔️ MIT разработал инструмент для отслеживания источников информации, используемых ИИ. Исследователи из МIT создали ContextCite – инструмент, который отслеживает источники информации, применяемые ИИ при создании текста. ContextCite позволяет пользователям проверять достоверность информации, предоставляемой ИИ, выделяя фрагменты текста, на которых основан ответ. В случае ошибки ContextCite помогает определить источник недостоверных данных и понять логику работы ИИ. Инструмент также способен выявлять «атаки отравления», когда злоумышленники пытаются исказить информацию, вводя ложные данные в источники, используемые ИИ. news.mit.edu ✔️ DIMON: Нейросетевой оператор для решения дифференциальных уравнений в частных производных на различных геометрических областях. Ученые из Университета Джонса Хопкинса разработали новый метод машинного обучения DIMON (Diffeomorphic Mapping Operator Learning), который способен эффективно обучаться и решать дифференциальные уравнения в частных производных (PDE) значительно быстрее, чем суперкомпьютеры. DIMON основан на использовании диффеоморфизмов для преобразования функций, заданных на различных областях, в единую эталонную область. Это позволяет обучить нейросетевой оператор, способный аппроксимировать решение PDE на любой области из семейства диффеоморфных областей. DIMON успешно протестирован на решении уравнения Лапласа и моделировании динамики реакции-диффузии. Он был использован для прогнозирования распространения электрического сигнала в левом желудочке сердца на основе данных 1006 пациентов. DIMON продемонстрировал высокую точность, сократив время прогнозирования с нескольких часов до менее чем одной секунды. nature.com ✔️ Reddit запускает инструмент поиска с ИИ. Инструмент автоматически генерирует ответы на запросы пользователей и предоставляет ссылки на релевантные источники информации. Ключевой особенностью Reddit Answers является использование данных, собранных непосредственно с платформы Reddit, что позволяет находить нужную информацию без обращения к внешним поисковым системам. В настоящее время доступ к Reddit Answers ограничен: им могут воспользоваться только пользователи из США через веб-интерфейс или приложение iOS и только на английском языке. В планах - расширить доступность сервиса для других языков и регионов. На данный момент Reddit Answers находится на стадии тестирования. redditinc.com ✔️ Swift Ventures создает новый индекс для оценки инвестиций в ИИ. Индекс использует систему оценки, основанную на анализе инвестиций в исследования ИИ, количество специалистов по ИИ в штате и доходы от операций, связанных с ИИ. Этот подход позволяет определить, какие компании действительно инвестируют в ИИ, а не просто используют модный термин. Анализ отслеживаемых 90 компаний показал, что только небольшая часть компаний, упомянувших ИИ в своих отчетах, вкладывает значительные средства в развитие этой технологии. venturebeat.com @ai_machinelearning_big_data #news #ai #ml

🔥 ds-cheatsheet — репозиторий на Github с огромным количеством всевозможных шпаргалок по Data Science! 🔐 Лицензия: MIT 🖥 Github @machinelearning_interview

Что ждёт Data Science и AI в 2025? Не стройте догадок. Выясните наверняка! Приходите на конференцию Будущее Data Science: тре
Что ждёт Data Science и AI в 2025? Не стройте догадок. Выясните наверняка! Приходите на конференцию Будущее Data Science: тренды 2025 - Узнайте о передовых технологиях: Zero-shot Anomaly Detection и мультимодальных моделях - Узнайте, как улучшить производительность продуктов и сократить затраты на разработку с помощью Generative AI и синтетических данных - Погрузитесь в практические подходы к работе с Generative AI, синтетическими данными и LVLM - Познакомьтесь с основными трендами в Data Science Будет интересно: опытным дата-сайентистам, менеджерам проектов, аналитикам, разработчикам, а также всем, кто только начинает путь в ML или задумывается о карьере в Data Science и анализе данных. Спикеры: - Мария Тихонова, руководитель направления R&D в SberDevices - Дмитрий Колесников, техлид команды компьютерного зрения - Андрей Коняев, инженер-исследователь в IT-Systems International Бонусы! Скидка 7% на любой курс OTUS и 5 классных гайдов 12 декабря, 19:00 МСК Записаться - https://otus.pw/5FoN/?erid=LjN8K2gmZ Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

🌟 AQLM․rs: сокращаем расходы на нейросети Исследователь Яндекса разработал сервис для запуска языковых моделей с 8 млрд пара
🌟 AQLM․rs: сокращаем расходы на нейросети Исследователь Яндекса разработал сервис для запуска языковых моделей с 8 млрд параметров на пользовательских девайсах. Автор написал инференс модели Llama 3.1 8B, работающий в браузере на WebAssembly без использования GPU. Для этого он применил технологию сжатия нейросетей AQLM, которую разработала команда Yandex Research вместе с университетами ISTA и KAUST. Для примера, скорость ответов нейросети на MacBook Pro M1 составила 1,5 токена в секунду или 3–4 символа. 🟡Статья 🖥Github @ai_machinelearning_big_data #AI #ML #LLM

📚Decisions&Dragons: полезный гайд по обучению с подкреплением В нем вы найдете вопросы и ответы по ключевым темам обучения с
📚Decisions&Dragons: полезный гайд по обучению с подкреплением В нем вы найдете вопросы и ответы по ключевым темам обучения с подкреплением. Внутри вы найдете: ▪️Что такое горизонт в обучении с подкреплением? ▪️Почему Q-learning не работает с непрерывными действиями? ▪️В чём разница между model-based и model-free обучением с подкреплением? 📌 Полный гайд

Погружаемся в ML вместе на Data Dojo! Собираемся уже 17 декабря, чтобы послушать три доклада от спикеров из разных сервисов Я
Погружаемся в ML вместе на Data Dojo! Собираемся уже 17 декабря, чтобы послушать три доклада от спикеров из разных сервисов Яндекса: 🔸 Илья Дьяков из команды Автономного транспорта разберёт задачку с Yandex ML Cup. Она связана с симуляторами, которые предсказывают дорожное движение и тестируют ML-модели до того, как они попадут в настоящие автомобили. 🔸 Артемий Вешкин из Яндекс Музыки тоже рассмотрит один из этапов Yandex ML Cup. И расскажет, как разработать решение, которое будет отличать кавер-версии от оригиналов песен. 🔸 Николай Карпачёв из команды Переводчика расскажет, как ребята поучаствовали в соревновании по качеству перевода на WMT24. В главном треке ребята попали в топ-5! 📅 Зарегистрироваться и узнать подробности можно тут. Ждём вас! Реклама. ООО "Яндекс", ИНН 7736207543.

⚡️ Google запустил бесплатный пятидневный курс по нейросетям (генеративному ИИ). Курс включает подкасты, текстовые материалы
⚡️ Google запустил бесплатный пятидневный курс по нейросетям (генеративному ИИ). Курс включает подкасты, текстовые материалы и практические задания, которые помогут разобраться в следующих темах: — Основах LLM: от трансформеров до методов тонкой настройки; — Внедрении и использовании векторных хранилищ/баз данных; — Создании и работе с ИИ-агентами; — Специализации LLM для конкретных областей знаний, таких как медицина; — MLOps для генеративного ИИ. 🔗 Курс

⚡️ Популярный мл-мем твит, который отражает несколько стереотипных проблем, с которыми могут сталкиваться разработчики машинн
⚡️ Популярный мл-мем твит, который отражает несколько стереотипных проблем, с которыми могут сталкиваться разработчики машинного обучения (ML). Вот разбор каждой из них: 1. Ожидания высокой зарплаты ($500K/год) – в реальности зарплата ML-инженера может сильно варьироваться в зависимости от региона, компании и опыта. Однако ожидания таких высоких зарплат без соответствующего уровня задач часто вызывают улыбку у опытных специалистов. 2. Задачи уровня FizzBuzz – это классическая задача для начинающих программистов, которая проверяет базовые навыки программирования. В контексте ML такие задачи выглядят несерьезными, так как требуют минимальных знаний. 3. Не знает, что такое GPU – графические процессоры (GPU) играют ключевую роль в обучении моделей глубокого обучения, поэтому отсутствие знания о них выглядит комично для специалиста по ML. 4. Использует только FastAPI – FastAPI является отличным фреймворком для создания API, но использовать его исключительно для всех проектов может ограничивать возможности разработчика. 5. Не знает, что такое Процессный параллелизм – параллельное программирование важно для эффективного использования вычислительных ресурсов, особенно в ML, где требуется обрабатывать большие объемы данных. 6. 5 разных версий Python вместо venv – использование виртуального окружения (venv) позволяет изолировать проекты друг от друга и управлять версиями библиотек. Наличие нескольких версий Python без использования venv может привести к хаосу в проектах. 7. Везде SQLite3 – SQLite – легкая база данных, подходящая для небольших приложений, но она не предназначена для работы с большими объемами данных, характерными для ML-проектов. 8. Пустой файл __init__.py – этот файл используется для обозначения директории как пакета в Python. Оставлять его пустым считается плохой практикой, так как он обычно содержит метаданные и настройки для пакета. Таким образом, твит высмеивает некоторые распространенные проблемы и стереотипы среди разработчиков машинного обучения, подчеркивая важность глубоких знаний и профессиональных подходов в этой области.