en
Feedback
Анализ данных (Data analysis)

Анализ данных (Data analysis)

Open in Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Show more

📈 Analytical overview of Telegram channel Анализ данных (Data analysis)

Channel Анализ данных (Data analysis) (@data_analysis_ml) in the Russian language segment is an active participant. Currently, the community unites 50 165 subscribers, ranking 2 677 in the Technologies & Applications category and 12 565 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 50 165 subscribers.

According to the latest data from 14 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -30 over the last 30 days and by 4 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 8.79%. Within the first 24 hours after publication, content typically collects 6.04% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 4 408 views. Within the first day, a publication typically gains 3 027 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 30.
  • Thematic interests: Content is focused on key topics such as llm, контекст, openai, архитектура, deepseek.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Thanks to the high frequency of updates (latest data received on 15 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

50 165
Subscribers
+424 hours
-527 days
-3030 days
Posts Archive
🖥 Manim — это мощная библиотека на Python для создания анимаций математических и научных концепций! 💡 Она позволяет визуали
🖥 Manim — это мощная библиотека на Python для создания анимаций математических и научных концепций! 💡 Она позволяет визуализировать сложные идеи с высокой точностью и гибкостью, используя код для определения сцен, объектов и их взаимодействия. Manim широко используется в образовательных целях и для создания объясняющих видео. Библиотека поддерживает анимацию графиков, формул, геометрических фигур и других визуальных элементов. 🔐 Лицензия: MIT 🖥 Github @pythonl

🧠 FlexAttention — простой способ писать любое внимание на PyTorch Зачем городить сложные CUDA-ядра, если можно использовать понятный и мощный абстрактный подход? FlexAttention — это новая модель программирования, которая позволяет реализовать большинство вариантов attention (внимания) всего в *нескольких строках кода на PyTorch*. ⚙️ Работает на базе компилятора — автоматически оптимизирует вычисления 🚀 Производительность на уровне кастомных ядер (hand-written kernels) 📌 Что даёт FlexAttention: • Унифицированный способ писать self-, cross-, local-, sparse-attention • Без кастомных CUDA/CPP — всё на чистом PyTorch • Гибкость и читаемость для исследований и прототипов 🎥 Смотреть

💥 Очередной удар по Microsoft: OpenAI переходит на TPU от Google вместо Nvidia-серверов Microsoft По информации инсайдеров,
💥 Очередной удар по Microsoft: OpenAI переходит на TPU от Google вместо Nvidia-серверов Microsoft По информации инсайдеров, OpenAI впервые серьёзно полагается на TPU-чипы Google, а не на Nvidia-инфраструктуру от Microsoft. 🔻 Что это значит: • Эксклюзивность Microsoft как партнёра OpenAI — под угрозой • Microsoft отстаёт с выпуском собственных AI-чипов • Google отвоёвывает ключевую часть ИИ-инфраструктуры будущего ⚠️ Когда даже OpenAI ищет альтернативу своему главному инвестору, вопрос не только в «железе». Это битва за контроль над вычислительными платформами, от которых будет зависеть весь рынок ИИ. ⚙️ TPU от Google — не только альтернатива Nvidia, а ещё и рычаг влияния в AI-гонке. @data_analysis_ml

Repost from Machinelearning
✔️Qwen VLo — новый мультимодальный ИИ от Alibaba, который заточен на понимание и генерацию изображений 📌Как работает: Модель поэтапно строит изображение слева направо и сверху вниз, уточняя детали на каждом шаге. Это делает итоговую картинку качественной, естественной и согласованной. Например, можно написать запрос: «Сделай картинку милого кота» — и она появится. А можно загрузить фото кота и попросить: «Добавь коту шапку» — и модель отредактирует изображение. 🎯 Что умеет Qwen VLo:Точная генерация: не путает объекты, сохраняет структуру, меняет, например, цвет машины на фото без искажений • Редактирование по команде: «Сделай фото в стиле Ван Гога» или «добавь солнечное небо» — всё выполняется по инструкции • Глубокое понимание: может обрабатывать сложные задачи — выделение объектов, сегментация, редактирование текста и фона • Мультиязычность: понимает запросы на английском, китайском и других языках — просто опишите, что нужно 🧪 Сейчас Qwen VLo доступна в виде превью через Qwen Chat. 👉 Попробовать: https://chat.qwen.ai 👉 Детали: https://qwenlm.github.io/blog/qwen-vlo/ @ai_machinelearning_big_data #Qwen #Alibaba #ai #genai #ml

🖥 Создание Telegram‑бота‑репетитора на Python для подготовки к сертификациям 🎓 В этом гайде мы создадим Telegram-бота-репет
🖥 Создание Telegram‑бота‑репетитора на Python для подготовки к сертификациям 🎓 В этом гайде мы создадим Telegram-бота-репетитора на Python, который проводит адаптивные мини-экзамены по темам Python, Data Science, AI и ML. Бот сохраняет результаты в SQLite и даёт рекомендации по обучению. Развернём его в облаке immers.cloud сервисе с GPU-серверами для задач от 3D и гейминга до машинного обучения и генерации контента. Почему мы выбрали immers.cloud: - Быстрый старт: нужный сервер поднимается за пару минут. - Посекундная тарификация — платишь только за время работы сервера - Большой ассортимент GPU: 11 моделей NVIDIA RTX и Tesla, включая высокопроизводительные модели, H100 (мой фаворит) и A100 с 80 ГБ видеопамяти с поддержкой GPUDirect и NVLink технологий. - Образы с предустановленным окружением для ML задач, чтобы не тратить время на настройку. - Поддержка 24/7 и стабильная производительность 🔍 Что делает бот: - Проводит адаптивные мини‑экзамены по темам: Python, Data Science, AI, ML. - Подстраивает уровень сложности вопросов под уровень пользователя. - Сохраняет и анализирует результаты обучения. 🛠️ Технологии и подход: - Написано на Python с использованием библиотеки для Telegram‑ботов. - Используется БД для хранения прогресса и статистики. - Простой архитектурный шаблон: команда → вопрос → ответ → оценка. 🚀 Цели проекта: - Практическая подготовка к IT‑сертификациям. - Обратная связь и отслеживание прогресса. - Возможность добавить новые темы и адаптивную логику. 📌 Кому будет полезен: - Тем, кто готовится к сертификациям (например, Python, ML). - Тем, кто хочет автоматизировать обучение через чат. - Программистам, желающим усилить навыки работы с Telegram‑ботами. 📌 Подробнее

🧠 FLUX.1 Kontext-Dev: текстовое редактирование изображений на новом уровне Проект [FLUX.1 Kontext-Dev](https://huggingface.c
🧠 FLUX.1 Kontext-Dev: текстовое редактирование изображений на новом уровне Проект [FLUX.1 Kontext-Dev](https://huggingface.co/spaces/black-forest-labs/FLUX.1-Kontext-Dev) от Black Forest Labs — это экспериментальная AI-модель, которая позволяет редактировать изображения по текстовой инструкции, сохраняя структуру, стиль и контекст. Всё работает прямо в браузере или локально через Diffusers. 📦 Что умеет FLUX.1 Kontext: • 🎨 Менять фон, стиль, объекты на изображении по описанию • 🔁 Поддерживать итеративные изменения — можно вносить правки шаг за шагом • 🧍‍♂️ Сохранять форму и позу персонажей даже после множественных трансформаций • ⚡️ Работает на основе rectified flow transformers и guidance distillation — быстрее и компактнее аналогов 🛠 Как пользоваться: 1. Открыть демо: [huggingface.co/spaces/black-forest-labs/FLUX.1-Kontext-Dev](https://huggingface.co/spaces/black-forest-labs/FLUX.1-Kontext-Dev) 2. Загрузить своё изображение 3. Ввести текстовую инструкцию, например: make it sunset, add snow, make character look older 4. Получить новое изображение — и при необходимости продолжить редактирование 🔌 Интеграции: • Поддержка Diffusers, ComfyUI, API через bfl.ai и Replicate • Модель доступна под некоммерческой лицензией • Подходит для локального запуска на GPU (`torch_dtype=torch.bfloat16`) 🎯 Кому это полезно: • Дизайнерам и художникам — быстрый визуальный прототипинг • AI-разработчикам — для создания RAG-интерфейсов с визуальной обратной связью • Исследователям — для тестирования новых подходов к in-context image editing 🚨 Про безопасность: Модель включает базовые фильтры генерации. Для продакшена рекомендованы расширенные фильтры (например, Hive) и собственные слои модерации. 📌 Вывод: FLUX.1 Kontext-Dev — это не просто генератор, а полноценный AI-инструмент для интерактивного и контролируемого редактирования изображений. Идеален для творческих задач, UX-прототипов и изучения мультимодальных AI-сценариев. #ai #diffusers #imageediting #flux1 #huggingface 📌Код 📌 Веса @data_analysis_ml

📱 Google представила Gemma 3n — открытую AI-модель нового поколения для edge-устройств 🆕 Gemma 3n — это свежая модель из се
📱 Google представила Gemma 3n — открытую AI-модель нового поколения для edge-устройств 🆕 Gemma 3n — это свежая модель из семейства Gemma, спроектированная специально для высокопроизводительного оффлайн-ИИ на телефонах, ноутбуках и планшетах. Поддерживает мультимодальность: изображение, аудио, видео и текст — прямо на устройстве. 🚀 Особенности: • Новая архитектура, заточенная под edge-девайсы • Работа без интернета и задержек • Полноценная мультимодальность • Реакции и вывод в реальном времени 📊 Вершина производительности: Версия Gemma 3n E4B стала первой моделью <10B параметров, набравшей 1300+ на LMArena — раньше такое было только у облачных гигантов. 💡 Для разработчиков: 📚 Гайд: https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide 🏆 Конкурс: https://kaggle.com/competitions/google- 🛠 Google запускает челлендж для создания приложений на основе Gemma 3n с фокусом на социальную пользу: здравоохранение, образование, устойчивое развитие, инклюзия и помощь в кризисах.

Repost from Machinelearning
📌 State of Foundation Models 2025 — краткое изложение отчёта Innovation Endeavors Венчурный фонд Innovation Endeavors, основ
📌 State of Foundation Models 2025 — краткое изложение отчёта Innovation Endeavors Венчурный фонд Innovation Endeavors, основанный бывшим CEO Google Эриком Шмидтом, выпустил 126-страничный обзор о состоянии и тенденциях фундаментальных ИИ-моделей в 2025 году. 🟢 2025 — год, когда генеративный ИИ стал по-настоящему массовым. Каждый восьмой работник на планете использует ИИ-инструменты хотя бы раз в месяц, а 90 % прироста аудитории произошло за последние полгода. Многие «ИИ-приложения» уже приносят индустрии миллиарды долларов в год, охватывая инженерию, дизайн, бухгалтерию, юриспруденцию и другие сферы. 🟠LLM уже обходят людей на сложных тестах. Современные языковые модели превосходят врачей по целому ряду диагностических задач и решают олимпиадную геометрию лучше, чем 99 % людей.
Самое неожиданное: если дать небольшой модели время подумать, то она может обойти гораздо более крупную – эксперименты показали, что 3B-модель с reasoning-механизмом обойдет 70B-модель.
🟠По всем техническим метрикам масштаб моделей растет экспоненциально. Производительность, интеллект и окна контекста увеличиваются более чем в 10× каждый год. Например, окна контекста выросли примерно с 8 тысяч до миллиона токенов, а стоимость генерации одного токена на крупных моделях упала почти в 1000 раз за пару лет. Средняя «длительность» задачи, которую модель может завершить сама, удваивается примерно каждые 7 месяцев. 🟠 Эксперты резюмируют: «умные модели сначала думают, потом говорят». Модели рассуждения, обученные через CoT, дают новый путь к масштабированию и требуют активного посттренинга (RL с reward-моделями). Возможно, скоро именно дообучение станет важнее предобучения. 🟠 Экономика фундаментальных моделей запутана. Крупнейшие игроки генерируют сотни миллионов выручки, но обучение топ-моделей дороже: LLaMA 4 ≳ $300 млн, GPT-4 ≈ $100 млн, а совокупные расходы OpenAI на обучение и данные достигают ~$3 млрд в год. Новая модель устаревает за три недели — конкуренция так высока, что open-source почти сравнялся с закрытыми платформами. 🟠Структура команд меняется под давлением ИИ. Выяснилось, что функции «узких» специалистов часто уходят к универсалам с ИИ-ассистентам, а профессии уровня "middle management" вымирают. 🟠 MCP становится стандартом интеграции. Model Context Protocol соединяет модели с почтой, дизайном, чатами и другими сервисами, а «клиентом» всё чаще выступает другой ИИ: крупные CRM и базы данных само-настраиваются через агентов. 🟠 Железо не отстаёт. В ИИ-облаках важнее продавать «сырые» GPU-часы, чем комплексное ПО; допвремя на GPU обычно выгоднее оптимизаций. NVIDIA остаётся безусловным лидером: отчёт Q1 зафиксировал 10× генерации токенов на инференсе за год. Появилась волна стартапов с трансформер-чипами — теперь переписывать ИИ-ПО под новое железо оправдано: вычислительные затраты многократно превышают зарплаты инженеров. 🟠 Капитал хлынул в ИИ. Доля венчура выросла с 10% в 2024 до 50+% в 2025. Компании вроде Anthropic показывают $2 млрд годового дохода с двукратным ростом, но их оценивают в 30 годовых выручек, что вызывает опасения перегрева. Некоторые стартапы привлекают инвестиции ещё на этапе идеи, без MVP, усиливая риски "пузыря". 🟠 Осторожнее с трендами: 75 % ИИ-фото-приложений потеряли основную выручку всего за полгода после пика, напоминая, что не каждое модное направление = устойчивый бизнес, тем более когда модели устаревают с космической скоростью. Полный отчёт Видео @ai_machinelearning_big_data #news #ai #ml

DeepSeek R2 задерживается из-за ограничений и проблем с качеством ● Запуск AI-модели R2 отложен из-за американских экспортных
DeepSeek R2 задерживается из-за ограничений и проблем с качеством ● Запуск AI-модели R2 отложен из-за американских экспортных контролей на чипы Nvidia H20 ● Чипы H20 были ключевыми для успеха предыдущей модели R1 в Китае; без них инфраструктура для R2 не готова ● CEO Лян Вэньфэн недоволен качеством текущей версии R2 и требует дополнительной доработки ● Облачные провайдеры опасаются, что спрос на H20 превысит доступные запасы ● Альтернативные чипы (например, Huawei) технически менее подходят для R2 @data_analysis_ml

🔥 Fireplexity — открытый аналог Perplexity Простой движок вопросов и ответов на базе ИИ. Работает через два основных эндпоинта: • /search — выполняет поиск по интернету • /scrape — извлекает текст со страниц Ответы ИИ формируются на основе найденной информации и включают ссылки на источники. Можно использовать как готовый сервис или собрать свою версию — код открыт. Подходит для интеграции в чат-ботов, ассистентов и внутренних инструментов. git clone https://github.com/mendableai/fireplexity.git cd fireplexity npm install 📌 Github @data_analysis_ml

✔️ Nano‑vLLM — реализация vLLM, написанная с нуля1 Это минималистичный, но быстрый движок для офлайн-инференса LLM. Отлично п
✔️ Nano‑vLLM — реализация vLLM, написанная с нуля1 Это минималистичный, но быстрый движок для офлайн-инференса LLM. Отлично подойдёт для локальных экспериментов и кастомных решений. 📌 Ключевые фичи: 🚀 Быстрый офлайн-инференс — почти как у vLLM 📖 Простой и читаемый код — всего ~1200 строк на Python ⚡ Оптимизации: prefix caching, Torch compilation, CUDA Graph и др. 📦 Установка: pip install git+https://github.com/GeeeekExplorer/nano-vllm.git 📌 Быстрый старт: Примеры использования — в example.py. API максимально похож на vLLM, за исключением метода LLM.generate. 📊 Бенчмарк (на RTX 4070 + модель Qwen3-0.6B): • Запросов: 256 • Вход: от 100 до 1024 токенов • Выход: от 100 до 1024 токенов Результаты: | Движок | Время (с) | Скорость (токенов/с) | |--------------|-----------|----------------------| | vLLM | 98.95 | 1353.86 | | **Nano-vLLM**| 101.90 | **1314.65** | 💡 Nano‑vLLM показывает почти ту же производительность, что и оригинал, но с компактным и понятным кодом. Идеален для изучения и локальных LLM-проектов. 📌 Github

🕹️ Вы можете читать новости о сфере и тестить сервисы для души, а можете перейти в аналитику данных и влиять на бизнес-результаты уже через полгода — со средним доходом 167 000+ рублей Карьерный трек займёт 6 месяцев: вы плавно погрузитесь в Excel, SQL, базовый Python, маркетинговую аналитику, Power BI и нейросети на курсе «Аналитик данных» от Академии Eduson. Получите полный скиллсет аналитика, а ещё: ✔ Опыт экспертов из «Сбера», «Работа.ру» и «Авито». Они запускали десятки проектов и знают, какие задачи вы будете решать в реальной работе. ✔ Много практики на бизнес-кейсах, тренажёрах и заданиях — научитесь мыслить как аналитик, а не делать по шаблонуа. ✔ Поддержку личного куратора целый год — никаких чатов на сотни учеников, только индивидуальный подход. ✔ Гибкий график обучения и вечный доступ к программе и обновлениям — сможете проходить курс в своём темпе. На выходе вы получите удостоверение о повышении квалификации и диплом Eduson, верифицированный «Сколково». Вместе с этими документами, портфолио и помощью карьерного центра Eduson шансы найти работу будут высоки. А если не получится, деньги за обучение вернут — это прописано в договоре. По промокоду DATA — скидка 65% + второй курс в подарок. Записывайтесь по ссылке Реклама. ООО "Эдюсон", ИНН 7729779476, erid: 2W5zFGoyEd6

🧬AlphaGenome от DeepMind — AI для глубокого понимания генома 🔬 Что это? Новая унифицированная модель , способная предсказыв
🧬AlphaGenome от DeepMind — AI для глубокого понимания генома 🔬 Что это? Новая унифицированная модель , способная предсказывать, как одиночные мутации в ДНК влияют на регуляцию генов и различные биомолекулярные процессы . Как работает: 1. Принимает на вход до 1 000 000 «букв» ДНК (base-pairs) и выдаёт тысячи предсказаний по разным свойствам: - Начало и конец генов в разных клетках - Уровень сплайсинга и экспрессии РНК - Доступность нуклеотидов и связывание с белками 2. Архитектура: - Свёрточные слои для поиска локальных паттернов - Трансформеры для обмена информацией по всей последовательности - Финальные слои для предсказаний по каждому «букве» Самое интересное: - **Длинный контекст *: анализ до 1 000 000 букв с точностью до одной позиции - Мультизадачность: единственная модель одновременно прогнозирует десятки регуляторных свойств (модальностей), от сплайсинга до хроматиновой доступности . - Быстрое оценивание вариантов: сравнивает «дикую» и мутантную последовательности и за секунду выдаёт полный отчёт по влиянию мутации . - Новые возможности в сплайсинге: впервые модель прямо предсказывает расположение и уровень сплайс-джанкшенов, что важно для редких генетических заболеваний . - Превосходство на бенчмарках: лидер по точности на 22 из 24 задач по предсказанию свойств и на 24 из 26 задач по эффектам вариаций . Для чего это нужно: • Ускорить исследование генетических причин болезней и найти новые терапевтические мишени • Помочь в дизайне синтетической ДНК для заданных функций • Глубже понять функции некодирующих участков генома Доступ: — Preview-версия API для некоммерческих исследований: https://github.com/deepmind/alphagenome-api — Полная модель будет опубликована позже.

3 июля в 18:00 МСК OTUS проводит открытый урок «Как правильно готовить данные для ML‑моделей?». ✔️ Мы разберём, почему чистый
3 июля в 18:00 МСК OTUS проводит открытый урок «Как правильно готовить данные для ML‑моделей?». ✔️ Мы разберём, почему чистый датасет решает половину задачи, покажем EDA‑приёмы и соберём полный pipeline предобработки на Python. Всё на живых примерах, которыми делятся практикующие ML‑инженеры. 📖 Участники поймут, как избежать «мусорных» ошибок, упростить обучение моделей и ускорить вывод решений в production. Спикер Мария Тихонова – PhD Computer Science, Senior Data Scientist и преподаватель одного из крупнейших университетов России. ➡️ Мероприятие проходит в преддверие старта курса «Специализация Machine Learning», участники получат скидку на обучение. Оставьте заявку прямо сейчас: https://tglink.io/b7e79dc13581?erid=2W5zFJuJnU8 #реклама О рекламодателе

🆕OpenAI готовит выпуск мощной open-source модели для локального запуска ● OpenAI планирует выпустить поразительно мощную open-source модель, которую можно будет запускать на собственном оборудовании ● По словам Сэма Альтмана, мы находимся в исключительном моменте: производительность новых моделей (например, o3) резко выросла, но продукты на их основе ещё не догнали ● Даже без дальнейшего роста возможностей моделей существует огромный «продуктовый профицит» — множество идей ждут воплощения ● Резонантные модели открыли новую клетку в «периодической таблице» AI, и разработчики только начинают её исследовать Обещанного 3 года ждут, как говорится

Поступи в магистратуру с грантом до 1,2 млн рублей Современная магистратура – это не пары для галочки, а возможность продвину
Поступи в магистратуру с грантом до 1,2 млн рублей Современная магистратура – это не пары для галочки, а возможность продвинуть карьеру и стать сильным специалистом. Центральный университет ведет набор на пять программ магистратуры по популярным ИТ-направлениям. Партнеры – ведущие компании на рынке РФ: ВТБ, Сбер, Т-Банк, Яндекс, Avito, Ozon, Х5 Tech и другие. 62% магистрантов ЦУ находят новую работу с ростом зарплаты в 1,6 раза уже на первом курсе. Средняя зарплата – 195 тысяч рублей. Обучение можно совмещать с работой, а поступить – уже с третьего курса. Стань частью новой волны специалистов и получи грант на обучение до 1,2 млн рублей. И подавай заявку на поступление уже сейчас. Реклама. АНО ВО "Центральный университет", ИНН 7743418023, erid:2RanykoZm7w

Repost from Machinelearning
✔️ Microsoft разработала компактную языковую модель Mu для Windows Settings. Microsoft представила мини-модель Mu с 330 млн. параметров для локальной работы на NPU в Windows Settings. На чипах Qualcomm модель показывает в 4,7 раза быстрее генерацию токенов, чем аналоги. Mu адаптировали под особенности NPU: настроили размеры слоев, применили квантование весов до 8-16 бит и уменьшили потребление памяти. Mu уже используется в агенте Settings, который преобразует запросы вроде «увеличь яркость» в системные команды. Модель обучали на 3,6 млн примеров, добавили синтетические данные и шум, чтобы повысить точность. Результат: ответы за 500 мс даже на сложных задачах. При этом Mu в 10 раз меньше Phi-3.5-mini, но сохраняет конкурентную производительность. blogs.windows.com ✔️ SYNTHETIC-2: децентрализированный проект генерации логических данных. Prime Intellect запустила SYNTHETIC-2, децентрализованную систему генерации для обучения ИИ. Проект позволяет любым GPU, от бытовых до промышленных, присоединиться к генерации данных. Управляет процессом TOPLOC v2, технология, которая проверяет корректность вычислений через хэширование активаций и распределяет награды за успешные результаты. Датасет включает более 20 задач: математика, генерация JSON и неформальные задания для разнообразия данных. Верификация работает через сравнение ответов разных моделей (Qwen3, DeepSeek и др.). Все данные доступны на HuggingFace. Присоединиться может любой желающий, арендовав ресурсы через Prime Intellect или подключив собственные GPU. Цель проекта - ускорить развитие открытой суперинтеллектуальной системы, где контроль распределен, а технологии общедоступны. primeintellect.ai ✔️ DIY-устройство для превращения снов в фильмы с помощью ИИ. «The Dream Recorder», открытый DIY-гаджет от компании Modem Works, превращающий воспоминания о снах в короткие фильмы с помощью ИИ. Устройство использует Raspberry Pi, микрофон и экран, а его стоимость сборки составляет около $310. После пробуждения пользователь рассказывает сон, который транскрибируется и отправляется в ChatGPT, а затем в Luma AI для генерации видео. Итоговый ролик сохраняется в цифровой дневник. Проект сочетает DIY-культуру и доступные технологии, демонстрируя, как ИИ может визуализировать субъективный опыт. Все схемы и исходники доступны на GitHub, включая 3D-модели для печати. Примерная стоимость записи одного сна составляет $0.15, что делает эксперименты с памятью и сознанием доступными. И это не прототип, а рабочее решение, которое можно собрать самостоятельно. dreamrecorder.ai ✔️ Мини-движок nano-vLLM. Исследователь Синькай Ю из DeepSeek разработал nano-vLLM, облегченный движок для работы с LLM. Он написан на Python вручную, объемом всего 1,2 тыс. строк кода, и воспроизводит основные функции оригинального vLLM. nano-vLLM поддерживает кэширование префиксов, тензорный параллелизм, компиляцию с torch.compile и CUDA Graphs. Это позволяет достичь скорости, близкой к vLLM, но без сложных алгоритмов планирования задач или динамического батчинга. Зато разработчики получают четкую архитектуру в одном месте: токенизатор, управление кэшем и механизм выборки токенов. Проект подойдет для исследований, обучения или небольших систем, где важна простота. github.com ✔️ OpenAI готовит ChatGPT к конкуренции с Google Workspace и Office 365. По данным источников, OpenAI разрабатывает продвинутые функции для ChatGPT, превращая его в платформу для командной работы. Пользователи смогут группировать чаты, загружать файлы, использовать голосовой ввод и сохранять контекст диалогов. Все это позиционируется как альтернатива офисным пакетам. Мобильное приложение получит поддержку загрузок и переключения моделей на лету. Этот проект, задуманный в 2024 году, активно развивается сейчас и OpenAI видит в ChatGPT «операционную систему для жизни», интегрируемую в рабочие процессы. Microsoft, поддерживающий стартап, теперь рискует стать конкурентом самому себе, а Google получает нового серьезного оппонента. theinformation.com @ai_machinelearning_big_data #news #ai #ml

✔️ Microsoft разработала компактную языковую модель Mu для Windows Settings. Microsoft представила мини-модель Mu с 330 млн. параметров для локальной работы на NPU в Windows Settings. На чипах Qualcomm модель показывает в 4,7 раза быстрее генерацию токенов, чем аналоги. Mu адаптировали под особенности NPU: настроили размеры слоев, применили квантование весов до 8-16 бит и уменьшили потребление памяти. Mu уже используется в агенте Settings, который преобразует запросы вроде «увеличь яркость» в системные команды. Модель обучали на 3,6 млн примеров, добавили синтетические данные и шум, чтобы повысить точность. Результат: ответы за 500 мс даже на сложных задачах. При этом Mu в 10 раз меньше Phi-3.5-mini, но сохраняет конкурентную производительность. blogs.windows.com ✔️ SYNTHETIC-2: децентрализированный проект генерации логических данных. Prime Intellect запустила SYNTHETIC-2, децентрализованную систему генерации для обучения ИИ. Проект позволяет любым GPU, от бытовых до промышленных, присоединиться к генерации данных. Управляет процессом TOPLOC v2, технология, которая проверяет корректность вычислений через хэширование активаций и распределяет награды за успешные результаты. Датасет включает более 20 задач: математика, генерация JSON и неформальные задания для разнообразия данных. Верификация работает через сравнение ответов разных моделей (Qwen3, DeepSeek и др.). Все данные доступны на HuggingFace. Присоединиться может любой желающий, арендовав ресурсы через Prime Intellect или подключив собственные GPU. Цель проекта - ускорить развитие открытой суперинтеллектуальной системы, где контроль распределен, а технологии общедоступны. primeintellect.ai ✔️ DIY-устройство для превращения снов в фильмы с помощью ИИ. «The Dream Recorder», открытый DIY-гаджет от компании Modem Works, превращающий воспоминания о снах в короткие фильмы с помощью ИИ. Устройство использует Raspberry Pi, микрофон и экран, а его стоимость сборки составляет около $310. После пробуждения пользователь рассказывает сон, который транскрибируется и отправляется в ChatGPT, а затем в Luma AI для генерации видео. Итоговый ролик сохраняется в цифровой дневник. Проект сочетает DIY-культуру и доступные технологии, демонстрируя, как ИИ может визуализировать субъективный опыт. Все схемы и исходники доступны на GitHub, включая 3D-модели для печати. Примерная стоимость записи одного сна составляет $0.15, что делает эксперименты с памятью и сознанием доступными. И это не прототип, а рабочее решение, которое можно собрать самостоятельно. dreamrecorder.ai ✔️ Мини-движок nano-vLLM. Исследователь Синькай Ю из DeepSeek разработал nano-vLLM, облегченный движок для работы с LLM. Он написан на Python вручную, объемом всего 1,2 тыс. строк кода, и воспроизводит основные функции оригинального vLLM. nano-vLLM поддерживает кэширование префиксов, тензорный параллелизм, компиляцию с torch.compile и CUDA Graphs. Это позволяет достичь скорости, близкой к vLLM, но без сложных алгоритмов планирования задач или динамического батчинга. Зато разработчики получают четкую архитектуру в одном месте: токенизатор, управление кэшем и механизм выборки токенов. Проект подойдет для исследований, обучения или небольших систем, где важна простота. github.com ✔️ OpenAI готовит ChatGPT к конкуренции с Google Workspace и Office 365. По данным источников, OpenAI разрабатывает продвинутые функции для ChatGPT, превращая его в платформу для командной работы. Пользователи смогут группировать чаты, загружать файлы, использовать голосовой ввод и сохранять контекст диалогов. Все это позиционируется как альтернатива офисным пакетам. Мобильное приложение получит поддержку загрузок и переключения моделей на лету. Этот проект, задуманный в 2024 году, активно развивается сейчас и OpenAI видит в ChatGPT «операционную систему для жизни», интегрируемую в рабочие процессы. Microsoft, поддерживающий стартап, теперь рискует стать конкурентом самому себе, а Google получает нового серьезного оппонента. theinformation.com @ai_machinelearning_big_data #news #ai #ml

⚡ OmniGen2 Что умеет: • Генерация и редактирование изображений по текстовому описанию • Поддержка разрешения до 1024×1024 • П
OmniGen2 Что умеет: • Генерация и редактирование изображений по текстовому описанию • Поддержка разрешения до 1024×1024 • Полностью open-source: модель, код и веса • Лицензия Apache 2.0 • Можно вызвать модель через MCP — просто запусти с .launch(mcp_server=True) 📌 Тестим здесь: https://huggingface.co/spaces/OmniGen2/OmniGen2 @data_analysis_ml

🆕 Новые подробности: суд опубликовал документы о совместной разработке OpenAI их ИИ-устройства Иск Google-backed стартапа iy
🆕 Новые подробности: суд опубликовал документы о совместной разработке OpenAI их ИИ-устройства Иск Google-backed стартапа iyO по товарному знаку раскрыл внутренние материалы OpenAI и io: ● За последний год OpenAI протестировали и проанализировали свыше 30 моделей наушников для изучения эргономики и технических возможностей ● VP продуктов OpenAI Питер Велиндер и CTO io Tang Tan лично испытывали прототипы, которые разработала компания,но они были нестабильны ● Сам Альтман подчеркнул, что устройство не будет ни внутриушным, ни обычным носимым гаджетом: готовая версия либо поместится в кармане или станет настольным аксессуаром ● Разрабатываются разные форм-факторы: стационарные и портативные, проводные и беспроводные решения ● К проекту подключились дизайнер Джони Айв и команда бывших инженеров Apple, работая вместе с OpenAI Официальный анонс и начало продаж ожидаются не ранее чем через год. ➡️ Читать #openai #news