Machinelearning

前往频道在 Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

显示更多

网络:Machinelearning 俄罗斯1 272 技术与应用329...

📈 Telegram 频道 Machinelearning 的分析概览

频道 Machinelearning (@ai_machinelearning_big_data) 俄语语言赛道中的是活跃参与者。目前社区聚集了 296 342 名订阅者，在 技术与应用 类别中位列第 329，并在 俄罗斯 地区排名第 1 272 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 296 342 名订阅者。

根据 20 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -6 181，过去 24 小时变化为 -161，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 8.10%。内容发布后 24 小时内通常能获得 5.73% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 24 014 次浏览，首日通常累积 16 967 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 187。
主题关注点： 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

凭借高频更新（最新数据采集于 21 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

296 342

订阅者

-16124 小时

-1 4287 天

-6 18130 天

24 014

帖子浏览量

~ 16 96724 小时

~ 19 11248 小时

8.10%

参与率

~ 5

每日帖子数

Ads index

beta

帖子存档

296 290

✔️ Теперь Gemini 2.5 Pro теперь доступна бесплатно для всех пользователей с аккаунтом Google. Ранее доступ к ней был ограничен подписчиками Gemini Advanced с тарифом Google One AI Premium за $19,99 в месяц. Пользуемся: http://gemini.google.com #Gemini #google

296 290

⚡️ 10 open-source генераторов видео достойных вашего внимания (text-to-video и image-to-video) с лицензией, разрешающей коммерческое использование. Для каждого указано: описание, лучшая категория применения, бенчмарки, кейсы использования и ресурсы для запуска. 1) HunyuanVideo (text-to-video) Флагманская модель от Tencent (~13B параметров), обеспечивает высокое качество качество и реализм. Категория: подходит для генерации реалистичных видео ▪Ресурсы: 45–80 ГБ VRAM, A100/H100, поддержка FP8 🟡Ссылка 2) Mochi (text-to-video) Описание: модель от Genmo (~10B параметров), быстрая и мощная ▪Категория: реализм + плавность движения ▪Бенчмарки: качество почти на уровне Hunyuan, 30 FPS ▪Кейсы: реклама, креативы, short-видео ▪Ресурсы: Для работы модели требуется не менее 4 GPU H100., поддержка LoRA, FP8 🟡Ссылка 3) Wan2.1 (text/image-to-video) ▪Описание: универсальный генератор от Alibaba (до 14B параметров) ▪Категория: синтез движений, анимация изображения ▪Бенчмарки: высокая стабильность, особенно в SkyReels. ▪Кейсы: оживление изображений, видеопрототипы ▪Ресурсы: 12–24 ГБ VRAM (1.3B и 14B версии) 🟡Ссылка 4) LTX-Video ▪Описание: real time генератор от Lightricks (2B параметров).Нативная поддержка в ComfyUI ▪Категория: анимация, контроль keyframe ▪Бенчмарки: 24 FPS, 768p, хорошая стабильность при 2B ▪Кейсы: раскадровки, быстрые клипы ▪Ресурсы: от 12 ГБ VRAM (RTX 3060+), рекомендуется RTX 4090 🟡Ссылка 5) Pyramid Flow (text/image-to-video) ▪Описание: модель на базе Flux для генерации длинных видео (до 10 сек, 768p) ▪Категория: длительные сцены, плавные переходы ▪Бенчмарки: превосходство в motion stability ▪ Кейсы: нарративные ролики, контент для соцсетей ▪ Ресурсы: 12–48 ГБ VRAM 🟡Ссылка 6) CogVideo / CogVideoX (text-to-video) ▪Описание: трансформер на 9B/5B параметров от THU ▪Категория: стилизация, универсальность ▪ Бенчмарки: сильные CLIP/FVD, хорошая временная согласованность ▪ Кейсы: мультфильмы, обучающее видео, стилизованные ролики ▪Ресурсы: 20–24 ГБ VRAM, оптимизирован под FP8 🟡Ссылка 7) Step-Video-TI2V Модель для генерации видео (до 102 кадров), производительностью SOTA. Принимает на вход текстовые описания и изображения. ▪Бенчмарки: на VBench-I2V показывает лучшие результаты по сравнению с другими современными открытыми моделями для генерации видео из изображения и текста, а также лидирует в публичном рейтинге. 🟡Ссылка 8) AnimateDiff Ветеран этого списка. ▪Категория: анимация, стилизация ▪Бенчмарки: высокая согласованность между кадрами ▪Кейсы: оживление арта, анимированные сцены ▪Ресурсы: от 8 ГБ VRAM, масштабируется до 24 ГБ для высокого качества 🟡Ссылка 9) Easy Animate (image-to-video) ▪Описание: генерация видео из одного кадра (Alibaba, EasyAnimate V5) ▪Категория: анимация изображения ▪Бенчмарки: стабильная идентичность объекта, плавность ▪Кейсы: оживление фото, персонажей, иллюстраций ▪Ресурсы: минимум 12–24 gb CPU 🟡Ссылка 10)LTX-Video-Trainer Проект, предоставляющий инструменты и скрипты для обучения и дообучения модели LTX-Video от компании Lightricks. ▪Категория: с его помощью можно обучать адаптеры LoRA поверх LTX-Video, а также выполнять полное дообучение модели на ваших датасетах. ▪Ресурсы: не менее 12 ГБ GPU для эффективного обучения и дообучения модели. RaM: Минимум 16 ГБ; 🟡Ссылка - Open-Sora (и связанные проекты) ▪Описание: Это не одна конкретная модель, а скорее инициатива разработчиков (и несколько независимых проектов) по созданию и обучению open-source модели ▪Бенчмарки: Пока находятся в активной разработке. Сильная сторона - открытость и амбициозная цель. Результаты варьируются, но быстро улучшаются. ▪Ресурсы: Требования сильно зависят от конкретной реализации и этапа проекта. 📌 Подробное описание моделей Добавляйте в комментариях ссылки генераторы, которыми вы пользуетесь 👇 #ai #video #videogenerator #ml

296 290

🌟 TripoSG и TripoSF — это новые модели генеративного ИИ для создания высококачественных 3D-моделей. TripoSG 1.5B преобразует одиночные 2D-изображения (фото, эскизы, мультяшные картинки) в детализированные 3D-сетки (meshes). TripoSF - это продвинутый инструмент: он работает с более сложными топологиями, создает высокое разрешение (до 1024³) и может моделировать даже внутренние детали объектов, например, сложные механизмы. 😶Как работают эти модели? TripoSG использует rectified flow transformers (трансформеры с выпрямленным потоком). Это метод, который упрощает процесс генерации, соединяя данные и шум по прямой линии (в отличие от традиционных диффузионных моделей, где путь более сложный). Дифференцируемое представление данных, которое позволяет экономить память при работе с высоким разрешением . 😶Данные для обучения: Модель обучена на специально подготовленном наборе данных из 2 миллионов пар "изображение-SDF" (SDF — signed distance function, функция, описывающая расстояние до поверхности объекта). 😶Процесс работы: Вы загружаете одно изображение (например, фото статуи или рисунок персонажа). Модель анализирует его, используя вариационный автоэнкодер (VAE) с геометрическим надзором, и генерирует 3D-сетку с высокой детализацией. 😶Результат: На выходе получаем 3D-модель, которую можно использовать в играх, анимации или 3D-печати. TripoSF Модель может обрабатывать сложные топологии (например, открытые поверхности или внутренние структуры) и обучена с использованием вокселей, учитывающих перспективу (frustum-aware voxels). Tripo известны своим сотрудничеством со Stability AI. Ранее они выпустили TripoSR — модель для быстрой реконструкции 3D-объектов из одного изображения, которая тоже стала open-source. TripoSG и TripoSF — это более продвинутые версии, которые расширяют возможности 3D геенрацит: от простых объектов до сложных структур с высоким разрешением. 🟡Github 🟡Model 🟡Project 🟡Paper @ai_machinelearning_big_data #ai #3dgeneration #opensource #Tripo

296 290

✔️ Киностудии требуют доход с ИИ-трейлеров на YouTube вместо их блокировки. Warner Bros., Sony Pictures и Paramount меняют подход к защите контента: вместо удаления сгенерированных фейковых трейлеров на YouTube они настаивают на передаче им рекламных доходов. Например, Warner Bros. претендует на монетизацию роликов с использованием «Супермена», а Sony — трейлеров к «Человеку-пауку» и «Крейвену». Это стратегический шаг — студии видят в ИИ не только угрозу, но и источник прибыли, адаптируясь к цифровой реальности. Технологии генерации контента упростили создание фейков, но теперь авторы таких видео рискуют лишиться заработка. Вместо привычных копирайт-страйков правообладатели используют систему Content ID, автоматически перенаправляя деньги себе. Пока неясно, как эта ситуация повлияет на кузнецов контента — возможно, им придется искать новые платформы или договариваться со студиями. deadline.com ✔️ Manus AI выпустили приложение для iOS, перешли на Sonnet 3.7 и опубликовали тарифы. Manus AI анонсировала запуск мобильного приложения для iOS. Основной фишкой стал Sandbox с расширенным контекстом и мультимодальными функциями. Всю систему перевели на Claude 3.7 Sonnet, что повысило скорость и точность обработки задач. После закрытого бета-тестирования Manus AI открыл доступ всем пользователям, предложив 3 тарифа: Free дает 1000 кредитов, Starter за $39/мес. - 3900 кредитов и 2 параллельных процесса , Pro-версия ($199/мес) - 19 900 кредитов, 5 задач одновременно + доступ к бета-функциям. Manus AI в X (ex-Twitter) ✔️ ЕС инвестирует 1,3 млрд. евро в ИИ, кибербезопасность и цифровые навыки. Еврокомиссия планирует инвестировать 1,3 млрд. евро (1,4 млрд долларов) в ИИ, кибербезопасность и цифровые навыки в рамках программы "Цифровая Европа" в период с 2025 по 2027 год, говорится в заявлении, опубликованном в пятницу. "Обеспечение технологического суверенитета Европы начинается с инвестирования в передовые технологии и предоставления людям возможности повысить свою цифровую компетентность", - заявила руководитель отдела цифровых технологий Европейской комиссии Хенна Вирккунен. reuters.com ✔️ VBench-2.0: обновление бенчмарка генерации видео. Обновленный VBench-2.0 от NTU S-Lab и Shanghai AI Lab переводит оценку ИИ-видео с «красивой картинки» на уровень глубинного понимания физики, анатомии и логики. Система проверяет 18 параметров — от движения камеры до правдоподобности бытовых сцен. VBench-2.0 в открытом доступе — можно тестировать свои модели, сравнивать результаты и влиять на развитие экосистемы. github.com ✔️ Amazon Interests: гиперперсонализированный шопинг с ИИ. Новый сервис Interests от Amazon использует ИИ, чтобы превратить хобби пользователей в высокоточные рекомендации. Система анализирует естественные запросы вроде «инструменты для варки кофе» или «деревянные головоломки», преобразуя их в поисковые параметры. Под капотом, возможно, задействована масштабированная версия модели Nova series Reasoning — хотя компания пока не раскрывает детали. Интересы можно детализировать: указать бюджет, материалы или цвета, а алгоритм будут непрерывно предлагать новые товары. Планируется, что сервис интегрируют в Alexa+ — следующее поколение ассистента, которое будет подключать специализированные ИИ-модули. Пока функция доступна ограниченному кругу пользователей в США через мобильное приложение. Но если тесты пройдут успешно, Amazon масштабирует технологию, усиливая конкуренцию в сфере персонализированной коммерции. aboutamazon.com @ai_machinelearning_big_data #news #ai #ml

296 290

✔️ DeepSite на базе DeepSeek-V3-0324, позволяет вам генерировать собственные приложения или игры с ИИ в браузере и хостить их. Сгенерировал парочку простеньких игр на Go с интерфейсом, работает годно. 😶 По сути это Сursor в браузере. 🟡Попробовать: https://huggingface.co/spaces/enzostvs/deepsite @ai_machinelearning_big_data #deepseek #vibecoding #app

296 290

🌟 Magma – это фундаментальная модель от Microsoft, предназначенная для создания мульти-модальных AI-агентов, способных воспринимать окружение и действовать в цифровом и физическом мире. Эта модель объединяет данные из различных источников (изображения, видео, данные о робототехнических манипуляциях и тд) и позволяет решать сложные задачи, требующие одновременной обработки текстовой, визуальной и пространственной информации. Как работает Magma: 🟢 Используется единый визуальный энкодер, который преобразует изображения и видео в векторные представления, обеспечивая универсальное понимание визуальных данных. 🟢 Далее применяется техника Set-of-Mark (SoM) для маркировки ключевых объектов в изображениях (например, интерактивных кнопок или частей робота), что позволяет модели точно «привязывать» действия к нужным элементам сцены. 🟢Техника Trace-of-Mark (ToM) отвечает за планирование действий, анализируя динамику видеоданных и предсказывая последовательности будущих движений или изменений состояния объектов. 🟢Интеграция визуальной информации с текстовыми данными осуществляется через языковую модель, которая генерирует ответы в виде текста, пространственных координат или команд для выполнения конкретных задач. Для чего нужен: 🟢Magma обеспечивает мульти-модальное понимание данных, объединяя вербальный, пространственный и временной аспекты, что значительно расширяет возможности AI-агентов. 🟢 Применим в широком спектре задач – от навигации по пользовательским интерфейсам до управлени роботами и играми – благодаря способности адаптироваться к новым задачам без дообучения (zero-shot). 🟢Позволяет разрабатывать интеллектуальные системы, которые не просто анализируют данные, но и планируют и осуществляют последовательность действий, что особенно важно для робототехники и интерактивных приложений. 🟡Github 🟡Проект 🟡Статья 🟡HF 🟡Video @ai_machinelearning_big_data #AI #ML #LLM #opensource #agents #Microsoft

296 290

⚡️Гайд: Практическое применение алгоритмов ML Вы знаете, как компьютеры могут учиться на данных и делать точные прогнозы? Благодаря алгоритмам машинного обучения — набору методов, которые позволяют компьютерам учиться на данных и делать прогнозы без явного программирования. Подготовили для вас материал с обзором и примерами применения таких алгоритмов. Что вы получите от нашего материала? 🟠 16 алгоритмов с реальными примерами кода, такими как прогнозирование стоимости недвижимости, классификация электронных писем как спам или не-спам и многое другое; 🟠 Разберетесь в принципах работы алгоритмов и их практическом применении. Вы узнаете, как использовать их для автоматизации рутинных задач и улучшения процессов принятия решений; 🟠 Узнаете, как использовать эти алгоритмы для решения реальных задач в бизнесе, науке и других областях. Это может существенно повысить эффективность ваших проектов и дать вам конкурентное преимущество. 😶 Получить материал

296 290

🌟 II-Thought-RL-v0: датасет для RL. RL требует не только правильно настроенных алгоритмов, но и качественных данных. Многие существующие датасеты имеют проблемы в виде дублирования задач, низкого качества вопросов и недостаточную полноту охвата целевой специализации: в OpenR1 обнаружили 20 повторяющихся задач из Math-500, а General Reasoning содержит мусорные данные из-за обработке на краудсорсинге. Это мешает моделям учиться глубокому анализу, заставляя их «угадывать» ответы вместо логических рассуждений. Intelligent Internet представили II-Thought-RL-v0 — датасет из 340 тысяч задач, созданный для решения этих проблем. Его ключевые принципы: масштаб, качество и чистота данных. Каждый вопрос проходит многоступенчатую обработку: сначала удаляются дубликаты и загрязненные данные, затем Gemini 2.0 Flash и Qwen-2.5-32B фильтруют неоднозначные или некорректные задачи - отбраковываются вопросы с ошибками в формулировках, зависимостью от изображений или открытыми ответами. Особенность датасета — акцент на верификацию. Математические задачи проверяются через Math-Verify, код запускается в изолированном окружении Sandbox Fusion, а для медицинских вопросов используется LLM-судья. Это снижает риск «взлома наград», когда модель начинает идти кратчайшим путем, а не решать задачи, рассуждая. II-Thought-RL-v0 уже превзошел аналоги в тестах: модель с 1,5 млрд. параметров, обученная на этом датасете, обогнала DeepSeek-R1 на 3-5% в задачах AIME и LiveCodeBench. Пока остается нерешенным вопрос дисбаланса сфер в наборе: 70% данных относятся к математике и программированию, а медицина, финансы и инженерия почти не представлены. В будущем создатели датасета планируют расширить его, чтобы модели учились рассуждать в реальных мультидисциплинарных сценариях. 🟡Статья 🟡Модель 🟡Датасет 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #RL #Dataset

296 290

Капибарам нужна ваша помощь на T-CTF У них лапки, и они не могут защитить код от уязвимостей. Выручите их на ИТ-соревновании от Т-Банка с шансом выиграть приз до 420 000 ₽. Без навыков в ИТ тут не обойтись — задания рассчитаны на разработчиков, QA- и SRE-инженеров, аналитиков и других ИТ-специалистов уровня middle и senior. Вот что вас ждет: — Выберите Лигу Разработки или Лигу Безопасности по своим скиллам. Если участвуете впервые, можно потренироваться на демозаданиях. — Соревнуйтесь один или в команде до 3 человек. Организаторы помогут найти команду, если нет своей. — Подключайтесь онлайн или приходите офлайн — в ИТ-хаб Т-Банка в одном из 6 городов России. — Решайте задания по спортивному хакингу — для этого у вас будет 36 часов. Соревнование пройдет 19 и 20 апреля. Попробуйте свои силы — успейте зарегистрироваться до 18 апреля. Реклама. АО «ТБанк», лицензия ЦБ РФ № 2673, erid:2RanymxoPwF

296 290

✔️ R²D²: набор решений для робототехники от NVIDIA. NVIDIA Research предлагает 4 решения: MobilityGen генерирует синтетические данные в Isaac Sim, экономя время на сбор реальных данных, COMPASS создаёт универсальные алгоритмы передвижения для роботов любого типа — от двуногих до колесных, обеспечивая мгновенное внедрение из симуляции в реальность. Для гуманоидов важен контроль всего тела: HOVER объединяет управление балансом, движением и манипуляциями в единую нейросеть, а ReMEmbR добавляет «память» — робот анализирует окружение с помощью ИИ-моделей (LLM, VLM) и действует на основе контекста. Уже сейчас эти решения тестируют компании Under Control Robotics и Advantech: роботы собирают данные, перемещают грузы и избегают препятствий в динамичных условиях. Для разработчиков доступны исходники на GitHub и набор учебных материалов. developer.nvidia.com ✔️ Google анонсировала ИИ-инструменты для планирования путешествий. Google тизернула набор функций с ИИ для организации летних поездок. В Поиске теперь доступны AI Overviews — сводки, которые генерируют маршруты по запросам вроде «создать план поездки в Коста-Рику с акцентом на природу». В Gemini появился инструмент, позволяющий настраивать «экспертов» под конкретные задачи — например, для подбора направлений или списка вещей в дорогу. Отдельное внимание уделили отслеживанию цен: теперь, кроме авиабилетов, система уведомит о снижении стоимости отелей через email. Обновление коснулось и Google Maps: приложение научилось анализировать скриншоты с сохраненными локациями. Достаточно открыть доступ к фото — и ИИ автоматически распознает места, предложив добавить их в список. Пока функция доступна в США на iOS, версия для Android ожидается в ближайшее время. techcrunch.com ✔️ Garmin запустил платный сервис с ИИ-аналитикой. Garmin открыла платную подписку Connect+ за $7 в месяц, предлагающую ИИ-функции для анализа тренировок - персонализированные рекомендации, дашборд эффективности и советы для бегунов и велосипедистов. Сервис использует историю активности, чтобы оптимизировать прогресс и уведомления LiveTrack для безопасности. В отличие от Strava (от $12/месяц), Garmin сохраняет доступную цену, делая AI-инструменты привлекательнее для любителей и профи. Хотя часть пользователей критикует переход на монетизацию, 30-дневный тест-период позволяет оценить новинку. gizmodo.com ✔️ Vamba: новая архитектура для анализ длинных видео. Vamba — гибридная архитектура на основе Mamba и Transformer для обработки длинных видео. Она позволяет анализировать до 100 тыс. видеотокенов без сжатия, сохраняя ключевые сцены и действия. За счёт замены части операций на модули Mamba-2, сложность вычислений снижается с квадратичной до линейной, что ускоряет обучение в 2 раза и сокращает потребление памяти на 50%. В тестах На LVBench Vamba обошла конкурентов по точности (плюс 4,3%) и по стабильности обработки: даже при 512 кадрах потребление памяти не превышала 12 ГБ. Дополнительные тесты на датасетах с шумом и динамичными сценами доказали, что архитектура сохраняет детализацию без «провалов» в сложных условиях. Модель уже доступна в открытом доступе — код, веса. tiger-ai-lab.github.io ✔️ Apple обновила Final Cut: поддержка Apple Intelligence и новые инструменты. Apple выпустила обновления для Final Cut Pro на Mac, iPad и приложения Final Cut Camera. Главным новшеством стала интеграция Apple Intelligence: теперь в Image Playground можно быстро генерировать стилизованные изображения на основе описаний или фото из библиотеки. Для Mac добавлены коррекция цвета, аудиоэффект Quantec QRS и улучшенный Magnetic Mask. На iPad появилась портретная ориентация и хоткеи для монтажа. Final Cut Camera обзавелась переключением на 48-мм телеобъектив (для iPhone 14 Pro и новее), поддержкой Apple Log LUT и записью в Spatial Audio (требуется iPhone 16). Технические требования: macOS 15.2 и новее для Mac на M1+, iOS 18.2 для устройств с A17 Pro/M1. 9to5mac.com @ai_machinelearning_big_data #news #ai #ml

296 290

✔️ Новое исследование Anthropic: Отслеживание размышлений большой языковой модели. Исследователи практически под «микроскопом», исследуют, что происходит внутри ИИ моделей, и используют его для понимания внутренних механизмов Клода (часто сложных и удивительных). Модели ИИ обучаются, а не программируются напрямую, поэтому мы не понимаем, как они делают большинство вещей, которые они делают. Новые методы интерпретации позволяют Anthropic проследить этапы «мышления» LLM. Авторы описывают десять тематических исследований, каждое из которых иллюстрирует один из аспектов «биологии ИИ». https://transformer-circuits.pub/2025/attribution-graphs/biology.html

296 290

🔥 МТС приглашает на хакатон МТС True Tech Hack 2025 Задача — разработать решение на базе одной из ИТ-платформ компании. Каждая команда может выбрать один из пяти треков в зависимости от своих скилов: 🟡DataOps Pipeline: оптимизация процессов сбора данных и создания аналитических отчетов. 🟡AI Schema Builder: автоматизация создания JSON-схем для бизнес-логики и интеграций. 🟡True Tabs: интеграция данных и процессов в единую экосистему. 🟡TouchVision: AI-ассистент для незрячих и слабовидящих пользователей. 🟡Золотая середина: создание компактной модели «ученик» для быстрой классификации текста. Для участия нужно собрать команду от 2 до 5 человек. Регистрироваться можно как с готовой командой, так и самостоятельно, чтобы найти единомышленников уже на платформе. Общий призовой фонд составляет 1,5 миллиона рублей. @ai_machinelearning_big_dataне

296 290

🌐 Nanobrowser – Мультиагентная AI-ситсема для веб-автоматизации. Это open-source инструмент, который использует LLM для автоматизации работы у вас в браузере. По сути это альтернатива OpenAI Operator, работающая локально. Оператору можно задавать промпты на естественном языке (или через код), а умные агенты (Планировщик, Навигатор, Валидатор) выполняют их в веб-окружении. Чем полезен ? 🟢 Автоматизация тестирования UI: Быстро просит пользовательские сценарии, заполнение форм, клики по элементам без написания сложного Selenium/Puppeteer кода. 🟢 Прототипирование веб-скрапинга/сбора данных: Легко настраивайте сбор нужной информации с веб-страниц. 🟢 Ускорение рутинных задач: Автоматизируйте взаимодействие с внутренними админками, дашбордами или любыми веб-интерфейсами. Главное, что ваши данные не уходят на сторонние серверы (если вы используете локальную LLM). Поддерживает различные большие языковые модели, не привязывая вас к одному провайдеру. 🔗GitHub: https://github.com/nanobrowser/nanobrowser @ai_machinelearning_big_data #Nanobrowser #AI #WebAutomation #OpenSource #LLM

296 290

Всем привет! Мы собираем команду для запуска AI-экспериментов в Екоме и Райдтехе Яндекса. Наша цель — создать пространство для инженеров и продактов, которые хотят запускать эксперименты и видеть быстрые бизнес-результаты. Откликайтесь, если вы хотите реализовать свои идеи в крупном бизнесе, и у вас есть успешный опыт в запуске проектов с искусственным интеллектом! Рассмотрим ваши идеи и найдем им лучшее применение в проектах. Присоединяйтесь к нам, чтобы вместе создавать будущее! 💡✨ Для отклика пишите Эльмире: @mirafedya

296 290

🌟 А вот еще ответочка для Миядзаки. Что было бы, если студия Ghibli сняла «Властелина колец»? Бюджет в 250 долларов на Kling Клинга и 9 часов на монтаж трейлера «Братства Кольца», чтобы воплотить эту идею в жизнь. - Сначала автор сделал скриншоты всех 102 кадров трейлера (смотри 2 видео со сравнением оригинала и генерации) - Затем ремикс на них в стиле Ghibli в Sora - Далее анимация в Kling и Luma - Повторный монтаж синхронизирован с трейлером. А вот промпт, который использовал автор:

"Recreate this in the style of Studio Ghibli, intricately detailed. Make sure the composition, colors and vibe is similar. The scene pictured shows black cloaked figures on black horses riding away from a massive wave of water on a riverbed that is chasing the riders."

🔗 Полный процес создания описан здесь. @ai_machinelearning_big_data #sora #kling #Luma

296 290

✔️ Microsoft приостанавливает проекты создания ЦОД в США и Европе. Microsoft решила поставить на паузу новые проекты по строительству ЦОД в США и Европе суммарной мощностью около 2 гигаватт электроэнергии. Это решение объясняется опасениями по поводу переизбытка инфраструктуры ИИ и стратегическим изменением отношений Microsoft с OpenAI. bloomberglinea.com ✔️ Siemens приобрел Altair для создания наиболее полного портфеля промышленного ПО с ИИ. Siemens завершил сделку по поглощению Altair Engineering за $10 млрд, усилив свои позиции в ИИ и промышленной симуляции. Технологии Altair в области электромагнитного моделирования, анализа данных и высокопроизводительных вычислений интегрируют в платформу Xcelerator — это сделает цифровые двойники ещё точнее, а симуляции доступнее даже для небольших компаний. «С Altair мы создаём самый продвинутый AI-инструментарий для инженеров», — отметил CEO Siemens Роланд Буш. Теперь клиенты смогут оптимизировать HPC-процессы, разрабатывать ИИ-решения и ускорять вывод продуктов на рынок. Сделка также увеличит долю цифровых доходов Siemens в рамках программы ONE Tech Company. newsroom.sw.siemens.com ✔️ Исследование: 41% работников поколения Z саботируют стратегию работодателя в области ИИ. Основные причины — страх автоматизации, недоверие к этичности алгоритмов и низкое качество корпоративных инструментов. Исследование выявило разрыв между руководством и рядовыми работниками: 49% сотрудников осваивают ИИ самостоятельно, а 35% самостоятельно покупают сторонние сервисы, рискуя безопасностью корпоративных данных. Кевин Чанг, стратег Writer, предполагает, что успех внедрения ИИ зависит от прозрачности, обучения и вовлечения «чемпионов ИИ» — энтузиастов, которые мотивируют коллег. «Без людей даже лучшие технологии провалятся», — резюмирует Кевин. forbes.com ✔️ Kling обновила Elements. Kling AI, проект китайской компании Kwai обновила свой онлайн-сервис Elements, который генерирует видео по нескольким исходным изображениям. Обновление принесло более быструю генерацию, улучшенное семантическое понимание промпта и качество выходного видео. Добавлена новая функция "Endframes" + Extend" которая позволяет создавать расширение видео через ключевые кадры. KlingAI в X (ex-Twitter) ✔️ Groq и PlayAI запустили голосовой ИИ с адаптивным контекстом. Groq и PlayAI объединили усилия, чтобы представить Dialog — текстово-речевую модель, которая генерирует речь почти неотличимую от человеческой. Система работает на платформе GroqCloud, обеспечивая скорость до 140 символов в секунду благодаря LPU-чипам, что в разы быстрее GPU. Ключевая фишка проекта — механизм адаптивного контекста: ИИ анализирует историю диалога, подстраивая интонацию и эмоции под разговор. Dialog поддерживает английский и арабский, став первым решением для Ближнего Востока. В тестах Podonos модель обошла ElevenLabs по скорости и естественности. venturebeat.com @ai_machinelearning_big_data #news #ai #ml

296 290

☠️ Основатель студии Ghibli Хаяо Миядзаки назвал «ужасным оскорблением жизни», когда в 2016 году группа из трех разработчиков искусственного интеллекта показала ему демоверсию инструмента искусственного интеллекта (RL Gym от OpenAI) для создания: «машины, которая рисует аниме так же, как это делают люди». Где бы сейчас ни были эти разработки , ваше время пришло, а противники прогресса найдутся всегда 😂

296 290

🔥 В chat.qwenlm.ai chat теперь доступны голосовой режим + режим видеочата Более того китайцы выложили код своей Qwen2.5-Omni-7B - единой omni-модели, которая может понимать текст, аудио, изображение и видео. Они разработали архитектуру "thinker-talker", которая обеспечивает одновременное размышление модели и ее разговор . Вскоре обещают выпустить в опенсорс модели на еще большее количество параметров. Просто топ! 🟢Попробовать: https://chat.qwenlm.ai 🟢Paper: https://github.com/QwenLM/Qwen2.5-Omni/blob/main/assets/Qwen2.5_Omni.pdf 🟢Blog: https://qwenlm.github.io/blog/qwen2.5-omni 🟢GitHub: https://github.com/QwenLM/Qwen2.5-Omni 🟢Hugging Face: https://huggingface.co/Qwen/Qwen2.5-Omni-7B 🟢ModelScope: https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B @ai_machinelearning_big_data #qwen #release #Omni

296 290

🤖 Bambot — это доступный гуманоидный робот с открытым ПО, которого вы можете собрать самостоятельно. Робот обойдется вам примерно в 300 долларов Проект вдохновлён подобными опенсорсными роботами, такими как lerobot, , so-100 и lekiwi. Основная цель — демократизация технологий, обеспечивая доступ к робототехнике для более широкой аудитории. А здесь вы найдете список комплектующий, со ссылками на Ali. Здесь описано ПО для робота. 🟢github 🟢hardware 🟢software @ai_machinelearning_big_data #robots #ai #ml #opensource

296 290

Если мечтаете о карьере в аналитике или машинном обучении, начните с двух бесплатных онлайн-курсов от VK Education. — «Введение в анализ данных»: вы разберётесь в основах статистики и анализа данных, научитесь проводить статистические тесты и интерпретировать результаты. — «Математика для машинного обучения» подготовит вас к работе с алгоритмами ML: изучите линейную алгебру, теорию вероятностей и научитесь анализировать сложные зависимости. Учитесь в удобном темпе, совмещая лекции от экспертов VK с учёбой в вузе или работой. Всё, что нужно для старта в IT, — уже в доступе!