cookie

Мы используем файлы cookie для улучшения сервиса. Нажав кнопку «Принять все», вы соглашаетесь с использованием cookies.

avatar

Апгрейд - IT канал

Канал о науке, технологиях и последних новостях из IT-индустрии. Сотрудничество - @GOSPODI_N

Больше
Рекламные посты
21 279
Подписчики
-15124 часа
-1 3067 дней
-37 57230 дней

Загрузка данных...

Прирост подписчиков

Загрузка данных...

Фото недоступноПоказать в Telegram
⏺ADMIN EURO 24 Всем привет, такой двойник на сегодня. https://t.me/apps244
Показать все...
Вы, наверное, слышали, что правительство США запретило NVIDIA поставлять в Китай видеокарты A100 и H100. Но Куртке рыночек-то терять не хочется. Поэтому он провернул такой финт ушами - сделал слегка урезанную версию A100 и H100, чтобы они не подпадали под экспортные регуляции, и продолжил загребать китайский кэш. То есть в Китай вместо H100 поставляют H800, что является урезанной версией оригинала, но с вдвое меньшей скоростью передачи данных между видеокартами (300 GBps в H800 против оригинальных 600 GBps в H100). Сам же чип остался таким же быстрым, как и оригинал, вот только имеет макс. VRAM 80 GB вместо 96. То есть гонять инференс на одной карте китайцы смогут так же быстро, а вот тренировать большие модели, которые требуют нескольких нод (а сейчас почти каждая модель такая), будет для них до 2 раз медленнее. С A100 была похожая история, тоже создали A800 для китайцев, но тогда не так сильно урезали скорость интерконнекта - только на 33% с 600 GBps до 400 GBps. Ставят палки в колеса поднебесной, чтобы вдруг не обогнали своими моделями 🛞. @ai_newz https://t.me/apps244
Показать все...
йджест за неделю (#25) Video - Общий доступ GEN-3, но дорого и как-то бесполезно. - Runway ту зе мун!!! после не слишком плохого релиза челики оценили себя в 4 ярда и хотят привлечь $450М. Поговаривают, они могут стать Midjourney в text2video (последние смогли отбиться от Dall-E). - Double the compute. Luma тоже не сидят на месте и удвоили свои мощности. Может, мой запрос недельной давности уже готов? О жизни и карьере - Днем бью по клавишам, а вечером по морде или как не сойти с ума на работе. - Как пробиться в AI? Мой гайд про карьерные траектории в AI или как стать топовым ресерч сайнтистом. - Цукерберг умеет флексить. А чем вы занимаетесь в пятницу вечером? Живые железяки - Нейролюбовница Character.AI или как вымрет человечество, чем грозит любовь к их чатам. - Архитектура CAI или как дешевле обрабатывать 20К запросов в секунду. - Автономные агенты выросли в майнкрафте. Большой пост про самостоятельных роботов и систему для их мышления OmniJARVIS. Боюсь, что будет, если совместить их с CharacterAI. Прочее - GPT4o дома be like. Французы заопенсорсили свою омнимодальную модель. - ЭйАй пузырь. Где деньги, Лебовски Альтман?! Где-то среди хайпа затерялись 600 миллиардов кассового разрыва, и их никак не могут найти. > Читать дайджестдайджес https://t.me/apps244
Показать все...
Встречайте Kolors — диффузионная модель для генерации изображений с упором на фотореализм Kolors — это большая диффузионная модель, опубликованная вчера командой Kuaishou Kolors. Kolors была обучена на миллиардах пар "текст-изображение" и показывает отличные результаты в генерации сложных фотореалистичных изображений. По результатам оценки 50 независимых экспертов, модель Kolors генерирует более реалистчиные и красивые изображения, чем Midjourney-v6, Stable Diffusion 3, DALL-E 3 и другие модели Страничка Kolors Попробовать GitHub @ai_machinelearning_big_data https://t.me/apps244
Показать все...
MInference 1.0 by Microsoft pre-release В преддверии предстоящей ICML 20 MInference 1.0 by Microsoft pre-release В преддверии предстоящей ICML 2024 (Вена, 21-27 июля 2024 г.) Microsoft опубликовала результаты исследования проекта MInference. Данный метод позволяет ускорить обработку длинных последовательностей за счет разреженных вычислений, применение уникальных шаблонов в матрицах. Методика MInference не требует изменений в настройках предварительного обучения. Проведенные исследователями Microsoft синтетические тесты метода на моделях LLaMA-3-1M, GLM4-1M, Yi-200K, Phi-3-128K и Qwen2-128K показывают сокращение задержек и ошибок при предварительном заполнении до 10 раз ai_machinelearning_big_data24 (Вена, 21-27 июля 2024 г.) Microsoft опубликовала результаты исследования проекта MInference. Данный метод позволяет  ускорить обработку длинных последовательностей за счет разреженных вычислений, применение уникальных шаблонов в матрицах. Методика MInference не требует изменений в настройках предварительного обучения. Проведенные исследователями Microsoft синтетические тесты метода на моделях LLaMA-3-1M, GLM4-1M, Yi-200K, Phi-3-128K и Qwen2-128K показывают сокращение задержек и ошибок при предварительном заполнении до 10 раз на A100 с сохранением точности. Discuss at Huggingface GitHub Arxiv Страница проекта MInference 1.0 @ai_machinelearning_big_data https://t.me/apps244
Показать все...
Context Caching уже начинают внедрять API провайдеры за пределами Google Первыми тут идут китайцы из DeepSeek. Их API и так самый лучший по цена/качество на рынке - DeepSeek Coder V2 по качеству в программировании близок к Claude 3.5 и GPT-4o, а стоит в пятьдесят раз дешевле, а тут ещё и context caching бесплатный на 24 часа подвезли. Я рассказывал уже про context caching ранее, фича очень классная как для чатов, где это банально делает чат дешевле, так и для пайплайнов, где часто переиспользуется один и тот же большой промпт. https://t.me/apps244
Показать все...
Face Обновление nanoLLaVA-1.5 1B На днях обновилась Vision-Language модель nanoLLaVA-1.5 1B. Значительно улучшилась производительность по сравнению с v1.0, при этом размер остался таким же небольшим, что очень удобно для многих применений 🤗 Hugging Face https://t.me/apps244
Показать все...
👍 1
Дмитрий Зауэрс назвал принципы для регулирования искусственного интеллекта в финансовой отрасли На Финансовом конгрессе в Санкт-Петербурге обсудили подходы к регулированию искусственного интеллекта. В дискуссии на эту тему приняли участие представители Газпромбанка, Яндекса, ВТБ, Московской биржи, Центра технологий искусственного интеллекта Сколтеха. Модератор сессии «Искусственный интеллект: подходы к регулированию» Первый заместитель Председателя ЦБ РФ Ольга Скоробогатова отметила, что банки преуспели в использовании традиционных инструментов с использованием ИИ, но появляются новые инструменты, и в связи с этим возникает вопрос о том, как защитить бизнес и потребителей от некачественных моделей и как должна быть распределена ответственность. Заместитель Председателя Правления Газпромбанка Дмитрий Зауэрс считает, что необходим дифференцированный подход к регулированию использования ИИ в финансовой сфере.
«В целом, можно выделить три вида моделей. Первое — это большие модели общего назначения, например, большие лингвистические модели. Второй уровень — модели, при создании которых банки заинтересованы в сотрудничестве, в частности для анти-фрод решений. И, третье — это модели, за счет которых банки конкурируют друг с другом, и они всегда будут разрабатываться внутри. На мой взгляд, большие модели по сути становятся естественными монополиями. И здесь требуется серьезное регулирование для того, чтобы общество в целом могло получать пользу от этих разработок. Что касается общих для банков решений, то здесь также нужны какие-то нормы, потому что требуется обмен большим количеством данных, и он должен быть регламентирован. Когда речь идет о моделях за счет, которых банки конкурируют, — тут нужно нулевое регулирование», — сказал Дмитрий Зауэрс.
«В том числе тут обсуждалась интерпретируемость моделей, я считаю, что это является ограничением для развития технологий, потому что более сильный класс моделей, например, нейросети, не являются интерпретируемыми. В качестве сравнения: большинство не понимает, как устроены двигатели внутреннего сгорания, но успешно пользуется автомобилями. И также интерпретируемость моделей не влияет на их эффективность», — объяснил он.
Участники дискуссии в целом согласились с предложенным подходом и сошлись на мнении, что регулирование не должно создавать барьеры для развития ИИ-технологий.
«В скором времени конкуренция на финансовом рынке превратится в конкуренцию между дата-сайентистами», — отметил Дмитрий ЗауэрсЗауэр
https://t.me/apps244
Показать все...
Поделиться
🙂
👎
😀
😂
👍
😉
🙁
😇
Я не удивлён – Майнкрафт оказался отличной средой для тренировки автономных агентов. А еще там можно построить нейросеть из редстоуна. Авторы, наверное, сами на нем выросли, и вот теперь они представили агента OmniJARVIS, который способен выполнять комплексные таски, такие как крафт каменной (не деревянной) кирки. Т.е. он понимает, что сначала ему нужно сделать верстак, потом деревянную кирку, и только потом, добыв булыжник, каменную. Для этого используют, можно сказать, новый вид мультимодальных LLM - VLA (Vision Language Action). У нас здесь есть как бы два мозга. Мозг LLM и спинной мозг – поведенческий детокенайзер, который интерпретирует аутпут LLM в действие. Действия предварительно тренируются, используя датасет из кучи видосов по Майнкрафту. LLM пишет, что делать, детокенайзер находит у себя в базе выученных действий нужное и шаг за шагом идет к своей цели. И все это вроде как работает очень дружно и слаженно. В видосе агент сам поставил себе план: добыть дерево, создать верстак и скрафтить необходимые инструменты. Все эти действия он научился делать заранее, здесь они выполняются командой экшн. В записи показано, как это выглядит. Еще один пример смотрите в первом комменте. Что это значит? Мы уже научились обучать роботов делать какие-то простые таски: Вот свежий пост про живую сталь и GR00T среду для виртуальной тренировки. У нас уже много примеров того, как боты складывают вещи, моют, убирают и прочее, тут и тут. В этом посте показан не первый, конечно, но очень качественный пример системы, которая объединяет все эти отдельные выученные действия в один общий план, когда бот сам анализирует обстановку, планирует и решает задачи. Кажется, это уверенные шаги в сторону автономных агентов и происходят они в Майнкрафте (т.к., там проще тестировать и обучать). Теперь ждем более сложного планирования и для физических роботов. Project page Пейпер Код! И даже Датасет обещают скоро Апгрейд наш канал❤‍🔥
Показать все...
Апгрейд - IT канал

Канал о науке, технологиях и последних новостях из IT-индустрии. Сотрудничество - @GOSPODI_N

1👍 1🔥 1
Первая рекламная платформа для Telegram Mini Apps Фаундеры крупной игры Fanton запустили рекламную платформу @Adsgram_ai, которая позволяет монетизировать Telegram Mini Apps, а также получать качественный трафик для проектов в Телеграм. Всем владельцев Mini Apps теперь можно подключить свое приложение к рекламной площадке, тем самым получать высокие выплаты за открут рекламы в своем приложении. Например, арбузный кликер заработал 1000 TON за 10 дней рекламы в Adsgram Для рекламодателей — это прекрасная возможность получать качественный таргетированный трафик с учетом интересов пользователей. Можно таргетировать по наличию Premium, типу устройства, гео и др. 📊Также доступна прозрачная аналитика и отслеживание эффективности рекламных кампаний. Для подключения своего приложения к рекламной площадке @Adsgram_ai, или для запроса на трафик с Telegram Mini Apps — пишите напрямую на акк поддержки: Апгрейд - IT канал ⚪️
Показать все...
Adsgram - Telegram apps native advertising system

Adsgram is a novel ADs network built specifically for Telegram Mini Apps. We are solving the current acute problem of the lacking ads monetisation tools for Telegram Mini Apps.

1👍 1🔥 1
Выберите другой тариф

Ваш текущий тарифный план позволяет посмотреть аналитику только 5 каналов. Чтобы получить больше, выберите другой план.