cookie

نحن نستخدم ملفات تعريف الارتباط لتحسين تجربة التصفح الخاصة بك. بالنقر على "قبول الكل"، أنت توافق على استخدام ملفات تعريف الارتباط.

avatar

Voice stuff

Канал про голосовые технологии. Чат группы @voice_stuff_chat Здесь говорят про свежие подходы и решения в областях распознавания и синтеза речи, голосовой биометрии и про машинное обучение в целом. Контакт: @frappuccino_o

إظهار المزيد
مشاركات الإعلانات
1 285
المشتركون
+324 ساعات
-17 أيام
+1430 أيام

جاري تحميل البيانات...

معدل نمو المشترك

جاري تحميل البيانات...

У каждого в телеграме есть каналы ведь, да? Давайте такую акцию. Напишите мне на @frappuccino_o свой канал и 140 символов с его описанием. Если тематика похожа, я опубликую ваш канал у себя в подборке. Взамен хочу чтобы вы написали у себя на канале пост про @voice_stuff_chat.
إظهار الكل...
👍 5🤡 2
flow matching consistently better than diffusion https://arxiv.org/abs/2406.10970
إظهار الكل...
Joint Audio and Symbolic Conditioning for Temporally Controlled...

We present JASCO, a temporally controlled text-to-music generation model utilizing both symbolic and audio-based conditions. JASCO can generate high-quality music samples conditioned on global...

Repost from OutOfScope
Photo unavailableShow in Telegram
🔍 ЛЕКТОРИЙ ЯНДЕКСА 2024 ❣️ Уже две недели прошло с открытия Летних школ и Лектория Яндекса 2024 — эфир. И я по своей хорошей традиции собираю все лекции, которые уже были проведены. Всем приятного просмотра и погружения в большое количество лекций 🔥 ШМЯ 2024 (Школа менеджеров Яндекса) 💯 ➖ Все в одной лодке: менеджер и команда (кругляй стол)Больше, чем фича-оунер: зачем мне думать про стратегию, если я управляю конкретной фичейСтратегическая прожарка Яндекс Лавки ШАР 2024 (Школа аналитиков-разработчиков) ✨ ➖ Что такое аналитика? ШРИ 2024 (Школа разработчиков интерфейсов) 💎 ➖ Node.js. Бэкенд для фронтендераАсинхронностьТулингТипизация Типизация продвинутый ШМР Android 2024 (Школа мобильной разработки) 💻 ➖ Вводная по платформеView в AndroidJetpack ComposeПогружение в Kotlin и JVMМногопоточность ШМР Flutter 2024 (Школа мобильной разработки) 💻 ➖ Флаттер-мастерская: опыт команд Яндекса в разработке на FlutterАсинхронкаArchitecture. Часть 1: App Architecture OverviewAdvanced Widgets Architecture. Часть 2: Flutter, State Management, существующие решения ШМР iOS 2024 (Школа мобильной разработки) 💻 ➖ Вводная по платформеAdvanced Swift programming Part 1Advanced Swift Programming Part 2Basic SwiftUIAdvanced SwiftUI ШБР 2024 (Школа бэкенд-разработки) 💻 💻 💻 ➖ Вводная лекция про бэкендАрхитектура кода (Java)Архитектура кода (Python)Архитектура кода (C++) Вводная лекция про userver (С++)Как проектировать HTTP API КИТ 2024 (Курсы информационных технологий) ⚙️ ➖ Как всё организовано в LinuxИнструменты Linux #ШколаМенеджеровЯндекса #ЛекцииЯндекса Давай наберем 30 🔥, если было полезно! OutOfScope | OOS
إظهار الكل...
🔥 8👍 1💩 1
00:11
Video unavailableShow in Telegram
IMG_6304.mp43.30 MB
😁 9
GitHub - yandexdataschool/speech_course: YSDA course in Speech Processing. https://github.com/yandexdataschool/speech_course
إظهار الكل...
GitHub - yandexdataschool/speech_course: YSDA course in Speech Processing.

YSDA course in Speech Processing. . Contribute to yandexdataschool/speech_course development by creating an account on GitHub.

🔥 12
Repost from AbstractDL
Photo unavailableShow in Telegram
Goldfish Loss: заставим LLM запоминать смысл, а не текст Языковые модели часто вызубривают обучающие примеры, а это очень неприятно, особенно когда в датасете есть приватные данные, диалоги реальных пользователей или контент с копирайтом. Да и вообще, хочется, чтобы LLM запомнила именно смысл обучающих данных, а не заучивала их наизусть. Оказалось, что одним из самых эффективных способов борьбы с таким поведением — это простой дропаут лосса, то есть маскирование ошибки для случайного сабсета токенов в тексте (~25%). Таким образом модель не научится дословно воспроизводить то, что видит. Даже после 10 эпох дообучения на Гарри Поттере "плагиат" в генерациях модели остаётся на уровне нуля. А главное, что такая регуляризация не ухудшает финальные метрики, в том числе на претрейне. Статья, GitHub
إظهار الكل...
🔥 6👍 2 1
Когда я был в школе и научился программировать, мне казалось что если просто уделить достаточно времени, то можно запрограммировать всё, что угодно. Типо, написать операционную систему, беспилотный вертолёт - нужно просто дать достаточно инструкций. Со временем я понял, что на такие крупные проблемы может и жизни не хватить чтобы всё написать в одно лицо. А ещё позже я понял что не всё можно запрограммировать. Какие вы можете придумать инструкции чтобы распознать кошку на фотографии? Да их просто не может существовать. И чем логичнее подходить к этому вопросу, тем хуже выйдет. Тут нужен другой подход. Инструкции тут должны написать сами себя и с какой-то вероятностью мы найдём кошку на фото. И тут кажется что вот мы сейчас найдём достаточно данных и тоже всё обучим. Я *подозреваю* что с AI тоже есть какие-то дырки, которые всем кажутся легко преодолимыми. Ну например, я ещё не видел одного агента, который был бы автономным и не требовал постоянного надзора человека за ним. Если дать gpt-4 интерпретатор и попросить запрограммировать что-то, что не гуглится - вроде детектора черно-белых фотографий. Она не справится даже если ей дать бесконечно много времени. (Я решил эту задачку CLIPом и разметкой на 100 изображений) ChatGPT хорошо заменяет гугл и писателя и это очень крутой прогресс. Но думает она всё ещё очень ограниченно. И несмотря на тренд что она становится умнее, что-то фундаментальное должно сдвинуться сначала. Так что я бы относился со спокойствием к заявлениям о том что *AGI is about to break out и поработит нас*. Конечно же это крутая технология и многое меняет, но бесполезно говорить что она станет умнее/быстрее/выносливее нас - она безусловно, уже стала, но мы с вами живём примерно той же жизнью. Машины всегда были в чем-то лучше людей, но людьми они от этого не стали. https://situational-awareness.ai/
إظهار الكل...
Introduction - SITUATIONAL AWARENESS: The Decade Ahead

Leopold Aschenbrenner, June 2024 You can see the future first in San Francisco. Over the past year, the talk of the town has shifted from $10 billion compute clusters to $100 billion clusters to trillion-dollar clusters. Every six months another zero is added to the boardroom plans. Behind the scenes, there’s a fierce scramble to

❤‍🔥 11🤡 5 2
Numpy 2.0 👏 Судя по релизу, улучшения чисто эстетические и более заметные для тех, кто разрабатывает numpy, чем для пользователей. Как я понял, главная цель релиза была навести чистоту в namespace. Поэтому в удалённом там почистили много ссылок на типы. Теперь есть только одно название у каждого типа. И np.cast не работает - но он уже был deprecated. И ещё где-то 5 функций, которые я никогда не использовал. Ещё почистили импорты, поубирали from ... import * для внутренних компонентов. Так что теперь в видимых модулях должна наступить чистота. Несмотря на такое обширное удаление, всё должно быть очень совместимым. Я не нашёл ничего часто используемого. Так что релиз должен пройти на уровне PyTorch 2.0, где никому не пришлось переписывать код под новую версию. https://numpy.org/devdocs/release/2.0.0-notes.html
إظهار الكل...
👍 2🤡 2
Photo unavailableShow in Telegram
Да
إظهار الكل...
😁 3🤝 1
إظهار الكل...
MLow: Meta’s low bitrate audio codec

At Meta, we support real-time communication (RTC) for billions of people through our apps, including WhatsApp, Instagram, and Messenger.  We are working to make RTC accessible by providing a high-q…

👍 4😱 3
اختر خطة مختلفة

تسمح خطتك الحالية بتحليلات لما لا يزيد عن 5 قنوات. للحصول على المزيد، يُرجى اختيار خطة مختلفة.