cookie

نحن نستخدم ملفات تعريف الارتباط لتحسين تجربة التصفح الخاصة بك. بالنقر على "قبول الكل"، أنت توافق على استخدام ملفات تعريف الارتباط.

مشاركات الإعلانات
1 281
المشتركون
+224 ساعات
+17 أيام
+530 أيام

جاري تحميل البيانات...

معدل نمو المشترك

جاري تحميل البيانات...

Всё, Телеграм теперь уподобился «плохим» корпорациям? https://habr.com/ru/articles/816423/
إظهار الكل...
Всё, Телеграм теперь уподобился «плохим» корпорациям?

Вопреки ценностям, которыми бравировал Павел Дуров во время своего интервью Такеру Карлсону, некоторые администраторы крупных телеграм-ботов (~сотни тысяч DAU) буквально только что получили вот такое...

👍 4🤔 3
⬆️ Фармим классы на Хабре https://habr.com/ru/articles/806857/ ⬆️
إظهار الكل...
Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках

Мы выложили в публичный доступ гигантский датасет для детекции речи (voice activity detection). Датасет содержит порядка 150 тысяч часов аудио более чем на 6,000 языках. Количество уникальных...

🔥 11👌 3
Silero-VAD Dataset: a Large Public Internet-Scale Dataset for Voice Activity Detection for 6000+ Languages Мы выложили в публичный доступ наш новый LaPIS Dataset для детекции речи (расшифровка акронима в заголовке). Датасет содержит порядка 150 тысяч часов аудио более чем на 6000 языках, размеченных для задачи детекции голоса при временной дискретизации в ~30 миллисекунд (num_samples = 512). Данный датасет распространяется под лицензией CC BY-NC-SA 4.0.
Датасет создан при поддержке Фонда содействия инновациям в рамках федерального проекта «Искусственный интеллект» национальной программы «Цифровая экономика Российской Федерации».
@misc{Silero VAD Dataset,
  author = {Silero Team},
  title = {Silero-VAD Dataset: a large public Internet-scale dataset for voice activity detection for 6000+ languages},
  year = {2024},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/snakers4/silero-vad/datasets/README.md}},
  email = {[email protected]}
}
إظهار الكل...
silero-vad/datasets at master · snakers4/silero-vad

Silero VAD: pre-trained enterprise-grade Voice Activity Detector - snakers4/silero-vad

👍 15🔥 14❤‍🔥 4
إظهار الكل...
Дайте слово: кто уговаривает россиян сдать образцы голоса

Преступники научились использовать синтезированную речь. В интернете появились предложения предоставить запись своего голоса якобы для коммерческого использования. Авторы объявлений обещают пристроить речь в рекламные проекты, а взамен сулят...

😱 4
Photo unavailableShow in Telegram
Играемся с RTX 5000 Ada (AD103): первые впечатления https://habr.com/ru/articles/789394/
Майнинг и использование для майнинга в этой статье не обсуждается.
У меня есть пара старых статей (про A100, и про 3090 и A10). С тех пор прошло примерно два года и пора написать что-то новенькое и попробовать новые ускорители для расчетов. Да, это всё ещё статья про карточку Nvidia, не AMD и не Intel, и не про китайцев и какие-то модные большие чипы, увы. С тех пор появились новые карточки уже аж двух новых поколений - Ada Lovelace и Hopper. При этом Hopper вроде как должны были прийти на замену очень удачному поколению Ampere (еще есть древняя традиция Nvidia - за супер успешным поколением следует менее удачное), но не пришли. Но возможно из-за торговых войн с Китаем карточки поколения Hopper стали выдавать только нужным вендорам и в виде собранных систем и при этом запретили экспорт в Китай. В этой статьей мы разберем первые впечатления от карточки NVIDIA RTX 5000 Ada Generation (чип AD103) и добавим щепотку юмора для начала. Давайте разбираться!
إظهار الكل...
🔥 8👍 5
⚡️2 вакансии, Junior и Middle, Speech, ML от Силеро 🗜 Выжимка Основное место работы Выпускники или студенты последнего курса (для Junior) ssh, встречаемся 1 раз в неделю оффлайн (Москва) Не рассматриваем сочетание с лабой / другой работой и т.п. Финальное собеседование очное с командой в Москве 🛠 Что реально надо делать Разработка на питоне Работа с данными, сбор и очистка данных Обучение нейросетей и разработка ML алгоритмов В первую очередь синтез речи и вспомогательные задачи Разработка и поддержка продуктовых сервисов (для Middle) 📚 Идеальный кандидат Python + PyTorch Есть понятные пет-проекты или опыт (не платные курсы) Прошарен(а) в экосистеме Linux, работешь в консоли Прочитал(а) seminal papers (CV, NLP, ASR, TTS) Имеешь свое аргументированное мнение на эту тему (для Middle) Оконченное (или последний курс) высшее в тех. и естественно-научных дисциплинах Участие в запуске продакшен-продукта (для Middle) Цифровая обработка сигналов это плюс 🔗 Ссылки Подробное описание вакансии - ссылка Наши публикации на Хабре - ссылка Полный список публикаций - ссылка Бот с нашим синтезом в Телеграме - ссылка 💌 @silero_job
إظهار الكل...
👍 14 3🤝 1
❤️‍🔥 Спасибо Синодову за упоминание! https://t.me/thinkaboutism/4230
إظهار الكل...
Логи внутренних диалогов

Поигрался со сберовским SaluteSpeech синтезом и распознаванием Распознавание, более-менее как у всех (пример не приведу, он для меня: но чуда не случилось, всё ещё надо редактировать и огрехи распознавания, и саму устную речь в принципе), синтез тоже можно улучшать — вот, например, озвучивание новости про игровой ЦУПИС во вложении: интонационные паузы после двоеточия делает, а после запятой перед "а" — нет. Аббревиатуры не идентифицирует и так далее. Цена на уровне другого крупняка побежавшего в AI, но в разы-на полпорядка выше чем у нишевого российского же silero.ai, правда в Сбере я прогнал минут 90 распознавания из бесплатных 100 — лимит за 12 часов так и не изменился, забавно — но строить на такой невнимательности бизнес или какой-то продукт не получится, конечно. Понятно что Сбер это пушнёт среди клиентов и продажи обеспечит, но где magic dust и залитое немеренное баблище — я не очень понял.

3
Поигрался со сберовским SaluteSpeech синтезом и распознаванием Распознавание, более-менее как у всех (пример не приведу, он для меня: но чуда не случилось, всё ещё надо редактировать и огрехи распознавания, и саму устную речь в принципе), синтез тоже можно улучшать — вот, например, озвучивание новости про игровой ЦУПИС во вложении: интонационные паузы после двоеточия делает, а после запятой перед "а" — нет. Аббревиатуры не идентифицирует и так далее. Цена на уровне другого крупняка побежавшего в AI, но в разы-на полпорядка выше чем у нишевого российского же silero.ai, правда в Сбере я прогнал минут 90 распознавания из бесплатных 100 — лимит за 12 часов так и не изменился, забавно — но строить на такой невнимательности бизнес или какой-то продукт не получится, конечно. Понятно что Сбер это пушнёт среди клиентов и продажи обеспечит, но где magic dust и залитое немеренное баблище — я не очень понял.
إظهار الكل...
Photo unavailableShow in Telegram
Автор на Хабре продемонстрировал как сильно Silero TTS отстаёт от решений гига-корпораций ... но есть нюанс ⬆️https://habr.com/ru/articles/768424/⬆️ Не секрет, что отношение шума к сигналу на Хабре неуклонно растет. "Настоящие" авторы уходят с Хабра потому, что просто качественный технический контент может пройти незамеченным. На любом "выжившем" ресурсе создавшийся вакуум заполнят авторы с пониженным уровнем критического мышления или ответственности (мы это кстати ярко видим на Пикабу, после отмены "минусов"). Зачем же я пишу эту статью? Совсем недавно на Хабре вышла статья, и судя ее оценкам, публике она зашла. В статье сравнивались разные системы синтеза речи, в частности публичная версия нашего синтеза речи и решения гига-корпораций. Мнение автора просуммирую точной цитатой: "Даже на таком небольшом тесте мы видим, как отстает силеро. … Конечно, такое небольшое сравнение не сможет показать всей картины, но мы уже видим примерное качество. … Я не питаю к Silerо tts никакого негатива, но после слов про 100% решения ударений в этой статье, и убедившись в обратном на основании результатов теста, слегка разочарован." И вы спросите что с этим не так? Человек бесплатно прорекламировал нас в одном ряду с гига-корпорациями. Но есть один нюанс. Все эти выводы в большей степени не имеют никакого отношения к реальности. Давайте разбираться. ⬆️https://habr.com/ru/articles/768424/⬆️
إظهار الكل...
👍 16🔥 5😈 2
Photo unavailableShow in Telegram
⬆️https://habr.com/ru/articles/768424/⬆️ Не секрет, что отношение шума к сигналу на Хабре неуклонно растет (в рассылке я лично вижу в основном 3 типа статей - популизм про AI, корпоративная реклама и желтые "жжёные" статьи про рынок IT). Многие "настоящие" авторы уходят с Хабра потому, что просто качественный технический контент может пройти незамеченным, а как показала практика пользователи, создающие уникальный авторский контент, могут быть не всегда или не во всём равны с корпорациями, создающими выручку. Логично, что как и на любом "выжившем" ресурсе создавшийся вакуум заполнят авторы с пониженным уровнем критического мышления или ответственности (мы это кстати ярко видим на Пикабу, после отмены "минусов"). Зачем же я пишу эту статью? Совсем недавно на Хабре вышла статья, и судя ее оценкам, публике она зашла. В статье сравнивались разные системы синтеза речи, в частности публичная версия нашего синтеза речи и решения гига-корпораций. Мнение автора просуммирую точной цитатой: "Даже на таком небольшом тесте мы видим, как отстает силеро. … Конечно, такое небольшое сравнение не сможет показать всей картины, но мы уже видим примерное качество. … Я не питаю к Silerо tts никакого негатива, но после слов про 100% решения ударений в этой статье, и убедившись в обратном на основании результатов теста, слегка разочарован." И вы спросите что с этим не так? Человек бесплатно прорекламировал нас в одном ряду с компаниями, проинвестировавшими на 2-3 порядка больше денег. Но есть один нюанс. Все эти выводы в большей степени не имеют никакого отношения к реальности. Давайте разбираться.
إظهار الكل...
👍 2🤮 1