digital на минималках
Бизнес, мемы и айти Сотрудничество: @sendnoodes
Більше- Підписники
- Перегляди допису
- ER - коефіцієнт залучення
Триває завантаження даних...
Триває завантаження даних...
В феврале этого года йеменские хуситы повредили четыре подводных интернет-кабеля, и это привело к нестабильной работе интернета по всему миру: от Европы до Индии, временно недоступными стали крупнейшие приложения и сервисы. Новый выпуск комедийного шоу «Сбросим маски» с Илоном Маском — про связь и цифровой суверенитет. Почему современный digital зависит от кабелей, как корпорации «подсаживают» на свою инфраструктуру и почему каждой стране важно заниматься собственной цифровой экосистемой? Перевели и озвучили выпуск специально для русскоязычной аудитории!
[00:00.000 --> 00:05.660] Ублюдок, мать-то, а ну иди сюда, говно собачий, азуришил [00:05.660 --> 00:10.320] ко мне, лезь ты, засранец, вонючий мать твою, а, ну иди [00:10.320 --> 00:13.360] сюда, попробуй меня трахнуть, у тебя сам трахну, ублюдок, [00:13.360 --> 00:16.840] а на них из чертов будь ты проклят, иди идиот, трах [00:16.840 --> 00:20.560] тебя и всю твою семью, говно собачий, жлоб, вонючий, [00:20.560 --> 00:24.560] дерьмо, сука, падла, иди сюда, мерзавец, негодяй, [00:24.560 --> 00:29.200] гад, иди сюда, ты говно, жопа. [00:29.200 --> 00:32.840] Кровь и бетон, история любви.Скорость работы разных решений: 1. На скорость работы облачной версии Whisper ничего не влияет и она является самой быстрой (3 сек. на наш пример). 2. VOSK же выдал результат примерно секунд за 20, при этом, на его скорость также мало что влияет 3. Скорость работы локальной версии Whisper зависит и от выбранной субмодели, и от твоего железа (причем, в отличии от VOSK - на виртуальном сервере без видеокарты ты её уже не запустишь). Ну и даже самая лёгкая субмодель Whisper выдает результат медленней, чем тот же VOSK
<?php
$gpt_key = "sk-...";
function speech_to_text($gpt_key, $url){
$output['success'] = false;
$output['content'] = "Что-то пошло не так. Пожалуйста, попробуйте позже.";
$boundary = uniqid();
$fileContent = file_get_contents($url);
$baseFileName = 'audio.mp3';
$body = "--" . $boundary . "\r\n";
$body .= "Content-Disposition: form-data; name=\"file\"; filename=\"" . $baseFileName . "\"\r\n";
$body .= "Content-Type: audio.mp3\r\n\r\n";
$body .= $fileContent . "\r\n";
$body .= "--" . $boundary . "\r\n";
$body .= "Content-Disposition: form-data; name=\"model\"\r\n\r\n";
$body .= "whisper-1\r\n";
$body .= "--" . $boundary . "--";
$options = [
'http' => [
'method' => 'POST',
'header' => "Content-Type: multipart/form-data; boundary=" . $boundary . "\r\n" .
"Authorization: Bearer " . $gpt_key . "\r\n",
'content' => $body,
'request_fulluri' => true,
],
'ssl' => [
'verify_peer' => false,
'verify_peer_name' => false,
]
];
$context = stream_context_create($options);
$url = "https://api.openai.com/v1/audio/transcriptions";
$response = file_get_contents($url, false, $context);
if ($response !== false) {
$jsonResponse = json_decode($response);
if (isset($jsonResponse->text)) {
$output['success'] = true;
$output['content'] = $jsonResponse->text;
}
}
return $output;
}
$stt = speech_to_text($gpt_key, "audio.mp3");
echo $stt['content'];
?>
Результат распознавания аудио из примера выше:
Ублюдок, мать твою, а ну иди сюда, говно собачье, решил ко мне лезть, ты, засранец, вонючий, мать твою, а? Ну иди сюда, попробуй меня трахнуть, я тебя сам трахну, ублюдок, а найди с чертов, будь ты проклят, иди, идиот, трахать тебя и всю твою семью, говно собачье, жлоб вонючий, дерьмо, сука, падла, иди сюда, мерзавец, негодяй, гад, иди сюда, ты, говно, жопа Кровь и бетон. История любвиСкорость распознавания: 3 сек.