Вопросы по теме 'google-speech-api'

Google Speech API всегда возвращает пустой ответ
Я использую Google Voice API с приложением Cordova. Я записываю звук и сохраняю его на свой локальный диск с помощью плагина Cordova «cordova-plugin-media», после чего я читаю файл, используя метод readAsDataUrl() файла Cordova-plugin-file....
172 просмотров

API распознавания речи Google не слушает
Я пробовал приведенный ниже код распознавания речи с помощью Google Speech API. #!/usr/bin/env python3 # Requires PyAudio and PySpeech. import speech_recognition as sr # Record Audio r = sr.Recognizer() with sr.Microphone() as source:...
2549 просмотров

API Google Cloud Speech: в чем разница между синхронным и асинхронным распознаванием?
Я новичок в GCP. Пока я читаю документ API речи Google, он говорит, что «Асинхронное распознавание (REST и gRPC) отправляет аудиоданные в Speech API и инициирует длительную операцию. Используя эту операцию, вы можете периодически опрашивать...
817 просмотров

Почему у меня слишком много пропущенного текста в Google Speech API?
я уже потратил 1 день, чтобы узнать лучшие практики использования Google Speech API. это моя последняя попытка. здесь мы будем использовать онлайн-источник , чтобы убедиться, что у нас одинаковый звук . Еще одно требование - вам нужно ffmpeg...
709 просмотров

Проблема с передачей строковой переменной для возврата данных из функции Python для глобального использования в любом месте скрипта или программы Python.
Я пытаюсь взять потоковое аудио и преобразовать его в текст, используя текст Google в речь. Затем передайте этот текст в качестве входных данных для разговора не на Watson. Затем Watson возвращает свой ответ. Вторая половина работает отлично....
320 просмотров

Google Speech API - можно ли получить фонематическую расшифровку?
Кто-нибудь знает способ получить фонематическую расшифровку распознанного речевого вывода, полученного из Google Cloud Speech to Text API? Я могу получить обычный (графический) список альтернатив с уверенностью, но я заинтересован в получении...
190 просмотров
schedule 07.05.2024

Google Speech Recognition API Result возвращает только метаданные
Я использую этот скрипт приложения Google для асинхронного распознавание речи. Он отлично работает с файлами менее одной минуты, но результат, который я получаю для более длинного файла (~ 12 минут), таков: [18-11-18 08:19:52:104 EST] {...
93 просмотров

Возникло исключение: «Grpc.Core.RpcException» в System.Private.CoreLib.dll с Google Speech API
Я использую Visual Studio 2019 в Windows 10 с Google Speech API для проекта консоли .NET с использованием С# со следующим кодом: class Program { static async System.Threading.Tasks.Task<object> AsyncRecognizeGcsAsync() { var...
659 просмотров

com.google.api.gax.rpc.UnavailableException: io.grpc.StatusRuntimeException: UNAVAILABLE: учетным данным не удалось получить метаданные: облачная речь
Я сделал конфигурацию речи в текст, используя API облачной речи Google в java, это работает на другом компьютере, но та же настройка не работает на моем компьютере. Я установил инструменты облачной платформы Google с рынка eclipse, а также установил...
1022 просмотров

Буква и цифра Google Speech API
В настоящее время я использую Google Speech Recognition API в java, чтобы повторить ввод пользователя при произнесении. Программа работает со словами и цифрами, но не работает, когда я использую буквы и почтовый индекс. Например, я говорю M3X...
64 просмотров

Ошибка Google Speech to Text: недопустимое распознавание "config": неправильная кодировка .. для файла MP3
Я записываю звук в веб-приложении React, используя пакет узла mic-recorder-to-mp3. Я использовал MediaInfo для просмотра аудиофайлов, созданных с помощью этой библиотеки ( вот пример файла ), в котором отображается следующая информация: Так...
141 просмотров

Транскрибируйте только определенные фрагменты аудио с помощью преобразования речи в текст Google Cloud.
Кажется, я не могу найти никаких инструкций в документации. Я могу успешно транскрибировать аудио из облачного хранилища Google, но он транскрибирует весь файл. Чтобы сэкономить на расходах, я хотел бы транскрибировать только части аудио, желательно...
55 просмотров