Я новичок в GCP. Пока я читаю документ API речи Google, он говорит, что «Асинхронное распознавание (REST и gRPC) отправляет аудиоданные в Speech API и инициирует длительную операцию. Используя эту операцию, вы можете периодически опрашивать результаты распознавания». Но что на самом деле означает «длительная операция»? А в чем разница между процессом синхронного и асинхронного распознавания? Я поискал в Интернете и нашел ответ по этому поводу: https://www.quora.com/What-is-the-difference-between-synchronous-and-asynchronous-speech-recognition Но я все еще не понимаю. Кто-нибудь может объяснить более конкретно? Буду очень признателен за ваш ответ :)
API Google Cloud Speech: в чем разница между синхронным и асинхронным распознаванием?
Ответы (1)
- Асинхронные облачные запросы обычно возвращают идентификатор, который был поставлен в очередь для обработки, и позже вы можете использовать этот идентификатор для проверки статуса и получения результатов, когда это будет сделано.
- Синхронные запросы возвращают результаты как часть ответа, но они могут блокироваться на более длительное время.
Для попробуйте оба. Запросы на синхронизацию аудио менее 60 секунд
gcloud ml speech recognize AUDIO_FILE ...
и асинхронный режим для аудио дольше, чем 60 секунд
gcloud ml speech recognize-long-running AUDIO_FILE ...
последний вместо транскрипта вернет OPERATION_ID
, который позже вы можете запустить
gcloud ml speech operations describe OPERATION_ID
для получения результатов.
СОВЕТ. Вы можете добавить флаг --log-http
, чтобы видеть, какие запросы API делает gcloud
, чтобы лучше понять, что происходит на уровне API.
person
cherba
schedule
07.01.2018