Описание
«1С:Распознавание речи» – облачный продукт по автоматическому преобразованию речи в текст. Механизмы естественной речи отличаются от встроенного языка «1С:Предприятие». Партнеры фирмы «1С», разработчики и программисты, сопровождающие информационные системы пользователей, интегрируют «1С: Распознавание речи» в прикладные решения и используют различные бизнес-процессы.
- Длинный текст проще надиктовать, чем вводить на клавиатуре, с помощью «Распознавания речи». Электронные описания, содержание задач и комментарии, текстовые блоки в документах удобно управлять голосом, особенно если у пользователя заняты руки, а также при работе на мобильных устройствах.
- Можно распознавать записи телефонных разговоров или совещаний в хорошем качестве аудиозаписи. Для наилучшего результата рекомендуется записывать отдельные звуковые каналы для каждого собеседника.
- Можно использовать голосовое управление в приложениях так, чтобы по загрузке пользователя открывались формы, строились отчеты, выполнялся поиск, загружались реквизиты.
- «1С: Распознавание речи» может определять задачи по роботизации опросов для проведения опросов и сбора информации, в голосовых целях самообслуживания, для сбора аналитики работы с клиентами, а также при обнаружении интерфейсов для людей с ограниченными поисками.
- При потоковом распознавании речи работа с дополнительной грамматикой: в начале работы вы можете передать какие-то особые термины (фамилии сотрудников, названия номенклатуры или компаний-контрагентов) для их уверенного использования.
Распознавание речи осуществлялось с помощью облачного сервиса или с использованием скачкообразной модели. При возникновении изменений аудиоданные никуда не исчезают, что может быть важно при особых требованиях к конфиденциальности. Использование облачного «1С:Распознавания речи» происходит без нагрузки на оборудование пользователя и увеличение интенсивности речи, особенно при большом объеме аудиоданных.
Мы постоянно работаем над улучшением качества речи и приобретаем новые возможности. Все исследования происходят изначально в облачном механизме и только становятся доступными в реальных вариантах, поэтому качество речи в облачном и предполагаемом вариантах может быть сопоставлено.
Для ознакомления с речью с использованием доступных демоприложений (конфигурация 1С) , которая позволяет распознавать из потокового аудио или звуковых файлов с помощью облачного сервиса или контекста. Реализованные в демоприложении возможности можно сохранить для встраивания различных высказываний в прикладные решения на платформе «1С:Предприятие 8».
Возможности
-
Потоковое распознавание – пользователь отправляет аудиоданные в образец реального времени, в ответ на процедуру получает распознаваемый текст. Управлять при диктовке текста или при управлении интерфейсом программы.
Длительность одного сеанса при распознавании потоков с использованием облачного сервиса была обнаружена в течение 2 часов. При распознавании речи ограничения длительности сеанса нет.
-
Файловое распознавание – пользователь отправляет на распознавание файл с аудиозаписью и в ответ получает идентификатор задачи, по мере необходимости в дальнейшем получает результат развития. В случае необходимости пользователь может отправить готовый аудиофайл, например, запись. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и загрузки загрузки облачного сервиса.
Файловое распознавание может считывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться и тарироваться независимо. Для использования форматов аудио WAV, подписанный 16-битным прямым порядком байтов, и Opus в контейнере ogg. Частота дискретизации аудио – от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1Гб длительностью до 4 часов. Результаты получены для скачивания в течение 7 дней после выполнения задания.
-
В настоящее время обнаружена ошибка распознавания речи на русском и английском языках. В дальнейшем состав доступных языков будет расширяться.
Условия использования
Работает в программах:
- 1С:Документооборот 3.0 (диктовка текста электронных писем, задач, отчетов и резолюций, голосовой подбор адресов писем)
Облачный продукт «1С:Распознавание речи» доступен на встроенном языке платформы «1С:Предприятие 8» с версией 8.3.23 и может быть встроен в любое пользовательское приложение 1С.
Программа 1С, в которую встраиваются механизмы обнаружения, должна быть официально подтверждена .
При последовательном распознавании речи рекомендуются минимальные требования к ресурсному оборудованию:
- x64: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели, оперативная память 12 Гбайт и выше,
- x32: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели с оперативной памятью 4 Гбайт и выше. Качество речи на платформе x32 снижено.