Преглед на Microsoft Azure: авангардна обработка на глас

Microsoft Azure Speech to Text е една от най-модерните платформи за разпознаване на глас наоколо. Като част от продуктовата гама на Microsoft Cognitive Speech Services, той използва алгоритми за задълбочено обучение за преодоляване на лошото качество на звука и може да се адаптира към различни стилове на говорене за точни аудио транскрипции. В този преглед на Microsoft Azure Speech to Text ще разгледаме внимателно тази услуга.

Заслужава да се отбележи, че Microsoft Azure Speech to Text не е традиционна част от лесен за ползване софтуер за диктовки. Вместо това това е платформа, ориентирана към разработчици, предназначена да помогне на бизнеса да създава, тества и управлява свои собствени продукти. Ако просто искате да транскрибирате партида аудио файлове, алтернативните приложения за реч в текст може да са по-добър вариант. Разгледайте нашето най-добро софтуерно ръководство за реч в текст за най-добрите алтернативи.

Реч в текст на Microsoft Azure: Планове и цени

Използвайки Microsoft Azure Speech to Text, можете да транскрибирате до пет часа аудио безплатно и да създадете един персонализиран гласов модел на месец. Въпреки това, с безплатния план е налична само една едновременна аудио заявка наведнъж, което означава, че тази опция не е жизнеспособна за повечето бизнеси.

Фактурирането за речеви услуги на Azure се разделя на стъпки от една секунда.

Ако искате да транскрибирате повече от един речев клип наведнъж, ще трябва да надстроите до стандартната система за ценообразуване на Azure. Това струва $ 1 на час аудио и поддържа до 20 едновременни заявки. Допълнителни такси се включват, ако трябва да използвате персонализиран аудио модел или да транскрибирате многоканални звукови файлове. Тези допълнителни услуги струват съответно $ 1,40 и $ 2,10 за аудио час.

Въпреки че Microsoft изброява цените си във формат „на аудио час“, както е отрасловият стандарт, фактурирането всъщност се разделя на стъпки от една секунда, така че няма да плащате за повече време за обработка от необходимото.

Реч в текст на Microsoft Azure: Функции

Ключовата функция Azure Speech to Text е достъпът, който тя предоставя до мощната система за обработка на естествен език на Microsoft. През последните няколко години речта на ИИ на Microsoft достигна няколко важни етапа. Това означава, че вече може да изпълнява задачи, които преди са били невъзможни за услуга за разпознаване на реч, като например точно преписване на кръстосани разговори по време на малки групови разговори.

Услугата Microsoft Azure Speech to Text може да се интегрира с Office 365 за оптимална точност.

Azure работи с десетки езици и диалекти и може да бъде обучен - използвайки персонализирани модели за разпознаване на реч - за по-добро адаптиране към стила на говорене на потребителя, шума на фоновата среда и речника. Ако вашата организация вече се е ангажирала с продуктовата екосистема на Microsoft, можете да използвате данните на потребителски Office 365, за да подобрите по-добре точността на разпознаване на реч за специфични за организацията условия. И, което е важно, това може да се направи, без да се нарушава сигурността на вашите данни, защото Speech to Text може да се изпълнява локално.

Реч в текст на Microsoft Azure: Настройка

Microsoft Azure е предназначен за разработчици, а не за потребители. Това означава, че настройването му е ангажирана и донякъде предизвикателна процедура, която най-добре се оставя на някой с доста техническо ноу-хау.

Настройването на Azure не е съвсем просто, освен ако нямате опит с кодирането.

Най-бързият начин за конфигуриране на Azure е използването на Azure Speech SDK в език за програмиране като Java или C ++. За целта ще трябва да се регистрирате за безплатен акаунт в Azure и да създадете празен проект във вашата среда за разработка. След това ще трябва да използвате Microsoft Visual Studio и да напишете кратка програма за инициализиране на обекта SpeechRecognizer на Microsoft.

Реч в текст на Microsoft Azure: Интерфейс

Подобно на други платформи за групова транскрипция, Microsoft Azure Speech to Text е предназначен да се изпълнява като интерфейс за програмиране на приложения (API), добавен към програми на Office 365 или интегриран в нови платформи и услуги. Поради това няма един интерфейс на Azure Speech to Text. Какво ще види крайният потребител зависи от това как е интегриран Azure Speech to Text.

Онлайн порталът Azure е интуитивен и лесен за използване.

Междувременно разработчикът, управляващ Azure, ще го направи чрез онлайн Azure Portal на Microsoft, който се чувства модерен и е лесен за навигация. Отнема само няколко минути, за да намерите страницата с ресурси на речевите услуги и след като даден екземпляр бъде добавен към вашия акаунт, наблюдението на предупрежденията и употребата може да се преглежда в един прозорец.

Реч в текст на Microsoft Azure: Производителност

Като част от нашия преглед на Microsoft Azure Speech to Text, ние искахме да видим как тази платформа се справи с предизвикателството да обработва необработени гласови записи, така че след като акаунтът ни в Azure беше готов за работа, качихме поредица клипове с различни нива на фонов шум . Навсякъде Azure се справи добре с обработката на нашите проби, тъй като видяхме не повече от шепа грешки по време на нашата оценка.

Активирането на персонализирания модел на говор на Azure подобри нашата точност на транскрипцията.

Azure се бореше леко, когато първоначално обработваше необичайни или специални фрази като имена на спортни отбори и научни термини, но това бързо беше решено чрез активиране на опцията за извеждане на персонализиран модел. След като активирахме тази опция, Azure успя да се адаптира към уникалния речник и стил на говорене, който използвахме.

Реч в текст на Microsoft Azure: Поддръжка

За да научите как да взаимодействате с SDK на Azure Speech Services чрез различни езици за програмиране и да интегрирате функциите Azure Speech to Text във вашата собствена платформа, определено ще ви трябва помощ. За щастие Microsoft създаде изчерпателен каталог с учебни материали за платформата Azure, в който ще намерите примери за код и полезни съвети.

Разделът за обучение на сайта Azure съдържа много полезни ресурси.

Също така всички клиенти на Azure получават безплатна поддръжка за фактуриране и управление на абонаменти, която може да бъде достъпна чрез билетна система. По-задълбочена поддръжка може да бъде добавена към вашия акаунт срещу повтаряща се такса, започвайки от $ 29 на месец.

Реч в текст на Microsoft Azure: Окончателна присъда

Платформата Azure Speech to Text използва модерна технология, за да осигури почти перфектна услуга за транскрипция. Най-подходящ е за фирми, които вече са инвестирали в екосистемата на Microsoft Office 365, защото персонализираните модели на глас и речник могат да бъдат генерирани сигурно от съществуващия ви архив на документи. Някои малки фирми могат да се борят с Azure, тъй като правилната му настройка изисква внимание от квалифициран разработчик на облак на Microsoft.

Състезанието

Amazon Transcribe, Google Cloud Speech-to-Text и Watson Speech to Text са преки конкуренти на Microsoft Azure. Тези три платформи също са способни да извършват прецизно партидни транскрипции с голям обем. Google Cloud е единственият близък конкурент, способен да работи с повече езици от Azure, но е по-скъп, с начална ставка от едва 0,006 $ на 15 секунди, в сравнение с 0,017 $ на Azure на минута (0,00425 $ на 15 секунди).

За да намерите други алтернативи на Microsoft Azure Speech to Text, разгледайте нашето най-добро софтуерно ръководство за реч в текст.

Интересни статии...