Преглед на софтуера за транскрипция на Sonix.ai

Всеки инструмент, който транскрибира, е насочен към определена ниша и Sonix е избрал тези, които записват срещи или презентации и след това се нуждаят от типизирана версия за търсене или разпространение.

Следователно, това може да бъде еднакво полезно за студент, както и за изпълнителен директор, като доставя транскрипции, които могат лесно да бъдат индексирани за бъдещи справки.

Но за да бъде успешен за тези задачи, софтуерът трябва да бъде точен и достъпен.
Sonix.ai този инструмент ли е и може ли онлайн услуга да се конкурира с инсталирано приложение?

  • Искате ли да опитате Sonix.ai? Вижте уебсайта тук

Планове и ценообразуване

Както при много услуги за транскрибиране, моделът на разходите на Sonix е този, който се основава на времето. По-конкретно, продължителността на всеки запис, който качвате в услугата за обработка, и цената на този ресурс е $ 10 на час, ако използвате неговата стандартна услуга за плащане при движение.

Цената на час може да бъде намалена до $ 5, ако се регистрирате в абонаментната услуга Premium за $ 22 на месец за всеки потребител. И отстъпки за обем са налични за онези компании, които изискват повече от 100 часа на месец, преписвани.

Стандартният план има най-основните функции, а Premium добавя допълнителни като многопотребителски достъп и споделяне на екип. И Enterprise има всичко, което Premium предлага с много допълнителни административни услуги и подобрен модел за поддръжка.

Тъй като услугите за транскрипция отиват, Sonix е един от най-скъпите и със сигурност не е нещо, което повечето ученици или домашни потребители могат да си позволят разумно.

Дизайн

Сайтът my.sonix.ai използва изключително изчистен дизайн и създаването на акаунт е безплатно.

По време на писането това е изключително уеб-базирана услуга и Sonix няма мобилно приложение за заснемане и изпращане на обработващи аудио записи.

Тъй като обаче ще разгледаме късно, има лесни начини за заобикаляне на този проблем, които донякъде разрешават липсата на мобилно приложение.

Началната точка за всяка задача за транскрибиране е таблото за управление Sonix.ai, където можете да видите аудиото, което вече е транскрибирано, и да добавите нови, които да бъдат обработени.

Тъй като тази система е предназначена за множество потребители, тя включва система за виртуални папки за организиране на транскрипции по какъвто и да е начин, който се счита за подходящ.

Кликването върху „качване“ отвежда потребителя на страница, където в системата могат да бъдат пуснати множество файлове и ако акаунтът има достатъчно кредит, те могат да бъдат обработени.

Поддържат се всички стандартни формати на аудио файлове, включително wav, mp3, mp4a, aiff, acc, ogg и wma, а също така можете да качите някои структури за видео опаковане. Максималният размер на файла е 4 GB, така че преди да качите голям видео файл с разделителна способност от 4K, препоръчваме ви да използвате друг инструмент за разделяне на аудиото, за да направите качването по-бързо.

Един добър начин да ускорите качването е да използвате съхранение в облак като Google Drive, One Drive, Box или Dropbox и да го свържете директно с акаунта. Можете също да изпратите системата по имейл с помощта на Gmail като средство за създаване на по-елегантен работен поток от пускането на файлове на уеб страница.

Тази автоматизация се осигурява чрез Zapier, което позволява много по-широка интеграция, ако бизнесът, който го използва, е инвестирал в тази технология, за да свърже своите бизнес процеси.

Друг приятен щрих е, че заедно с аудио или видео файла можете да включите съществуваща транскрипция, като средство за по-бързо завършване на процеса и подобряване на точността.

Друг приятен щрих е, че заедно с аудио или видео файла можете да включите съществуваща транскрипция, като средство за по-бързо завършване на процеса и подобряване на точността.

Поради естеството на обработката, базирана на облак, преценката колко бърза или бавна може да бъде обработката е невъзможна, но Sonix.ai е относително бърз според нашия опит. Обикновено отнема между 10% и 20% от времето за транскрибиране, докато записът продължава. Следователно завършването на 10-минутен запис обикновено отнема по-малко от 2 минути.

Не е необходимо да следите обработката, тъй като системата ще ви изпрати известие по имейл, когато работата приключи, заедно с връзка към новата транскрипция.

След като файлът бъде обработен, можете да го отворите в и страница за редактиране, за да прегледате резултатите, а също така да експортирате текста в широк спектър от полезни формати, включително тези, определени от някои приложения като субтитри.

Броят на езиците и диалектите, поддържани от системата, е 36 и това включва множество англоговорящи, френски, кантонски, мандарински, португалски и испаноезични страни, заедно с всички често срещани западно- и източноевропейски езици, заедно с някои азиатски и арабски.

Записи

Наред с работата, която е влязла в AI, необходима за интерпретиране на шумовете, които хората издават, вероятно страницата Recordings представлява значително усилие за кодиране тук.

Тук аудиото и свързаният с него препис могат да бъдат сравнени и ръчно подобрени с подробности за промените на високоговорителите и корекции на погрешни интерпретации.

За всеки, който работи чрез препис за полиране на текста, тази страница предоставя местоположението на въглищата. Логично е, че в тази част са положени известни усилия, тъй като тя е много лесна за използване и следване.

В опит да насочи потребителя към това къде може да има проблеми, Sonix.ai ще оцвети съдържанието, за да подчертае онези раздели, които са по-малко уверени. Тази функция може да бъде полезна, въпреки че Sonix.ai може да прави грешки дори в онези части, където смята, че транскрипцията има статус „Много уверен“.

Най-добрите аспекти на тази страница са как аудио възпроизвеждането и текстът се синхронизират, така че поставянето на курсора в текста премества позицията за възпроизвеждане в същия раздел.

Наред с обикновеното редактиране е възможно също така да се подчертаят раздели в различни стилове и да се правят бележки, които да вървят до транскрипцията.

Можете също да промените времевия код, особено полезно, ако записът започва с дълга пауза или нежелана преамбюл.

Точност

Sonix описва Sonix.ai като „Най-добрият автоматизиран софтуер за транскрипция, задвижван от авангарден AI“.

Като се има предвид нашето тестване, бихме описали този продукт като силно зависим от качеството на записа и много други фактори, които не могат лесно да бъдат контролирани.

Когато обработвахме нашите класически исторически записи на реч, с някои говорители се получи много трудно, дори ако те ни звучаха ясно.

Тези резултати бяха в ярък контраст с някои по-едновременни записи, където точността беше приемлива, но едва ли звездна.

Заключихме, че подходът, възприет от Sonix, прави няколко предположения, които могат да работят или не, в зависимост от високоговорителя и качеството на записа.

Очарователно е, че услугата ще оцвети транскрипцията си въз основа на това колко е уверена в казаното и този самоанализ е много показателен.

При някои обстоятелства той правилно ще идентифицира, че даден раздел може да е подозрителен, но в други части е уверен, че раздел, който е транскрибирал напълно погрешно.

Изглежда, че няколко често срещани проблема го извиват и един от тях е хората, които не говорят граматически перфектна проза. В стремежа си да направят речта си по-директна, те са премахнали някои думи от изреченията си, създавайки по-драматичен стил. Когато те се транскрибират от Sonix, изглежда решено да се добавят тези думи обратно, за да отговарят на неговия вътрешен граматичен модел, а не на това, което всъщност е било казано.

Преписът се чете по-добре като документ, но не е истински представител на казаното.

Sonix със сигурност е по-добър, когато качеството на записа и яснотата на високоговорителя са високи, както доказахме с малък клип на Стивън Фрай, четящ Хари Потър. Но не е възможно винаги да имаме такъв контрол върху качеството на звука и въпреки това е направил грешки с този тест.

Друга проблемна област са официалните имена и техническите думи или съкращения. Те могат да бъдат адресирани, като ги добавите към персонализирания речник, но това изисква работа, за да може системата да се реализира по-добре, когато се използват имена или съкращения.

За тези, които се нуждаят от перфектна дума за транскрипция, Sonix има селекция от асоциирани професионални транскриптори, които могат да работят чрез запис и да се справят с тези проблеми, но това донякъде нарушава целта на обработената транскрипция.

Сигурност

Фокусът на сигурността на Sonix.ai е сървърите, на които се обработва аудиото и се съхраняват транскрипциите.

Целият трафик се криптира с помощта на TLS (Transport Layer Security) и след като файловете са на сървъра, който е защитен от множество слоеве защитна стена, защита срещу проникване и всички данни се ограждат от AES-256 сървърно криптиране. И компанията обещава, че служителите нямат достъп до записи или транскрипции, освен ако не им бъде дадено изрично разрешение да имат това.

Критичният проблем при този подход е, че обикновено влизане и парола могат да заобиколят всичко това. Sonix.ai няма двуфакторно удостоверяване и няма лесно достъпен дневник кой и кога има достъп до файлове.

От гледна точка на сигурността, това може да се счита за прекомерно разчитане на целостта на тези, които използват системата, за да не споделят записи с други хора извън бизнеса или да запазват потенциално чувствителните файлове, когато напуснат компанията.

Накратко, сигурността трябва да бъде по-добра, а проследяването или активността на потребителите да имат по-голям приоритет.

Окончателна присъда

Имайки предвид относително високата цена, очаквахме Sonix да се представи по-добре от него.

Може би не сме имали късмет с избора си на неща, които да прекодираме, но все пак изглежда е допуснал прекомерно количество грешки.

Положителната страна на това уравнение е, че е бърза и е изключително лесна за използване система, въпреки че бихме препоръчали да стартирате няколко примерни записа чрез това решение, преди да се ангажирате с абонамент.

Най-големият проблем със Sonix е високата цена и дори ако е подходящият инструмент за вашето конкретно изискване, има по-евтини средства за превръщане на звука в текст другаде.

Интересни статии...