Преглед на Google Voice Typing

Става все по-разпространено използването на глас за управление на домовете и компютрите ни. Където само преди десетилетие да помолите Alexa или Google Home да контролират осветлението или да поръчат продукт от интернет може да изглеждаше необичайно, но сега това е норма.

Една от компаниите, които са инвестирали най-много в този вид технология, е Google, която позволява на техните устройства Google Home и Android системи да приемат устни команди и дори да разпознават говорителя.

Днес ще разгледаме как те са свързали тази технология със своята платформа на Google Docs и ще помислим дали това е жизнеспособна алтернатива на други търговски решения за глас в текст.

Ценообразуване

Софтуерът е включен в Google Docs и по своята същност е безплатен. Всичко, от което се нуждаете, е Google акаунт и мобилно устройство, или компютър с микрофон. Google е друг източник на данни за събиране, но това е част от цената на „безплатно“ в наши дни.

Дизайн

Възможно е да използвате глас за въвеждане в Google Docs, функцията се нарича ‘Voice Typing’ и може да бъде намерена в менюто Tools на Google Doc или в Google Slides. Той може да бъде активиран на всяко място с помощта на клавишната комбинация Ctrl-Shift-S.

Когато го активирате за първи път, ще бъдете помолени да санкционирате достъпа до микрофона за docs.google.com.

След като приемете, че се появява малка кутия с лого на микрофона, можете да щракнете, за да активирате гласовото въвеждане. След това се заменя с червен символ на микрофона до документа, за да покаже, че системата е в режим на слушане.

Преди да активирате гласовото въвеждане на контролния панел, можете да изберете език от меню и тъй като това е Google, има много възможности за избор. Можете също така да щракнете върху въпросителен знак и да получите помощ за това как да използвате системата.

Тъй като тези системи вървят, това е силно кондензирано решение.

Google ще обработи това, което казвате, доколкото е възможно и ако системата не е сигурна точно за дадена дума, ще го подчертае в сиво. След това върху тези „подозрителни“ думи може да се щракне и да се предоставят някои алтернативи от системата.

Но можете бързо да се придвижите около документ и да поправите проблемите ръчно или да поставите курсора и да му дадете още един удар с гласово въвеждане.

Ако трябва да говорите с друг човек, докато работите, можете да помолите Google да спре да слуша и след това да възобновите след това.

Но за да получите пълните възможности на това решение, има дълъг списък от команди, които трябва да бъдат запомнени, които могат да копират, поставят, преместват документа, вмъкват таблици и безброй други функции.

И можете да вмъкнете пунктуация, да форматирате документа и дори да вмъкнете хипервръзки.

Но извличането на максимума от него предполага, че можете да запомните командите или да имате отворена помощ за раздвижване на паметта.

Списъкът е бързо достъпен, като казвате „Списък с гласови команди“, удобно.

Езици

Когато много решения за глас в текст обхващат само малък брой езици, Google има значително количество. Текущият окончателен списък е:

Африкаанс, амхарски, арабски, арабски (Алжир), арабски (Бахрейн), арабски (Египет), арабски (Израел), арабски (Йордания), арабски (Кувейт), арабски (Ливан), арабски (Мароко), арабски (Оман) , Арабски (Палестина), арабски (Катар), арабски (Саудитска Арабия), арабски (Тунис), арабски (Обединени арабски емирства), арменски, азербайджански, бахаса Индонезия, баски, бенгалски (Бангладеш), бенгалски (Индия), български, Каталонски, китайски (опростен), китайски (традиционен), китайски (Хонконг), хърватски, чешки, датски, холандски, английски (Австралия), английски (Канада), английски (Гана), английски (Индия), английски (Ирландия) , Английски (Кения), английски (Нова Зеландия), английски (Нигерия), английски (Филипини), английски (Южна Африка), английски (Танзания), английски (Великобритания), английски (САЩ), фарси, филипински, финландски, френски , Галисийски, грузински, немски, гръцки, гуджарати, иврит, хинди, унгарски, исландски, италиански, италиански (Италия), италиански (Швейцария), японски, явански, каннада, кхмерски, корейски, лаоски, латвийски, литовски, малаялам, Малайзия n, маратхи, непалски, норвежки, полски, португалски (Бразилия), португалски (Португалия), румънски, руски, словашки, словенски, сръбски, синхалски, испански, испански (Аржентина), испански (Боливия), испански (Чили), испански (Колумбия), испански (Коста Рика), испански (Еквадор), испански (Ел Салвадор), испански (Испания), испански (САЩ), испански (Гватемала), испански (Хондурас), испански (Латинска Америка), испански (Мексико) ), Испански (Никарагуа), испански (Панама), испански (Парагвай), испански (Перу), испански (Пуерто Рико), испански (Уругвай), испански (Венецуела), сундански, суахили (Кения), суахили (Танзания), Шведски, тамилски (Индия), тамилски (Малайзия), тамилски (Сингапур), тамилски (Шри Ланка), тайландски, турски, украински, урду (Индия), урду (Пакистан), виетнамски и зулуски.

Това са 119 езика, включително 13 арабски форми, 19 испански вариации, 13 английски диалекта и дори четири вкуса на тамил.

Включени са езици, които рядко се поддържат от софтуер за диктовки, като зулу и исландски, поради относително малкия брой говорители.

Езиковото покритие е може би най-голямата сила на Google Voice Typing.

Записи

Ако това решение има слабост, то е, че не може лесно да обработва записите.

Макар че не е невъзможно да го накарате да направи това, но е необходимо да се коригира аудио системата на компютъра, така че да приема изход, предназначен за високоговорителите, и да го насочва, сякаш идва от микрофона. Но това не ви позволява да правите разлика между различните хора в записите и може да попречи на AI, който Google използва, за да подобри вербалната точност, като научите как говорите.

Ако искате да транскрибирате подкасти или записани интервюта, препоръчваме ви да използвате нещо друго, тъй като този инструмент не е създаден за тази цел.

Точност

Трудно е да се прецени точността на система за гласова обработка, когато не можете да й изпратите същите записи, които други продукти са преобразували. И всеки, който използва Alexa или Google Home редовно, ще знае, че понякога няма да ни разбере, най-вече поради чужди звуци или непостоянно говорене.

Това каза, че в активното тестване, което направихме, този инструмент обикновено прави повечето думи правилни, или правилната дума беше бързо достъпна в менюто със съмнителни думи.

За да получите най-добри резултати, е необходим известен контрол, който да бъде показан в скоростта, силата на звука и тона на говорене, нещо, което несъмнено идва с практиката. Също така, възможността да запомните всички специални команди може да намали критично количеството редакции след запис.

В зависимост от вашите очаквания, точността тук е приемлива. Има последователност в неговите интерпретации, които той поддържа по време на нашите тестове. Колко добре работи за вас, не можем да предскажем. Но тъй като е безплатно, няма да струва нищо друго освен вашето време, за да го определите.

Сигурност

Тъй като това е Google, моделът за сигурност е същият, който контролира достъпа до всички акаунти в Google. Това варира от проста защита с парола до по-разумна до двуфакторна методология за удостоверяване (TFA).

Като се има предвид броят на крадците на самоличности наоколо, тези, които използват Google без TFA, са изложени на значителен риск от компрометиране на техните акаунти.

Дори тази опция за сигурност има своите ограничения, но е по-добра от просто парола.

За тези, които не са достатъчно параноични, силно препоръчваме да отидете на https://myactivity.google.com/myactivity

И ще видите какво Google събира ежедневно върху вас и това може да включва записи на гласовите ви команди.

Окончателна присъда

Това може да е по-дълъг преглед, ако този софтуер предлага повече функционалност, но не го прави.

Тъй като решенията за глас в текст отиват, това не е сложно, но има достатъчно функционалност, за да бъде истински полезно.

Изградени са други решения за справяне с транскрибирането на разговори между множество хора, като това е проектирано да се справи с един човек, който говори контролирано и точно.

Използването му предполага, че с удоволствие използвате Google и Google Docs, дори това да не е крайната дестинация на въведения от вас текст.

Не е задължително да копирате диктовка за поставяне от Google Docs в друго приложение и ще имате облачно копие за справка, ако в крайна сметка се нуждаете от такова.

Разбираемо е, че някои потребители имат проблеми с подхранването на ненаситния апетит на Google към потребителски данни и този механизъм е още един източник на данни, за да го закуси.

Ако се чувствате така, няма да използвате Google Voice Typing или каквото и да било от Google.

За тези, които желаят да приемат колко много Google може да знае за тях, тогава решението за гласово диктуване в Google Docs е достатъчно способно за общо ползване, особено ако имате нужда от тази функция само от време на време.

Интересни статии...