Как работи изкуственият интелект: разпознаване на реч - Алтернативен изглед

Съдържание:

Как работи изкуственият интелект: разпознаване на реч - Алтернативен изглед
Как работи изкуственият интелект: разпознаване на реч - Алтернативен изглед

Видео: Как работи изкуственият интелект: разпознаване на реч - Алтернативен изглед

Видео: Как работи изкуственият интелект: разпознаване на реч - Алтернативен изглед
Видео: Компьютер и Мозг | Биология Цифровизации 0.1 | 001 2024, Септември
Anonim

Всеки от нас е изправен пред такова мистериозно явление като изкуствения интелект в ежедневието - именно той позволява на гласовите асистенти и търсачките да разпознават човешката реч и да отгатват желанията на потребителите. Днес ще поговорим за това как точно е подредена тази технология и какви перспективи очакват тази област на развитие в близко бъдеще.

Изкуственият интелект е много широко понятие, в рамките на което вече съществуват и все още се разработват много алгоритми, предназначени за изпълнение на широк спектър от практически задачи. Но на какво са способни съвременните програми за изкуствен интелект и на какви принципи се ръководят по време на своята работа? Днес ще говорим за една от основните характеристики на машинния ум, с която всеки от нас редовно се среща в ежедневието - способността на гласовите асистенти да разпознават човешката реч.

Гласово разпознаване

За да измерва гласа, програмата използва редица параметри на звука: честотата и дължината на звуковата вълна в определен момент. Например, когато разговаряте с популярния гласов асистент Alexa, софтуерът разделя вашия глас на 25-милисекундни слайдове и след това преобразува всеки от сегментите в цифрови подписи. След това блоковете за подпис се сравняват с вътрешния каталог на звуци на програмата, докато броят на съвпаденията е достатъчно висок, за да може AI да "преведе" числата в азбучна заявка, която той разбира.

Image
Image

Гледайте екрана на телефона си, докато използвате Siri или Google Assistant и ще видите, че речникът се променя, докато изговаряте думите. Това се случва поради факта, че с всяка следваща "стъпка" софтуерът сравнява също получения резултат с вътрешната база данни и изгражда думи в зависимост от съвпаденията. Според Рохит Прасад, главен учен в отдел Алекса на Алекса, „езиковият модел научава много милиарди думи под формата на текст“. Подреждането на думи също играе важна роля: това може да се забележи с помощта на обичайната търсачка Google, която понякога дава различни данни за идентични заявки, в които са пренаредени само няколко думи.

Промоционално видео:

Перспективи на разпознаване на речта

Алън Блек от Института за езикови технологии на Карнеги твърди, че за всички професионалисти в големите компании най-интересното е да намерят лимита на собствената си система. "Когато програмата каже:" Не мога да направя това ", ситуацията става наистина интересна", шегува се той. Това обаче наистина е така: отговарянето на непредсказуеми потребителски заявки дори е една от основните задачи, които студентските кръгове, които се състезават за наградата Алекса - и това са 2,5 милиона долара, разследват. Тяхната задача е да създадат чатбот, предназначен да общува с хора, които задават последователни и смислени въпроси. Информацията в този случай се актуализира на всеки 20 минути. Звучи като доста лесна задача дори за средностатистически програмист,но на практика комуникацията на програмата с реални хора винаги е свързана с отклонения от темата за диалога, спонтанните фрази и други нарушения. Програма, която се научи да работи с тях, както и с истински човек, ще бъде огромен пробив за цялата индустрия на ИИ.

Василий Макаров

Препоръчано: