Учените са обучили невронна мрежа, за да определят пола на човек от написания текст - Алтернативен изглед

Учените са обучили невронна мрежа, за да определят пола на човек от написания текст - Алтернативен изглед
Учените са обучили невронна мрежа, за да определят пола на човек от написания текст - Алтернативен изглед

Видео: Учените са обучили невронна мрежа, за да определят пола на човек от написания текст - Алтернативен изглед

Видео: Учените са обучили невронна мрежа, за да определят пола на човек от написания текст - Алтернативен изглед
Видео: Рай или забвение 2024, Може
Anonim

Екип от учени от Националния изследователски ядрен университет "MEPhI", Националния изследователски център "Курчатов институт" и Воронежския държавен университет са разработили метод, който учи компютър да разпознава пола на човек от текст, написан от него с точност от 80 процента. Научното развитие принадлежи към областта на компютърната лингвистика. Изследването е проведено с безвъзмездна финансова помощ от Руската научна фондация. Резултатите са публикувани в списанието Procedia Computer Science.

Множество научни изследвания показват, че писменият текст неизбежно отразява характеристиките на неговия автор - пол, психологически характеристики, ниво на образование. Речта е ценен психодиагностичен инструмент, използван от специалисти по човешки ресурси на големи компании, както и служби за сигурност.

Въз основа на анализа на речта е възможно да се диагностицира наличието на определени заболявания у човек (деменция, депресия) и склонност към суицидно поведение. Необходимостта от установяване на характеристиките на автора на текста нараства и с развитието на интернет комуникациите: за компаниите е важно да знаят кои групи хора харесват своите продукти и услуги.

Учените, работещи в тази област (лингвисти, психолози, специалисти по информационни технологии), въз основа на числовите стойности на различни параметри на текста изграждат математически модели за диагностициране на определени параметри на личността.

Екип от експерти анализираха ефективността на различните технологии за машинно обучение, използвайки невронни мрежи за анализ на текст.

В хода на изследването те сравниха точността на решаването на проблема за идентифициране на пола на текстове въз основа на два подхода за моделиране на база данни: от една страна, алгоритми за машинно обучение (поддръжка на векторна машина и увеличаване на градиентите), от друга страна, дълбоко учене на невронни мрежи (конволюционни невронни мрежи и повтарящи се невронни мрежи с дълга краткосрочна памет).

„Постигнахме високи резултати при определянето на пола на автора на текста благодарение на усъвършенствани модели на невронната мрежа, в условия, когато авторът не крие пола си. Следващата задача е да се определи полът по отношение на умишленото му укриване “, казва Александър Сбоев, доцент в NRNU MEPhI.

Така в следващите текстове, които първоначално бяха публикувани в сайт за запознанства, невронната мрежа лесно намира улов в десет от десет случая, освен това авторът умишлено поставя в подписа името на противоположния пол.

Промоционално видео:

Текстът е написан от момиче: „Аз съм красив, мускулест мъж на 30 години. Работя за голяма нефтена и газова компания на добра позиция с прилична заплата. Живея в собствен апартамент в Москва. Имотът разполага и с малка, но хубава къща в едно от селата в Италия. Обожавам спорта, в частност футбола. Обичам да излизам за уикенда, мразя да стоя вкъщи. Момиче, което би ме устройвало, трябва да има скромно разположение, добър външен вид и привлекателна фигура според съвременните стандарти. Тя трябва да споделя моите интереси, не трябва да ревнува и не трябва да се опитва да ме кара да ревнувам. Няма да подкрепя момичето, защото вярвам, че и двете трябва да работят в семейството. Аз също предпочитам да пазя бюджета отделно. Няма да търпя предателство."

Текстът е написан от човек: „Здравей! Аз съм изключително нещастен, изключително! Защо се държиш така с нас ?! Ние също сме хора, всички сме равни! Сексистки ли сте? Няма да приемам това повече! Ще ти разбия колата навсякъде, ще я нарисувам. Чакай, нечовешки. Ще завърша по този начин."

Резултатите от това проучване показват, че подход, основан на използването на конволюционни невронни мрежи и методи за дълбоко обучение за разпознаване на пола на човека, написал текста, е най-оптималният.

Сега група изследователи работят върху проблема с признаването на възрастта.