Защо езици и диалекти - това са напълно различни неща - Алтернативен изглед

Защо езици и диалекти - това са напълно различни неща - Алтернативен изглед
Защо езици и диалекти - това са напълно различни неща - Алтернативен изглед

Видео: Защо езици и диалекти - това са напълно различни неща - Алтернативен изглед

Видео: Защо езици и диалекти - това са напълно различни неща - Алтернативен изглед
Видео: Настя и сборник весёлых историй 2024, Може
Anonim

Често пъти простите въпроси имат сложни отговори. Например: каква е разликата между език и диалект? Ако решите да попитате лингвист за това, седнете. Въпреки че на пръв поглед няма нищо трудно в този въпрос, на него може да се отговори по различни начини.

Разграничението между език и диалект може да зависи от една или друга гледна точка. От политическа гледна точка езикът е това, което хората обикновено говорят като нация. Например от 1850 до 1992 г. съществува така нареченият сърбохърватски език, който включва няколко диалекта, включително сръбски, хърватски и босненски. Но след като Югославия се раздели на няколко независими държави в средата на 90-те години, тези диалекти бяха признати като отделни езици. Тази политическа дефиниция отчасти работи, въпреки че носи със себе си повече проблеми, отколкото решения: има езици, които се говорят в различни страни, ярък пример за това е испанският в Латинска Америка. Никой не би спорил, че мексиканският и колумбийският испански са различни езици. Вероятно испански, говорено в някои части на Испания,толкова различен от латиноамериканските му разновидности, че заслужава да бъде наречен отделен език, но това не е напълно ясно.

Но какво, ако направим границата между езика и диалекта, водени от критерия за взаимно разбиране? За съжаление и този подход не е идеален. Датчанинът ще разбира шведски малко по-добре от шведски - датски. По същия начин човек, който говори особения селски диалект на британския английски, ще разбере американец от Лос Анджелис много по-добре от американец. Взаимното разбиране често зависи от външни фактори - те са доста неконтролируема променлива - а не от присъщите свойства на самия език.

Така че може би трябва да възприемем чисто лингвистичен подход. Представете си, че можем систематично да измерваме разликата (D) между два варианта на речта. Тогава специфичното значение на D би ни позволило да дефинираме границата между два диалекта и два езика. Намирането на такава стойност не би трябвало да е много трудно, тъй като двата езика могат да бъдат сравнявани според много критерии, като инвентаризация на звука, граматични характеристики или речник.

Но какво, ако разликите между вариациите на речта са постепенни и вероятността да се намери дадена стойност на D е толкова голяма, колкото вероятността да се намери някаква друга стойност? Тогава ще трябва да изберем произволна стойност на D като отправна точка и произволна стойност ще ни върне към съображения от политически или практически характер, които не сме възнамерявали да разгледаме. Искаме ли нашата линия за прекъсване да е на нивото, където сръбският и хърватският са различни езици или един? Каталогизирайки езиците на света, колко хиляди езика искаме да изпратим до забрава: пет? Или седем? Може би десет хиляди?

През последните години бяха преодолени две основни пречки пред различаването между език и диалект. Първият е как да измерим разликите между вариантите на речта - тоест да намерим значението за D. През 2008 г. група лингвисти създадоха програмата за автоматизирано преценяване на сходството (ASJP), ежедневен куратор и основател на която наистина е ваш. ASJP старателно подготви систематичен набор от данни за сравнение на езици, който в момента съдържа 7655 списъка с думи. Те са подходящи за две трети от световните езици, като се приеме, че за нашите цели езиците се дефинират от стандартния код ISO 639-3. Тъй като всеки списък с думи съдържа фиксиран набор от 40 понятия, които се интерпретират последователно, лесно е да ги сравните и по този начин да получите мярка за разликата. Най-често използваната мярка за разлика между две думи е разстоянието на Левенщайн, термин, кръстен на Владимир Левенщайн, съветски учен, който през 1965 г. разработва алгоритъм за сравняване на два символни низа. Той определи "интервал" като минималния брой замествания, вмъквания и заличавания, необходими за трансформиране на един ред в друг. Разстоянието на Левенщайн може полезно да се раздели на дължината на най-дългата от двете линии и по този начин да се поставят всички разстояния в скала от 0 до 1. Това явление е известно като нормализираното разстояние на Левенщайн или LDN. Той определи "интервал" като минималния брой замествания, вмъквания и заличавания, необходими за трансформиране на един ред в друг. Разстоянието на Левенщайн може полезно да се раздели на дължината на най-дългата от двете линии и по този начин да се поставят всички разстояния в скала от 0 до 1. Това явление е известно като нормализираното разстояние на Левенщайн или LDN. Той определи "интервал" като минималния брой замествания, вмъквания и заличавания, необходими за трансформиране на един ред в друг. Разстоянието на Левенщайн може полезно да се раздели на дължината на най-дългата от двете линии и по този начин да се поставят всички разстояния по скала от 0 до 1. Това явление е известно като нормализираното разстояние на Левенщайн или LDN.

Второто препятствие е, че може би „език“и „диалект“са понятия, които могат да бъдат дефинирани само в произволен ред. Тук имаме някои много обнадеждаващи новини за вас. Ако разгледаме всички езикови семейства в базата данни ASJP, където участниците в проекта са включили значителна част от тясно свързани разновидности, можем да започнем да търсим различни видове поведение на езици и диалекти. Пред нас възниква интригуваща картина: разстоянията по правило варират или около относително малка стойност, или около относително голяма, и между тях се образува депресия. Както се оказва, най-често това корито се намира в тесен диапазон, средно около 0,48 LDN. Няма да сгрешим, ако кажем, че вариантите на речта обикновено не са частично сходни помежду си в основния си речник. Или има тенденция към по-голямо сходство, като в този случай вариантите на речта могат да бъдат определени като различни диалекти, или по-малко сходство, като в този случай те могат да бъдат приписани на различни езици. Тук е границата между езика и диалекта.

Това явление вероятно е резултат от социални обстоятелства. Диалектите се разминават, когато хората се установяват в нови територии и формират нови идентичности, но ако все още има някакъв контакт между тях, може да се осъществи сближаване, така че вариантите на речта да останат сходни с повече от 50 процента (и следователно речта е за един език). Лекият тласък към разминаване обаче може да доведе до относително бързо разминаване на езиковите варианти, увеличавайки разстоянието на Левенщайн, като в този случай можем да ги квалифицираме като отделни езици. Може да има връзка между границата за разстоянията между думите в стандартния списък, използван от ASJP, и съответните разстояния в други части на езиковата структура, което може да доведе до сериозна загуба на разбиране. С други думи,прагът на разбиране може да корелира с прага между езиците и диалектите. Все още не сме изучавали този въпрос, но като обект за изследване той е изключително интересен.

Промоционално видео:

След като стигнахме до обективен, а не до произволен критерий за разделяне на езиците от диалектите, можем да го приложим към езиците на света. Някои двойки речеви разновидности, които се считат за национални езици, като босненски и хърватски, са доста под прага на LDN от 0,48 (което означава, че те са един и същ език, независимо от съществуването на Югославия). Недалеч от този праг са езици като хинди и урду (те трудно могат да бъдат наречени два различни езика). А разновидностите на арабски и китайски, които често се разглеждат като едни и същи, се извисяват над LDN = 0,48 (тези разновидности са отделни езици). Всъщност има няколко двойки сортове, които обикновено се считат за различни езици, но варират на границата: например датски и шведски, които имат LDN от 0,4921.

И накрая, техника, получена от набори от данни, наречена ASJP хронология, може да бъде приложена, за да се установи времето, необходимо на диалектите да се отдалечат достатъчно отдалечени, за да се считат за отделни езици. Резултатът, който открихме, е 1059 години, ако не вземем предвид някаква грешка. Тези констатации се подкрепят от това колко време обикновено отнема на родовия език на езиково семейство да се разпадне на дъщерни езици, които по-късно стават предци на подсемейства. За това се нуждаем от други методи за анализ, но резултатите са подобни: отнема около хилядолетие, за да превърнем диалектите в езици. Знаем това, защото вече можем да различаваме едното от другото.

Søren Wichmann е датски лингвист, който си сътрудничи с Лайденския университет (Холандия), Казанския федерален университет (Русия) и Пекинския лингвистичен университет (Китай). Последната му книга „Времева стабилност на лингвистичните типологични характеристики“(2009) е в съавторство с Ерик У. Холман.

Препоръчано: