ОБЩЕЕ ПОЛОЖЕНИЕ
Для
агглютинативного башкирского языка самым эффективным подходом в разработке
спеллера является, по-нашему мнению, порождающий подход, когда задаются все
основы слов (здесь имеется ввиду не только морфологическая основа, но и
всевозможные словообразования) и посредством алгоритма порождаются правильные,
с точки зрения языка, словоизменительные типы (словоформы). Процедуру
порождения словоформы удобно описывать в виде тензора. Само тензорное описание
легко реализовать при программировании посредством операторов цикла и перехода
Ниже нами
рассматривается порождающая модель для имен существительных и
субстантивированных слов башкирского языка.
Представим любую
основу башкирского языка в виде элемента тензора:
ptsafi –
i-я основа,
p, t – определяют фонетическое строение слова (сингармонизм).
p принимает значения 1,2,3,4.
p=1, если слово мягкое, когда последними
гласными в слове являются ә, е, и, ү (беҙҙең);
p=2, если слово твердое, когда последними
гласными в слове являются а, у, ы, я, э (баҙар);
p=3, если слово мягкое и последняя гласная ө (например бөркөт);
p=4, если слово твердое и последняя гласная о ( например болот).
t указывает тип конечного звука и принимает значения
1,2,3,4.
t=1, если конечный звук а, ә, е, э, ы, ө, о, я
t=2, если конечный звук л, м, н, ң, ж, з
t=3, если конечный звук и, ю, у, ҙ, р, й, ү
t=4, если конечный звук б, в, г, д, п, ч, т, ҡ, к, ф, с, ҫ, һ, ш, х, ц, щ,
f – определяет тип
изменений в конечном звуке основы при присоединении афиксов.
f=1 означает отсутствие фонетических
изменений в конечном звуке основы;
f=2 описывает ситуацию перехода конечной
согласной -п в -б при присоединении аффикса,
начинающегося с гласной (китап: китабы,
китабым, китаптар, китаптың …);
f=4
описывает ситуацию перехода конечной конечной
согласной -ҡ
в –ғ при присоединении аффикса, начинающегося на гласную
(таяҡ: таяғы, таяғың, таяҡтар, таяҡтың
…). Если предыдущий звук согласный, то изменений нет (ҡырҡ, ҡарҡы, ҡырҡам,
ҡырҡа).
s – определяет
принадлежность слова.
s=1 — исконно башкирские
и ранние заимствованные слова, претерпевшие фонетическую адаптацию в языке
(например: бүҙәнә,
бүрәнә);
s=2 — поздние заимствования из русского
языка, имеющие значительные отличия при
словоизменении (изменения в корне и в типах аффиксов словоизменения,
например: лагерь: лагерҙан,
лагерға; волость: волосҡа, волостан, волосы);
s=3 — заимствования из арабского и
персидского языков, имеющие отличия при словоизменении (в выборе аффиксов
словоизменения, например ғалим — ғалимға,
ғалимды).