Aglutinación

De Wikipedia, la enciclopedia libre
Saltar a navegación , búsqueda
El signo está en medio húngaro , que aglutina ampliamente. (Los signos superiores e inferiores están en rumano y alemán , respectivamente, los dos idiomas inflexiones .)

En contemporáneos lingüística , la aglutinación por lo general se refiere al tipo de morfología de derivación en la que hay una correspondencia uno a uno entre los afijos y sintácticas categorías. Idiomas que utilizan ampliamente aglutinación se llaman lenguas aglutinantes .

Lenguas aglutinantes son a menudo contrasta con los dos idiomas en los que se expresa la estructura sintáctica únicamente por medio de la palabra de otras palabras y auxiliares ( lenguas aislantes ) y con idiomas en los que un solo afijo expresa típicamente varias categorías sintácticas y una categoría única puede ser expresada por varios diferentes afijos (como es el caso de inflexión (fusional) idiomas ). Sin embargo, los dos idiomas fusional y el aislamiento pueden utilizar aglutinación en las construcciones de más de uso frecuente, y el uso de aglutinación fuertemente en ciertos contextos, como derivación de la palabra. Este es el caso de Inglés , que tiene una marca de plural aglutinado - (e) s, y palabras derivadas como la vergüenza · · menos Ness.

Sufijos aglutinantes se insertan a menudo con independencia de las fronteras silábicas , por ejemplo, mediante la adición de una consonante a la coda de la sílaba como en empate Inglés - atar s. Lenguas aglutinantes también tienen grandes inventarios de enclíticos , también, que pueden ser y son separadas de la raíz de la palabra por los hablantes nativos en el uso diario.

Tenga en cuenta que la aglutinación término a veces se utiliza más generalmente para referirse al proceso morfológico de la adición de sufijos o morfemas otros a la base de una palabra. Esto se trata con más detalle en la sección sobre otros usos del término .

Contenido

[ editar ] Ejemplos de lenguas aglutinantes

Ejemplos de lenguas aglutinantes incluyen las lenguas urálicas , como el finés , estonio y húngaro . Estos han aglutinado muy expresiones en el uso diario, y la mayoría de las palabras son bisílabas o más. La información gramatical expresada por adposiciones en Western lenguas indoeuropeas se encuentra típicamente en sufijos.

Húngaro utiliza aglutinación extenso en parte casi todo y nada de eso. Los sufijos se suceden en orden especial, y pueden ser apilados en cantidad extrema, lo que resulta palabras transmiten significados complejos en forma muy compacta. Un ejemplo es fiaiéi donde la raíz "fi-" significa "hijo", los siguientes 4 vocales son todos los sufijos separados, y significa la palabra completa "[Propiedades] de su su / hijos". La estructura anidada posesivos y plurales de expresión es bastante notable (tenga en cuenta que Hungría no utiliza géneros).

La aglutinación se utiliza muy fuertemente en algunos nativos americanos idiomas , como el idioma inuit, náhuatl , quechua , Tz'utujil , Kaqchikel , Cha'palaachi y K'iche ' , donde una palabra puede contener suficientes morfemas para expresar el significado de lo que sería un complejo de oración en otros idiomas. La aglutinación es también una característica común de los vascos . Las conjugaciones de los verbos, por ejemplo, se llevan a cabo mediante la adición de diferentes prefijos o sufijos a la raíz del verbo: dakartzat, que significa "los haré ', está formada por da (indica tiempo presente), kar (raíz del verbo ekarri -> traer), tza (plural indica) y t (indica sujeto, en este caso, "I"). Otro ejemplo sería la declinación: Etxean = "En la casa" donde etxe = casa.

Casi todas las lenguas de las Filipinas también pertenecen a esta categoría. Esto les permite, sobre todo filipino , para formar nuevas palabras a partir de formas básicas simples. Un ejemplo es nakakapagpabagabag, lo que significa hacer que alguien o algo que molesta y se forma a partir de la bagabag raíz, lo que significa alterar / molesto.

Japón también es una lengua aglutinante, añadiendo información, como negación , pasiva voz , pasado tenso , honorífico título y la causalidad en la forma verbal. Los ejemplos más comunes sería hatarakaseraretara (???????), que combina conjugaciones causante, pasivos o potenciales, y condicionada a llegar menos dos significados dependiendo del contexto "si (sujeto) se había hecho para trabajar ..." y "si (sujeto) podría hacer (objeto) de trabajo", y tabetakunakatta (????????), que combina deseo, negación y conjugaciones en tiempo pasado a significar "(sujeto) no quería comer".

Turco es un idioma aglutinante: la expresión Çekoslovakyal?la?t?ramad?klar?m?zdanm??ças?na se pronuncia como una palabra en turco, pero puede ser traducido al Inglés como "como si fuera uno de aquellos a los que no hemos podido hacer asemejan a los checoslovacos".

Todas las lenguas drávidas , incluyendo Kannada , Telugu , Malayalam y Tamil , son aglutinante. La aglutinación se utiliza en grados muy altos tanto en las formas formales por escrito en telugu (por ejemplo Suryodayam "surya = sol + Udayam = inicio - Suryodayam = salida del sol") y en formas habladas coloquiales de la lengua (por ejemplo Himalayam "Hima = + Snow = Alayam Templo. "- Himalaya") Extreme grado de aglutinación se puede ver en la literatura histórica Telugu como Manu Charitra, "Ata jani Kanche bhoomisurudambara chumbi sirasara jhari patala muhurmuhur lutabhanga taranga mrudanga niswana sputanatananukula paripulla kalapi jalamul Kataka charatkarenu kara kampitha salmu sita sailamun"

Esperanto es una construcción auxiliar lenguaje con una gramática muy regular y morfología palabra aglutinante. Ver vocabulario Esperanto .

Mientras aglutinación es característico de ciertas familias lingüísticas, sería fácil para saltar a la conclusión de que cuando varios idiomas en la zona geográfica similar son aglutinante, que necesariamente tienen que estar relacionados en el sentido filogenético. En particular, tal conclusión dirigido anteriormente lingüistas a proponer el llamado Ural-altaica familia de lenguas que (en el mayor alcance jamás propuesto) son lenguas urálicas y turco, así como mongoles, coreanos y japoneses. Sin embargo, la lingüística contemporánea considera que esta propuesta tan controvertida. [1]

Por otro lado, también es el caso de que algunas lenguas que se han desarrollado a partir de aglutinantes proto-lenguas han perdido esta característica. Por ejemplo, contemporáneo estonio, que está tan estrechamente emparentada con el finés que las dos lenguas son mutuamente inteligibles, [2] se ha desplazado hacia el tipo fusional. [3] (Se ha perdido también otras características típicas de las familias Urales, como vocal armonía).

[ edit ] Slots

Como se señaló anteriormente, es una característica típica de lenguas aglutinantes que hay una correspondencia uno-a-uno entre los sufijos y categorías gramaticales. Por ejemplo, un sustantivo puede tener marcadores separados para número, caso, el uso del posesivo o conjuntivo, etc El orden de estos afijos es fijo, por lo que puede ver cualquier sustantivo o un verbo dado como madre seguido de varias ranuras de inflexión, es decir, en las posiciones que sufijos flexivos puede ocurrir. A menudo es el caso que el ejemplo más común de una determinada categoría gramatical es no marcado, es decir, el afijo correspondiente está vacío.

El número de ranuras para una parte dada de expresión puede ser sorprendentemente alta. Por ejemplo, un finito coreano verbo tiene siete ranuras (los paréntesis indican las partes de morfemas que pueden ser omitidas en algunos entornos fonológicos): [4]

  1. honorífico: - (U) si se usa cuando el altavoz está honrando el sujeto de la oración
  2. tenso: (?) s 'para completo (pasado) la acción o estado, cuando esta ranura está vacía, el tiempo se interpreta como presente
  3. experiencial-contrastivo aspecto: (?) s 'doblar el marcador pasado significa "el sujeto ha tenido la experiencia descrita por el verbo"
  4. modal: kes "se utiliza con la primera persona-sujetos sólo para el futuro definido y con la segunda o en tercera persona-sujeto también para el presente o el pasado probable
  5. formal: (SU) pni expresa cortesía al oyente
  6. retrospectivo aspecto: t? indica que el altavoz recuerda lo que observó en el pasado y en los informes de la situación actual
  7. estado de ánimo: ta para k'a declarativo, por interrogativa, imperativa para la, ca para propositiva, yo por declarativo cortés y un gran número de otros marcadores del estado de ánimo posibles

Además, las formas verbales pasivas y causal puede derivarse mediante la adición de sufijos a la base, que podría ser visto como la ranura nula-ésimo, sin embargo, elementos pasivos no se utiliza tan comúnmente como los verbos en inglés y muchos no permiten pasivización en absoluto.

A pesar de que algunas combinaciones de sufijos no son posibles (por ejemplo, sólo una de las ranuras de aspecto puede ser llenado con un sufijo no vacío), más de 400 formas verbales pueden formarse a partir de una sola base. Aquí están algunos ejemplos formados a partir de la raíz de la palabra ka `ir ', los números indican que contienen ranuras no vacías sufijos:

  • 7 (marcador modo imperativo): imperativo sufijo-la combina con la raíz ka-para expresar imperativo: ka-la 'Go';
  • 7 (marcador de estado de ánimo propositivo): si queremos expresar la proposición en lugar de comando, se utiliza el estado de ánimo propositivo marcador-ca en lugar de la-: ka-ca `Vamos '
  • 5 y 7: Si el hablante quiere mostrar respeto por el oyente, él usa la cortesía marcadores pni (en la ranura 5); diversos marcadores del estado de ánimo pueden utilizarse simultáneamente (en la ranura 7, por lo tanto, después de que el marcador de cortesía): ka-pni -ta `Va., ka-pni-k'a?` ¿Va?
  • 6: aspecto retrospectivo: John i cip e ka-t? la `He observado que Juan se iba a casa y ahora me estoy informando eso.
  • 7: simple indicativo: s?nsæ?nim i cip e ka-n-ta `El maestro se va a casa. (No expresar respeto o cortesía) '
  • 5 y 7: cortesía hacia el oyente: s?nsæ?nim i cip e ka-pni-ta o s?nsæ?nim i cip e ka-yo ', el profesor se va a casa ".
  • 1 y 7: respeto hacia el sujeto:. S?nsæ?nim i cip e ka-si-n-ta `El maestro (respetado) se va a casa '
  • 1, 5 y 7: dos clases de cortesía en una frase: s?nsæ?nim i cip e ka-si-?yo o s?nsæ?nim i cip e ka-si-pni-ta `El maestro se va a casa. (Expresando respeto tanto para el oyente y el maestro) '
  • 2, 3 y 7: formas del pasado: John hakkyo e i-ka-ta `S 'Juan ha ido a la escuela (y hay ahora), Juan i hakkyo e-ka-s'?s'-ta` John ha. ido a la escuela (y ha regresado).
  • 4 y 7: modal primera persona: Nae næil ka ka-kes'-ta `iré mañana".
  • 4 y 7: modal tercera persona.: John næil ka ka-kes'-ta `Supongo que Juan irá mañana., John ka ka-as kes'-ta` Supongo que ayer Juan izquierda "

[ edit ] sufijo o prefijo

Mientras que los idiomas más aglutinantes en Europa y Asia utilizan predominantemente sufijo, las lenguas bantúes del sur de África se caracterizan por una mezcla muy compleja de prefijos, sufijos y reduplicación. Un rasgo característico de esta familia lingüística es que los sustantivos se dividen en clases nominales. Para cada clase de sustantivo, hay prefijos específicos singular y plural, que también sirven como marcadores de concordancia entre el sujeto y el verbo. Por otra parte, el sustantivo determina prefijos de todas las palabras que lo modifiquen y sujeto determina prefijos de otros elementos en el mismo verbo-frase. Por ejemplo, los nombres Swahili-toto 'niño' y `-tu persona cae en la clase 1, con prefijo singular y plural m-prefijo wa-, mientras que-tabu 'libro' cae en la clase 7, con el prefijo singular y plural ki- prefijo vi. [5] Las siguientes frases se pueden formar:

  • m-toto a-li-fika `El niño llegó.
  • m-toto a-ta-fika `El niño va a llegar."
  • wa-wa toto-li-fika `Los niños llegaron.
  • wa-wa-ta toto-fika `Los niños van a llegar."
  • m-tu a-li-lala 'La persona que dormía.
  • m-tu a-ta-lala 'La persona que va a dormir.
  • wa wa-tu-li-lala 'Las personas dormían.
  • wa wa-tu-ta-lala 'Las personas van a dormir.
  • ki-ki-li tabu-anguka `El libro cayó.
  • ki-ki-ta tabu-anguka `El libro caerá.
  • vi-tabú vi-li-anguka `Los libros cayeron.
  • vi-tabú vi-ta-anguka `Los libros se caen.

yu-le-1sg que

m-tu-1sg persona

m-moja 1sg-uno

m-refu 1sg de altura

a-li 1sg-he-pasado

ye 7SG-rel-it

ki-soma 7SG de lectura

ki-le-7SG que

ki-tabú 7SG-book

ki-refu 7SG de duración

`Que una persona alta que leer ese libro largo.

wa-le-1pl que

wa-tu-1 pl persona

wa-wili 1 pl y dos

wa-1 pl refu-alto

wa-li 1PL-he-pasado

(W)-O-rel-7pl lo

vi-soma 7pl de lectura

vi-le-7pl que

vi-tabú 7pl-book

vi-refu 7pl de duración

`Esas dos personas altas que leen esos libros largos."

[ editar ] La aglutinación en el contexto de la lingüística cuantitativa

Ya hemos mencionado el hecho de que la mayoría de los idiomas que se incluyen flexiva, aglutinante y el aislamiento de las construcciones lado a lado. El lingüista norteamericano Joseph Harold Greenberg en 1960 su papel Una aproximación cuantitativa a la tipología morfológica de la lengua propone utilizar el índice aglutinante llamado para calcular un valor numérico que permita a un investigador para comparar el "grado de agglutitativeness" de varios idiomas. Para Greenberg, aglutinación significa que los morfos se unen sólo con una ligera modificación o no. [6] Un morfema se dice que es automática si se adopta una forma única superficie (morph), o si su forma de la superficie está determinada por las reglas fonológicas que mantener en todos los casos similares en ese idioma. [7] Una coyuntura morph - una posición en una palabra donde dos morfos cumplir - se considera aglutinante cuando ambos incluidos morfemas son automáticos. El índice de aglutinación es igual a la relación media del número de junturas aglutinantes para el número de junturas morph. Idiomas con altos valores del índice son aglutinante aglutinante y con valores bajos del índice aglutinante son fusional.

En el mismo documento, Greenberg propuso varios otros índices, muchos de los cuales resultan ser relevantes para el estudio de la aglutinación. El índice sintético es el número promedio de morfemas por palabra, con el valor más bajo concebible igual a 1 para aislar (analítico) lenguas y valores de la vida real rara vez exceden 3. El índice de la composición es igual al número medio de morfemas de raíz por palabra (en oposición a morfemas derivativos y flexivas). Los derivativos, índices de inflexión, prefixial y suffixial corresponden, respectivamente, a la media de los morfemas derivativos y flexiva, prefijos y sufijos.

Aquí hay una tabla de valores de muestra: [8]

aglutinación síntesis agravando derivación inflexión anteponiendo sufijo
Swahili 0,67 2,56 1,00 0,03 0,31 0,45 0,16
habla turco 0,67 1,75 1,04 0,06 0,38 0,00 0,44
escrito turco 0,60 2,33 1,00 0,11 0,43 0,00 0,54
Yakut 0,51 2,17 1,02 0,16 0,38 0,00 0,53
Griego 0,40 1,82 1,02 0,07 0,37 0,02 0,42
Inglés 0,30 1,67 1,00 0,09 0,32 0,02 0,38
Esquimal 0,03 3,70 1,00 0,34 0,47 0,00 0,73

[ editar ] Fonética y aglutinación

La relación de uno a uno entre un afijo y su función gramatical puede ser algo complicado por los procesos fonológicos activos en el lenguaje determinado. Por ejemplo, las siguientes dos fenómenos fonológicos aparecen en muchas de las lenguas urálicas , y este último también en lenguas altaicas :

  • gradación consonante , lo que significa que hay alternancia entre ciertos pares de grupos de consonantes tales que un miembro de la pareja aparece al principio de una sílaba abierta y el otro en el comienzo de una sílaba cerrada ;
  • armonía vocal , lo que significa que sólo las subclases específicas de las vocales coexistir en una palabra no-compuesto.

Varios ejemplos de Finlandia a ilustrar cómo estas dos reglas y otros procesos fonológicos conducir a desviaciones de la básica-a-uno entre morfos y su función sintáctica y semántica. No hay una regla fonológica se aplica en la conjugación de talo `casa '. Sin embargo, el segundo ejemplo ilustra varios tipos de fenómenos fonológicos. [9] [10]

talo
`Casa '
Marka paita
`Una camisa mojada '
Las raíces contienen consonantes clusters-rk-y-t-
talo-n
`De la 'casa
Mara-n-n Paida
`De una camisa mojada"
gradación consonante: el sufijo genitivo-n cierra la sílaba precedente;
rk -> r, t> d
talo-ssa
'En la' casa
Mara-ssa ssa Paida-
`En una camiseta mojada"
armonía vocal: una palabra que contiene una no puede contener las vocales a, o, u;
un alomorfo de la terminación inessive -ssa/ssä se utiliza
talo-i-ssa
'En el' casas
Mar-i-ssa paido-i-ssa
`Con camisetas mojadas '
reglas fonológicas implican también cambios vocálicos diferentes, cuando el marcador de plural-i-conoce a un vocal de la raíz de final

[ editar ] Los extremos de aglutinación

Es posible construir artificiales ejemplos extremos de aglutinación, que no tienen un uso real, pero ilustran la capacidad teórica de la gramática de aglutinar. Esto no es una cuestión de "palabras largas", ya que algunos lenguajes permiten combinaciones ilimitadas con palabras compuestas, negativas o clíticos tales, que pueden ser (y son) expresados ??con una estructura analítica en uso real.

Inglés es capaz de aglutinar morfemas de sólo germánico origen, como un-todo-algunos-ness, pero en términos generales las palabras más largas son ensambladas a partir de las formas de latín o griego antiguo origen. El ejemplo clásico es antidisestablishmentarianism . Lenguas aglutinantes suelen tener aglutinación derivacional más complejo que el aislamiento de los idiomas, para que puedan hacer lo mismo en un grado mucho mayor. Por ejemplo, en Hungría, una palabra tal como elnemzetietleníthetetlenségnek, que significa "para [los efectos de] undenationalizationability" puede encontrar uso real. De la misma manera, no son las palabras que tienen su significado, pero probablemente nunca se usan como legeslegmegszentségteleníttethetetlenebbjeitekként, que significa "como la mayoría de la mayoría de los undesecratable de ti", pero difícil de descifrar en su significado cuando escuché por hablantes nativos. Uso de aglutinación de flexión, estos pueden ser extendido. Por ejemplo, el oficial de Guinness récord mundial es epäjärjestelmällistyttämättömyydellänsäkäänköhän finlandés "Me pregunto si - incluso con su / su calidad de no haber sido sistematizada". Tiene las epäjärjestelmällistyttämättömyys palabra derivada como la raíz y se alarga con la inflexión terminaciones-llänsäkäänköhän. Sin embargo, esta palabra es gramaticalmente inusual, ya que-Kaan "también" se utiliza sólo en los puntos negativos, pero-ko (pregunta) sólo en los puntos de interrogación.

Una aglutinación turco muy popular es Çekoslovakyal?la?t?ramad?klar?m?zdan m?yd?n?z?, Que en realidad es una sola palabra, sin embargo, los sufijos de interrogación (m?yd?n?z en este caso) se escriben por separado y la palabra significa Has sido tú uno de los que no hemos podido asimilar como un checoslovaco?. Esta referencia histórica se utiliza como una broma para los individuos que son difíciles de cambiar o aquellos que sobresalen en un grupo.

Por otro lado, Afyonkarahisarl?la?t?rabildiklerimizdenmi?sinizcesine es una palabra más larga y no sorprender a la gente ya que no contiene espacios y el segundo representa como si eres una de las personas que hemos hecho de parecerse a Afyonkarahisar. Una adición reciente a los reclamos ha llegado con la introducción de la siguiente palabra en muvaffakiyetsizle?tiricile?tiriveremeyebileceklerimizdenmi?sinizcesine turco, que significa algo así como (que está hablando) como si usted es uno de aquellos que no se puede convertir fácilmente en un éxito-persona-máquina (alguien que un-educa a las personas para que sean infructuosas).

Georgia es también un lenguaje altamente aglutinante, por ejemplo, la significaría (alguien no especificado) dijo que es también para los que son como los que tienen que estar de nuevo / back contrrevolutionized.

[ editar ] Otros usos de la aglutinación de palabras y aglutinante

La aglutinación de las palabras y aglutinante provienen de la palabra latina agglutinare, 'para pegar'. En lingüística, estas palabras han estado en uso desde 1836, cuando Wilhelm von Humboldt ha publicado póstumamente trabajo Über die Verschiedenheit des menschlichen Sprachbaues und ihren Einfluß auf die geistige Entwicklung Menschengeschlechts des introdujo la división de las lenguas en aislantes, flexión, aglutinante y la incorporación . [11 ]

Especialmente en alguna literatura mayor, aglutinante se utiliza a veces como sinónimo de sintético . En ese caso, abarca lo que llamamos lenguas aglutinantes y flexivas, y es un antónimo de analítica o aislamiento . Además de la clara motivación etimológica (después de todo, desinencias son también "pegados" a los tallos), este uso más general se justifica por el hecho de que la distinción entre las lenguas aglutinantes y flexivas no es picante, como ya hemos visto.

En la segunda mitad del siglo 19, muchos lingüistas creen que hay un ciclo natural de la evolución del lenguaje: las palabras de función del tipo de aislamiento están pegadas a la cabeza-palabras, para que el lenguaje se convierte en aglutinante, se transforma más tarde se fusionó convertido a través de los procesos fonológicos , y lo que sale es una lengua flexiva, terminaciones flexivas finalmente se dejó caer con frecuencia en el habla rápida, la inflexión se omite y el lenguaje se remonta al tipo de aislamiento. [12]

El siguiente pasaje del Señor (1960) demuestra también toda la gama de significados que la aglutinación palabra pueda tener.

(Aglutinación ...) consiste en la soldadura de dos o más términos que ocurren constantemente como un grupo sintagmático en una sola unidad, que se vuelve difícil o imposible analizar posteriormente. Aglutinación adopta diversas formas. En francés, la soldadura se convierte en una fusión completa. América hanc Horam `a esta hora es la unidad de repetición francés adverbial. Antiguo jours tous francés se convierte en toujours, y DES JA ('desde ahora') déjà ('ya'). En Inglés, por otra parte, además de las combinaciones raras, como despedida de parte de Dios esté con ustedes, nuez tuerca de Gales, ventana de viento-ojo (ON vindauga), las unidades que componen las formas aglutinadas conservar su identidad. Palabras como mirlo y beefeater son harina de otro costal, que conservan sus unidades, pero su sentido último no es totalmente deducible de estas unidades. (...) Saussure prefiere distinguir entre las palabras compuestas y combinaciones verdaderamente sintetizados o aglutinadas. [13]

[ editar ] Lenguas aglutinantes en el Procesamiento del Lenguaje Natural

En el procesamiento del lenguaje natural, las lenguas con morfología rica plantear problemas de un tipo bastante diferente de lenguas aislantes. En el caso de idiomas aglutinantes, el obstáculo principal reside en el gran número de formas de la palabra que se puede obtener de una sola raíz. Como ya hemos visto, la generación de estas formas de la palabra es algo complicado por los procesos fonológicos de la lengua particular. Aunque el básico-a-uno entre forma y función sintáctica no se rompe en finlandés, la institución autorizada Kotimaisten kielten tutkimuskeskus (KOTUS, es decir, el Instituto de Idiomas de Finlandia ) enumera 51 tipos declinación de los sustantivos finlandeses, adjetivos, pronombres, y numerales.

Incluso los problemas más ocurrir con el reconocimiento de las formas verbales. Modernos métodos lingüísticos se basan principalmente en la explotación de corpus, sin embargo, cuando el número de formas de palabras posibles es grande, cualquier corpus necesariamente contendrá sólo una pequeña fracción de ellos. Haji? (2010) afirma que el espacio ordenador y poder son tan baratos hoy en día que todas las posibles formas de la palabra se puede generar beforehands y almacenado en una forma de un listado léxico todas las interpretaciones posibles de cualquier forma de la palabra dada. (La estructura de datos del léxico tiene que ser optimizado de manera que la búsqueda es rápida y eficiente.) Según Haji?, es la desambiguación de estas formas de la palabra que es difícil (más para idiomas Inflective donde la ambigüedad es alta que para aglutinante idiomas). [14]

Otros autores no comparten Haji? de que el espacio no es problema y en vez de enumerar todas las formas de las palabras posibles en un léxico, análisis de palabras formulario se implementa mediante módulos que tratan de romper con la forma de la superficie en una secuencia de morfemas que ocurren en un permisible ordenar por la lengua. El problema de este tipo de análisis es el gran número de las fronteras morfémicas típicas para lenguas aglutinantes. Una palabra de un idioma flexivo sólo tiene un final y por lo tanto el número de divisiones posibles de una palabra dentro de la base y el final es sólo lineal con la longitud de la palabra. En una lengua aglutinante, donde varios sufijos se concatenan al final de la palabra, el número de divisiones diferentes que tienen que ser verificada con mayor es grande. Este enfoque fue utilizado por ejemplo en el desarrollo de un sistema para el árabe, donde aglutinación se produce cuando artículos, preposiciones y conjunciones se unen con la siguiente palabra y pronombres se unió a la palabra anterior. Ver Grefenstette et al. (2005) para más detalles.

[ editar ] Véase también

[ editar ] Referencias

  1. ^ Bernard Comrie: "Introducción", p. 7 y 9 en Comrie (1990).

    Por ejemplo, la familia de lengua turca es una familia de lenguas bien establecidas, al igual que cada uno de los Urales, de Mongolia y las familias Tungusic. ¿Qué es controversial, sin embargo, es si estas familias individuales se relacionan como miembros de una familia aún más grande. La posibilidad de una familia altaica, que comprende turcos, mongoles, y Tungusic, es bastante amplia aceptación, y algunos estudiosos estaría a favor de aumentar el tamaño de la familia mediante la adición de algunos o todos los Urales, coreano y japonés.

    Por ejemplo, el estudio de los universales de Greenberg orden de las palabras ("algunos universales de la gramática con referencia especial a la orden de los elementos significativos", en JH Greenberg (ed.): Universales del lenguaje, MIT Press, Cambridge, Mass, 1963, pp . 73-112) mostraron que si una lengua tiene verbo al final el orden de palabras (es decir, si `el hombre vio a la mujer se expresa literalmente como 'el hombre vio la mujer'), entonces es muy probable que también tendrá posposiciones en lugar de preposiciones (por ejemplo `en casa 'se expresa como` la casa') y que tendrá genitivos delante del nombre (es decir, la casa del patrón 'gato' en lugar de `casa de gato '). Por lo tanto, si nos encontramos con dos lenguas que suceden a compartir las características: verbo al final orden de las palabras, posposiciones, genitivos prenominales, entonces la co-ocurrencia de estas características no es evidencia de la relación genética. Muchos de los primeros intentos por establecer amplias relaciones genéticas sufren precisamente de no adoptar esta característica de los patrones tipológicos en cuenta. Así, el hecho de que las lenguas turcas, idiomas, lenguas mongólicas Tungusic, coreanos y japoneses comparten todas estas características no es evidencia de su relación genética (aunque puede, por supuesto, otras similitudes, no recurrentes relacionados con los patrones tipológicos, que se establecen relación genética).

  2. ^ Comunicación personal con Matti Palomaki, alrededor de 2001. Véase también la discusión sobre UniLang UniLang .
  3. ^ Lehe?ková (1983), p. 17:

    Flexivní typ je nejvýrazn?ji zastoupen v estonštin?. Projevuje sí kongruencí, nedostatkem posesivních sufix?, v?tší homonymií un synonymií un tolika alternacemi, Ze sí dá mluvit o r?zných deklinacích. Koncovky jsou v?tšinou fonologicky redukovány, takže ztrácejí slabi?nou samostatnost.

  4. ^ Nam-Kil Kim: Coreano, p. 890-897 en Comrie (1990).
  5. ^ Los doce primeros ejemplos están tomados de Fromkin et al. (2007) p. 110, con los siguientes ajustes: He cambiado frases, que eran originalmente en pretérito perfecto (con marcador-me-) para frases en pasado simple (-li), que también cambió el tema de las cuatro últimas frases de kapu-` cesta "para tabu 'libro', que pertenece a la misma clase. Los dos últimos ejemplos se han tomado de Benji Wald: swahili y las lenguas bantúes, p. 1002 en Comrie (1990). Para la clase 7 prefijos, vea el Simba Mwana , Capítulo 16 . En el pasado, véase el capítulo 32 y el generador verbo .
  6. ^ Denning et al. (1990), página 12 .
  7. ^ Sorprendentemente, Greenberg no tiene en cuenta el morfema plural Inglés-s para ser automático. En efecto, la alternancia entre la fonética realizaciones-s,-z y-ez es automática, pero hay otros, aunque raros casos, cuando el morfema plural es-es, - ?, etc Denning et al. (1990), página 20 .
  8. ^ Greenberg calculado los índices sólo desde un solo pasaje de 100 palabras para cada idioma. Los valores de la tabla se han tomado de Luschützky (2003), p. 43; se compilan a partir de Greenberg (1954) y de Warren Cowgill Crawford: una búsqueda de los universales en indoeuropeo Morfología diacrónica, los universales del lenguaje, MIT Press, Cambridge (Massachusetts), 1963, p. 91-113.
  9. ^ Los ejemplos se puede comprobar con el analizador morfológico finlandés .
  10. ^ Tenga en cuenta que no hay ningún artículo en finlandés, por lo que el uso de un / el en traducciones al inglés es arbitraria.
  11. ^ La división se atribuye a Humboldt en Luschützky (2003), p. 17. La datación viene de Michael Losonsky (ed.): Wilhelm von Humboldt: el lenguaje, p. xxxvi (disponible a través googlebooks).
  12. ^ Vendryes (1925), p. 349, ya menciona esta hipótesis como fuera de fecha, indicando el punto de vista más contemporáneo que los tres tipos de procesos están presentes al mismo tiempo. Según Vendryes, los defensores de esta hipótesis incluiría A. Hovelacque: La linguistique, París 1888; Misteli F.: charakteristik der hauptsächlichsten Typen des Sprachbaus, Berlín 1893, y por último AH Sayce: Introducción a la Ciencia de la Lengua, 2 Vols,. tercera edición de Londres 1890. Comparar también Lehe?ková (2003), p. 18-19, un pasaje que es mucho más cercano al concepto original de etapas separadas.
  13. ^ Señor (1960), p. 160.
  14. ^ Haji? (2010), Resumen:

    Sin embargo, no es la propia morfología (ni siquiera para los idiomas Inflective o aglutinante) que está causando el dolor de cabeza - con el espacio económico de hoy en día y poder, una simple enumeración de todas las formas imaginables en una lista apropiada hash está bien - pero es el problema de desambiguación, que aparentemente es más difícil para idiomas morfológicamente ricos (quizás sorprendentemente más para los más Inflective que los aglutinantes) que para los análisis.

[ editar ] Bibliografía

  • Kimmo Koskenniemi y Oy Lingsoft: analizador morfológico finlandés , Soluciones Lingsoft Lenguaje, 1995-2011.
  • Bernard Comrie (editor): los principales idiomas del mundo, Oxford University Press, Nueva York - Oxford 1990.
  • Keith Denning, Suzanne Kemmer (ed.): El lenguaje: escritos seleccionados de Joseph H. Greenberg, Stanford University Press, 1990. Piezas seleccionadas están disponibles en googlebooks .
  • Victoria Fromkin, Robert Rodman, Nina Hyams: Introducción a la Lengua, Thompson Wadsworth, 2007.
  • Joseph H. Greenberg: Una aproximación cuantitativa a la tipología morfológica del lenguaje, 1960. Disponible a través de JSTOR y en Denning et al. (1990), p. 3-25. También hay un buen un breve resumen .
  • Gregory Grefenstette, Nasredine Semmar, Faïza Elkateb-Gara: Modificación de un Sistema de Procesamiento del Lenguaje Natural para las lenguas europeas de tratar árabe en Procesamiento de la Información

y aplicaciones de recuperación de información, métodos computacionales para lenguas semíticas - Actas del Taller de la Universidad de Michigan, 2005, p. 31-38. Disponible en [1] .

  • Jan Haji?: Reviviendo la historia: el inicio de la traducción automática estadística y lenguas con morfología rica, IceTAL'10 Actas de la 7 ª Conferencia Internacional sobre Avances en el procesamiento del lenguaje natural, Springer-Verlag Berlin, Heidelberg, 2010. Resumen disponible en [2] .
  • Helena Lehe?ková: UVOD hacer ugrofinistiky, Státní pedagogické Nakladatelství, Praha 1983.
  • Robert Señor: Teach Yourself Lingüística Comparada, las universidades Inglés Press Ltd., Casa San Pablo, Londres 1967 (primera edición 1966).
  • Hans Christian Luschützky: Uvedení hacer jazyk? tipología, Filozofická fakulta Univerzity Karlovy, Praha 2003.
  • J. Vendryes: Lengua - Una introducción a la Historia Lingüística, Kegan Paul, Trench, Trubner Co., Ltd., Londres, 1925 (traducido por Paul Radin)

[ editar ] Enlaces externos

  • Mwana Simba , una página web sobre swahili gramática.
Herramientas personales
Los espacios de nombres

Variantes
Acciones
Navegación
Interacción
Caja de herramientas
Imprimir / exportar
Idiomas

mk.gd - Translate any webpage in real-time - This webpage has been translated in order to make it available in another language, view original page

View this page in: Afrikaans, Albanian, Arabic, Belarusian, Bulgarian, Catalan, Chinese (Simp), Chinese (Trad), Croatian, Czech, Danish, Dutch, English, Estonian, Filipino, Finnish, French, Galician, German, Greek, Hebrew, Hindi, Hungarian, Icelandic, Indonesian, Irish, Italian, Japanese, Korean, Latvian, Lithuanian, Macedonian, Malay, Maltese, Norwegian, Persian, Polish, Portuguese, Romanian, Russian, Serbian, Slovak, Slovenian, Spanish, Swahili, Swedish, Thai, Turkish, Ukrainian, Vietnamese, Welsh, Yiddish

Content and any subsequent copyright is upheld by the third-party - contact@mk.gd