Xvalm48
Contents
Geneze jazyka
Název simulace: Geneze jazyka
Autor: Miroslav Valeš
Typ: Multi agentní simulace
Modelovací nástroj: NetLogo, případně vlastní (viz Technologie)
Zadání:
Model se v oblastech lingvistiky a fonologie věnuje simulaci geneze a evoluce jazyka, coby reprezentačního prostředku, ve kterém základní jednotka (písmeno, slabika, slovo) odkazuje na konkrétní význam. Různorodí agenti tyto jednotky používají v komunikaci, přičemž jejich užívání jazyka zapřičiňuje postupnou evoluci jazyka. Model by měl poskytnout odpověď, zda-li jazyk (jazykový slovník) s trvanlivými výrazy může emergovat pouze na základě chování mnoha deliberativních agentů. Zvláštní pozornost bude věnována vlivu endogenních parametrů, jako jsou omezení minimální a maximální délky výrazu, prahu podobnosti nebo vliv nastavení agentů na vytvářený jazyk.
Základní předpoklady:
Základním východiskem je rozmístění významů v dvojrozměrném prostoru, kde počet významů je konečný, definovaný skrze X a Y.
Různé výrazy složené ze samohlásek a souhlásek různé délky mohou mít v prostoru stejnou pozici a tedy odkazovat na stejný význam.
Ve vztahu výraz a význam, platí, čím používanější význam, tím kratší výraz.
Pragmatické kritérium: Existence podobných výrazů pro různé významy musí splňovat rozdílnost, aby mohla být agenty komunikována. Od určité hranice podobnosti nemá smysl zachovávat dva a více stejných výrazů pro totožný (blízký) význam. V tomto modelu je rozdílnost výrazů posuzována pomocí dvou různých metod (viz Technologie).
Prvky modelu:
- Supra jazyková mapa - abstrakce, kde jsou v dvojrozměrném poli rozmístěny výrazy. Výraz má svoji znakovou podobu, je složen ze samohlásek a souhlásek. Unikátnost výrazu je dána jeho významem, v této abstrakci umístěním X a Y. Je tedy myslitelné, aby více výrazů odkazovalo na totožný význam. Supra, globální jazyková mapa představuje základní kontrakt, jazyk prostředí společný pro všechny agent, ze kterého mohou jejich komunikační jednání vycházet.
- Agenti / Mluvčí - jsou sofistikovaní, deliberativní mluvčí mající svou vlastní jazykovou mapu umožňující individuální mutace pojmenování. Mají několik parametrů určující jejich chování (viz dále).
- Výrazy - jsou již zmiňované prvky umístěné v jazykových mapách.
Parametry výrazu:
- Významnost výrazu - je skóre představující počet používanost výrazu pro daný význam. Vzniká průběžne dle četnosti používání výrazu agenty.
- Pozice - umístění X, Y, neboli význam výrazu
Parametry agenta (mluvčího):
- Seznam významů s pravděpodobnostní četností (seznam pozic X,Y s pravděpodobností výběru v kole). Tento seznam by měl být neměnný nebo měnný jenom minimálně.
- Vlastní jazyková mapa - vlastní mapa utvářená jednáním agenta.
- Exponovanost agenta - představuje faktor jeho aktivity, průměrného počtu použití různých pojmenování za kolo.
- Významnost agenta je skóre dle kterého aktuální použití výrazů a tedy jeho vzniklá jazyková mapa ovlivňuje supra-mapu a tedy i další agenty
- Rozlišovací schopnost agenta - práh schopnosti rozlišit výrazy z hlediska výslovnosti (viz Technologie)
- Faktor kreativity (respektive komformita) je vyjádření tendece vycházet při pojmenování významu ze supra-mapy nebo generování vlastního pojmenování
Průběh modelu:
- Agenti mají vlastní seznam významů, podle kterého náhodně a v souladu s měrou svojí exponovanosti v každém kole komunikují. Při komunikaci konkrétního významu (pozice X,Y) agent přebírá ze supra jazykové mapy výraz nejbližší významu. Výběr je ovlivněn rozlišovací schopností a faktorem kreativity. Čím je faktor kreativity vyšší, tím agent generuje spíše vlastní význam. Generování je podřízeno četnostní významu - čím vyšší, tím méně znaků. Může být ošetřeno pravidlem na základě žebříčku délek a relativních četností. Rozlišovací úroveň agenta také podmiňuje zachování více stejně nebo podobně umístěných výrazů a jejich výslovnostní podobnosti (viz Pragmatické kritérium)
- Globální parametr určuje práh významnosti agenta, při jehož překročení agentova vlastní jazyková mapa na konci kola (definovaného intervalu) se promítá do supra jazykové mapy.
- Nepoužívané výrazy po daném časovém intervalu zanikají
Technologie:
- pro srovnání vygenerovaných výrazů z hlediska výslovnosti bude použit algoritmus Metaphone nebo Levenshtein
- model bude realizován v Netlogu, případně ve vlastní aplikaci v jazyce C#, platforma .NET
- pro simulaci bude zásadní metoda porovnávání výslovnosti a generování výrazů ze samohlásek a souhlásek
To je velmi pozoruhodné zadání, jsem velmi zvědav na výsledek. Doporučuji spíše Netlogo, tím .NETem byste si přidělal strašně moc práce. Schváleno. Tomáš 14:35, 11 May 2014 (CEST)