Vydavatelství slovníků
"Něco lingvistického."
Contents
Definice problému
Bude simulována firma, která se zabývá tvorbou a prodejem překladových slovníků, kde na 1 straně je čeština. Postupně buduje svoje portfolio produktů na základě toho, jak rychle zpracovává slovníková hesla pro vydání potřebné velikosti slovníku, a na základě poptávky ovlivněné geopolitickými událostmi vydává nová vydání. Jejím cílem je mít konsistentní zpracování všech předem vytyčených jazyků s pomocí počítačových technologií, a zacelit tak všechny díry na trhu českých překladových slovníků, jejichž zpracování nebylo v minulých režimech možné z politických či technických důvodů. Noví zaměstnanci (zvyšující rychlost zpracování hesel) jsou z důvodu stability týmového prostředí nabíráni jen v případě zvýšené poptávky. Simulace je inspirována příhodným vydáním ukrajinského slovníčku od firmy Lingea z pekuliárního roku 2022, a ukrajinské konverzace z roku 2023.
Cíl simulace
Hlavním cílem je prověřit dlouhodobou (20+ let) rentabilitu a ziskovost v obnoveném volnotržním prostředí, obzvláště v pozdních fázích, kdy slovníky většiny jazyků budou zpracovány do velké velikosti (100000+ hesel), ačkoliv poptávka po nich bude lehce klesat.
Zdroje dat
Data budou získána či spíše odvozena z výročních zpráv Lingea s.r.o. v Obchodním rejstříku, nebot používají zkrácený rozsah a nemají povinnost ověření auditorem. Důležitým zdrojem je také produktové portfolio této firmy, které určí jednotlivé druhy slovníků. Doplněny jsou také formáty největších českých slovníků, kterou používají jako základ pro část s češtinou napřed.
Ohledně dějepisných událostí se simulace se inspiruje v celkové pravděpodobnosti válek, ale nebude natvrdo zakódováno, že USA má v roce 2003 napadnout Irák, Rusko má v roce 2008 napadnout Gruzii, nebo že se má v roce 2011 stát arabské jaro. Bude ale ctěno, že státy NATO nikdy nejsou napadány.
Rychlost zpracování slovníkových hesel je odvozena z průměrné rychlosti psaní. Zaměstnanci jsou považovaní za experty na svůj jazyk, tudíž nejsou ve zpracování hesel omezení potřebou o nich dlouze přemýšlet.
Metoda
Formulování a zpracování tématu je inspirováno soutěžními zadáními z FMWC. V základu simulované části reality je použito Monte Carlo, na rozhodovací úrovni jsou použity prvky Dračího doupěte. Prozatímní název pro tuto kombinaci je Šmakova hora. Narozdíl od Monte Carla není a priori cílem konvergence výsledků.
Počet kol je 50 po 1 roce, počínaje rokem 2001. V každém kole je 12 tahů odpovídajícím 1 měsíci.
Použitý program je LibreOffice Calc, neboť umožňuje defici vlastních funkcí imperativně přímo v LibreOffice Basic, namísto méně pohodlného funkcionálního psaní lambd ve správci jmen v M$ Excel 365, přičemž v nejnovější stabilní verzi 2021 lambdy nejsou podporovány.
Samotná simulace je postavena na sledování a aktualizaci stavových proměnných pomocí následovnické funkce s podmíněným rozhodnutím, zda se jedná o konec roku.
Model
V LibreOffice byla simulace rozdělená do 6 různých listů:
- Funkce - soupis jednotlivých funkcí pro refactoring
- Počáteční - konfigurace simulace
- Slovníky - data druhů slovníků
- Jazyky - konfigurace proměnných na každý jazyk
- Simulace - samotná simulace
- Výroční - souhrn ročních výsledků společnosti a provedených rozhodnutí
Počáteční proměnné
Slovníky
Nejsou uvažováni průvodci a gramatiky.
- konverzace - 6k, obsahuje krátký slovníček a relativně fixní seznam frází.
- slovníček - 30k
- kapesní - 35k, obsahuje stručnou konverzaci
- šikovný - 40k, obsahuje konverzaci
- praktický - 50k
- úzký velký - 60k, pozorováno u čínštiny a japonštiny
- tlustý velký - 120k, pozorováno u angličtiny a němčiny
- vícesvazkový - 250k, podle PSJČ a SSJČ
- mega - 1M,
- mluvník - 2k, potřeba 100k
- tematický - 20k, potřeba 100k
- slang - 5k, potřeba 100k, jedná se o podmnžinu
Jazyky
Bylo vybráno 20 (ikosahedron) jazyků s nejvyšším počtem mluvčích podle Ethnologue. Portfolio Lingey zahrnuje místo některých jihoasijských jazyků jazyky evropských států, nicméně pro řadu jihoasijských jazků velký slovník s češtinou na 2. straně nevyšel, tudíž se jedná o tržní příležitost.
- angličtina
- čínština
- hindština
- španělština
- francouzština
- arabština - v dosavadních slovnících řazeno zpravidla podle kořenu
- bengálština
- ruština
- portugalština
- urdu
- indonéština
- němčina
- japonština
- marathi
- telugu
- turečtina
- tamilština
- vietnamština
- filipínština (tagalog)
- korejština
Proměnné na každý jazyk
Výsledky
Projekt přestane být komerčně rentabilní za XX let.
Závěr
Odkazy
- Portfolio Lingea
- Výroční zprávy
- Jazyky s největším počtem mluvčích (Wiki, Ethnologue)
- Největší slovníky
- SSJČ, PSJČ
- Rychlost psaní
Kód
Simulace postupuje na základě následovnických funkcí, které jsou následující:
Proměnná | Kód funkce | Komentář |
---|---|---|
Rok | fff | kkk |
Měsíc | fff | kkk |
Peníze | fff | kkk |
jeVálka | fff | kkk |
agresorIdx | fff | kkk |
agresor | fff | kkk |
napadenýIdx | fff | kkk |
napadený | fff | kkk |
Slov | fff | x20 pro každý jazyk |
Zaměstnanci | fff | x20 pro každý jazyk |
KolektivSíla | fff | x20 pro každý jazyk |
Poptávka | fff | x20 pro každý jazyk |
Konverzací ... Slangů | fff | x20 pro každý jazyk, x12 pro každý druh slovníku |