Vydavatelství slovníků

From Simulace.info
Revision as of 21:50, 11 June 2023 by Getj00 (talk | contribs) (Vytvoření stránky)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

"Něco lingvistického."


Definice problému

Bude simulována firma, která se zabývá tvorbou a prodejem překladových slovníků, kde na 1 straně je čeština. Postupně buduje svoje portfolio produktů na základě toho, jak rychle zpracovává slovníková hesla pro vydání potřebné velikosti slovníku, a na základě poptávky ovlivněné geopolitickými událostmi vydává nová vydání. Jejím cílem je mít konsistentní zpracování všech předem vytyčených jazyků s pomocí počítačových technologií, a zacelit tak všechny díry na trhu českých překladových slovníků, jejichž zpracování nebylo v minulých režimech možné z politických či technických důvodů. Noví zaměstnanci (zvyšující rychlost zpracování hesel) jsou z důvodu stability týmového prostředí nabíráni jen v případě zvýšené poptávky. Simulace je inspirována příhodným vydáním ukrajinského slovníčku od firmy Lingea z pekuliárního roku 2022, a ukrajinské konverzace z roku 2023.

Cíl simulace

Hlavním cílem je prověřit dlouhodobou (20+ let) rentabilitu a ziskovost v obnoveném volnotržním prostředí, obzvláště v pozdních fázích, kdy slovníky většiny jazyků budou zpracovány do velké velikosti (100000+ hesel), ačkoliv poptávka po nich bude lehce klesat.

Zdroje dat

Data budou získána či spíše odvozena z výročních zpráv Lingea s.r.o. v Obchodním rejstříku, nebot používají zkrácený rozsah a nemají povinnost ověření auditorem. Důležitým zdrojem je také produktové portfolio této firmy, které určí jednotlivé druhy slovníků. Doplněny jsou také formáty největších českých slovníků, kterou používají jako základ pro část s češtinou napřed.

Ohledně dějepisných událostí se simulace se inspiruje v celkové pravděpodobnosti válek, ale nebude natvrdo zakódováno, že USA má v roce 2003 napadnout Irák, Rusko má v roce 2008 napadnout Gruzii, nebo že se má v roce 2011 stát arabské jaro. Bude ale ctěno, že státy NATO nikdy nejsou napadány.

Rychlost zpracování slovníkových hesel je odvozena z průměrné rychlosti psaní. Zaměstnanci jsou považovaní za experty na svůj jazyk, tudíž nejsou ve zpracování hesel omezení potřebou o nich dlouze přemýšlet.


Metoda

Formulování a zpracování tématu je inspirováno soutěžními zadáními z FMWC. V základu simulované části reality je použito Monte Carlo, na rozhodovací úrovni jsou použity prvky Dračího doupěte. Prozatímní název pro tuto kombinaci je Šmakova hora. Narozdíl od Monte Carla není a priori cílem konvergence výsledků.

Počet kol je 50 po 1 roce, počínaje rokem 2001. V každém kole je 12 tahů odpovídajícím 1 měsíci.

Použitý program je LibreOffice Calc, neboť umožňuje defici vlastních funkcí imperativně přímo v LibreOffice Basic, namísto méně pohodlného funkcionálního psaní lambd ve správci jmen v M$ Excel 365, přičemž v nejnovější stabilní verzi 2021 lambdy nejsou podporovány.

Samotná simulace je postavena na sledování a aktualizaci stavových proměnných pomocí následovnické funkce s podmíněným rozhodnutím, zda se jedná o konec roku.


Model

V LibreOffice byla simulace rozdělená do 6 různých listů:

  • Funkce - soupis jednotlivých funkcí pro refactoring
  • Počáteční - konfigurace simulace
  • Slovníky - data druhů slovníků
  • Jazyky - konfigurace proměnných na každý jazyk
  • Simulace - samotná simulace
  • Výroční - souhrn ročních výsledků společnosti a provedených rozhodnutí


Počáteční proměnné

Slovníky

Nejsou uvažováni průvodci a gramatiky.

  • konverzace - 6k, obsahuje krátký slovníček a relativně fixní seznam frází.
  • slovníček - 30k
  • kapesní - 35k, obsahuje stručnou konverzaci
  • šikovný - 40k, obsahuje konverzaci
  • praktický - 50k
  • úzký velký - 60k, pozorováno u čínštiny a japonštiny
  • tlustý velký - 120k, pozorováno u angličtiny a němčiny
  • vícesvazkový - 250k, podle PSJČ a SSJČ
  • mega - 1M,
  • mluvník - 2k, potřeba 100k
  • tematický - 20k, potřeba 100k
  • slang - 5k, potřeba 100k, jedná se o podmnžinu

Jazyky

Bylo vybráno 20 (ikosahedron) jazyků s nejvyšším počtem mluvčích podle Ethnologue. Portfolio Lingey zahrnuje místo některých jihoasijských jazyků jazyky evropských států, nicméně pro řadu jihoasijských jazků velký slovník s češtinou na 2. straně nevyšel, tudíž se jedná o tržní příležitost.

  • angličtina
  • čínština
  • hindština
  • španělština
  • francouzština
  • arabština - v dosavadních slovnících řazeno zpravidla podle kořenu
  • bengálština
  • ruština
  • portugalština
  • urdu
  • indonéština
  • němčina
  • japonština
  • marathi
  • telugu
  • turečtina
  • tamilština
  • vietnamština
  • filipínština (tagalog)
  • korejština


Proměnné na každý jazyk

Výsledky

Projekt přestane být komerčně rentabilní za XX let.


Závěr

Odkazy

  • Portfolio Lingea
  • Výroční zprávy
  • Jazyky s největším počtem mluvčích (Wiki, Ethnologue)
  • Největší slovníky
  • SSJČ, PSJČ
  • Rychlost psaní


Kód

Simulace postupuje na základě následovnických funkcí, které jsou následující:


Následovnické funkce
Proměnná Kód funkce Komentář
Rok fff kkk
Měsíc fff kkk
Peníze fff kkk
jeVálka fff kkk
agresorIdx fff kkk
agresor fff kkk
napadenýIdx fff kkk
napadený fff kkk
Slov fff x20 pro každý jazyk
Zaměstnanci fff x20 pro každý jazyk
KolektivSíla fff x20 pro každý jazyk
Poptávka fff x20 pro každý jazyk
Konverzací ... Slangů fff x20 pro každý jazyk, x12 pro každý druh slovníku