summaryrefslogtreecommitdiff
diff options
context:
space:
mode:
authorStanislav Horacek <stanislav.horacek@gmail.com>2021-05-27 22:34:39 +0200
committerStanislav Horáček <stanislav.horacek@gmail.com>2021-06-02 22:26:57 +0200
commit412f5dd223df85956dc38f429733e7972d496391 (patch)
treef2172e823aaae6ea9f164d9502788581a0f7e048
parent5ae65ee9e7f1dac860be57901c62d97d887a9564 (diff)
Czech Hunspell: remove rule based on circumfix and make other updates
the rule does not produce correctly capitalized results minor updates of word list all changes suggested by Miroslav Pošta Change-Id: I1ecfd7ea6daaf155228bd2405708fb097fa07997 Reviewed-on: https://gerrit.libreoffice.org/c/dictionaries/+/116281 Tested-by: Stanislav Horáček <stanislav.horacek@gmail.com> Reviewed-by: Stanislav Horáček <stanislav.horacek@gmail.com>
-rw-r--r--cs_CZ/README_cs.txt4
-rw-r--r--cs_CZ/cs_CZ.aff74
-rw-r--r--cs_CZ/cs_CZ.dic8
3 files changed, 10 insertions, 76 deletions
diff --git a/cs_CZ/README_cs.txt b/cs_CZ/README_cs.txt
index f13e5c4..d21512e 100644
--- a/cs_CZ/README_cs.txt
+++ b/cs_CZ/README_cs.txt
@@ -584,7 +584,7 @@ Slova byla přidávána především na základě seznamů slov vygenerovaných
Chybná či problematická slova a tvary k odebrání byly vyhledávány především pomocí kontroly pravopisu Windows v seznamech slov (words, tzn. slovních tvarů) vygenerovaných z žákovských a internetových korpusů. Díky tomu bylo např. zjištěno, že původní pravidla povolují určité typy častých překlepů (zejména u nerodilých uživatelů češtiny). Dále byly cíleně odebírány některé zastaralé varianty, které jsou sice přípustné, ale Dodatek MŠMT je nepovažuje za základní (slova z prvního výčtu, např. analysa, fantasie, explose, slova zakončená na -isace, -isovat, -isování, -isovaný, -isační). Je možné, že by je využili chemici a snad i jiné profese, v kontrole pravopisu určené pro současný jazyk pro ně ale místo není. (Je pravděpodobné, že slovník nadále některá taková slova obsahuje.)
-Soubor s afixy byl upraven především takto: byl přehodnocen přístup k přechodníkům, byla přidána pravidla pro tvorbu přivlastňovacích přídavných jmen od maskulin životných ("otcův"), byla přidána pravidla pro stupňování adjektiv koncovkou -ejší/ější, byla přidána pravidla pro tvar 1. osoby sg. sloves na -u (vedle -i, např. "děkuju"), byla přidána pravidla pro vytváření přídavných jmen od jmen pomístních prostým přidáním koncovky -ský (a změnou velkého písmena na písmeno malé), byl opraven 6. p. mn. č. maskulin na -ga/ha/cha/ka (např. kolezích), byly provedeny další drobnější úpravy.
+Soubor s afixy byl upraven především takto: byl přehodnocen přístup k přechodníkům, byla přidána pravidla pro tvorbu přivlastňovacích přídavných jmen od maskulin životných ("otcův"), byla přidána pravidla pro stupňování adjektiv koncovkou -ejší/ější, byla přidána pravidla pro tvar 1. osoby sg. sloves na -u (vedle -i, např. "děkuju"), byl opraven 6. p. mn. č. maskulin na -ga/ha/cha/ka (např. kolezích), byly provedeny další drobnější úpravy.
Podrobněji
@@ -597,8 +597,6 @@ Přístup k přechodníkům: Soubor s afixy původně obsahoval pravidla pro tvo
S přechodníky souvisí adjektiva od nich odvozená (např. "zpívající"). Pod příznakem X byla přidána pravidla pro tvorbu těchto adjektiv od přechodníků uvedených ve slovníku. Další mohou být přidána buď takto spolu s přechodníkem, nebo prostým přidáním adjektiva (na -cí nebo -vší) s příznakem Y.
-Podrobněji k odvozování adjektiv od pomístních jmen: Jistě by se dala sestavit pravidla na paradigmatickou (pravidelnou) tvorbu adjektiv od různě zakončených slov, čímž by se slovník mohl výrazně zmenšit, ale při vkládání značek by se pak muselo nahlížet do tabulky s legendou, aby se nevytvořily nekorektní tvary. Proto jsem vytvořil jen komplex pravidel pro prosté přidání koncovky -ský (ve všech pádech sg. i pl.) a změny iniciálního velkého písmene na písmeno malé. (Jedná se o příznak ý automaticky kombinovaný s příznakem Ú a Ů.) Zdá se totiž, že prosté přidání -ský představuje cca 75 % případů. Je to opět volitelná možnost: lze buď postaru vložit do slovníku i přídavné jméno, nebo prostě přidat k pomístnímu jménu příznak "ý". (Starou metodu jsem na novou nezměnil. Je však možné udělat to dodatečně a zmenšit tak počet položek ve slovníku o několik stovek nebo tisíců.) Technická poznámka: řešení je realizováno příkazem CIRCUMFIX, který je v jazykových souborech pro různé jazyky poměrně vzácný.
-
Ke stupňování adjektiv: Byla vytvořena pravidla pro stupňování adjektiv koncovkou -ejší/ější. Jedná se o příznak y. (Jen několik desítek adjektiv se stupňuje pomocí koncovky -ší/čí.) Nově je tedy možné u takového adjektiva jen uvést příznak y. Jím se vytvoří všechny tvary komparativu a superlativu a dále stupňované příslovce. Starý systém byl na nový převeden jen u slov, která byla v původním slovníku jen v komparativu (a superlativu), nikoliv tedy v pozitivu. Tuto úpravu by bylo možné provést i v ostatních případech, čímž by se ušetřilo několik tisíc řádků. (Pokud jde o předponu "nejne", bylo by možné na ni rezignovat a tyto nečetné případy vyřešit jinak. Naopak příznak N by bylo třeba zachovat.) Je třeba otestovat, zda je vhodné, aby se od stupňovaného adjektiva automaticky tvořilo i stupňované příslovce - je třeba přiznat, že toto je poněkud nesystémové.
Zakázány byly tvary dokáži/dokáží a další podobné. V současné češtině se považují za zastarávající nebo knižní, respektive hyperkorektní, a proto je v přehledu tvarů neuvádí ani Internetová jazyková příručka Ústavu pro jazyk český. V některých typech textů se vyskytují se zvýšenou frekvencí možná právě proto, že je dosavadní kontroly pravopisu povolují.
diff --git a/cs_CZ/cs_CZ.aff b/cs_CZ/cs_CZ.aff
index 22e1441..3df9b9e 100644
--- a/cs_CZ/cs_CZ.aff
+++ b/cs_CZ/cs_CZ.aff
@@ -85,7 +85,7 @@ SFX P 0 ech [^aeoklgh]
SFX P g zích g
SFX P h zích [^c]h
SFX P ch ších ch
-SFX P 0 ův/Y [^aeoklc] # jména zakončená na -e (Šebrle, Goethe) a -c (Balzac) nejsou pokryta
+SFX P 0 ův/Y [^aeoklc]
SFX P 0 a [^eě]k
SFX P 0 u [^eě]k
SFX P 0 ovi [^eě]k
@@ -192,15 +192,15 @@ SFX P a o a
SFX P a ou a
SFX P a ů a
SFX P a ům a
-SFX P a ech [^cčďghkňšťž]a # u pária se povoluje dubleta
+SFX P a ech [^cčďghkňšťž]a
SFX P ka cích ka
SFX P ga zích ga
SFX P cha ších cha
SFX P ha zích [^c]ha
-SFX P a ích [ščžci]a # typ bača, nindža, míša, paňáca, pária
-SFX P ďa dích ďa # typ méďa
-SFX P ňa ních ňa # typ fouňa
-SFX P ťa tích ťa # typ ťunťa
+SFX P a ích [ščžci]a
+SFX P ďa dích ďa
+SFX P ňa ních ňa
+SFX P ťa tích ťa
SFX P a ův/Y a
SFX P e a e
SFX P e u e
@@ -2786,68 +2786,6 @@ SFX y í ěji/E ní
SFX y ký čeji/E [^cs]ký
SFX y í eji/E [^n]í
-CIRCUMFIX Ů
-
-PFX Ú Y 44
-PFX Ú A a/Ů A
-PFX Ú Á á/Ů Á
-PFX Ú Ä ä/Ů Ä
-PFX Ú Å å/Ů Å
-PFX Ú B b/Ů B
-PFX Ú C c/Ů C
-PFX Ú Č č/Ů Č
-PFX Ú D d/Ů D
-PFX Ú Ď ď/Ů Ď
-PFX Ú E e/Ů E
-PFX Ú É é/Ů É
-PFX Ú F f/Ů F
-PFX Ú G g/Ů G
-PFX Ú H h/Ů H
-PFX Ú I i/Ů I
-PFX Ú Í í/Ů Í
-PFX Ú J j/Ů J
-PFX Ú K k/Ů K
-PFX Ú L l/Ů L
-PFX Ú Ľ ľ/Ů Ľ
-PFX Ú M m/Ů M
-PFX Ú N n/Ů N
-PFX Ú Ň ň/Ů Ň
-PFX Ú O o/Ů O
-PFX Ú Ó ó/Ů Ó
-PFX Ú Ö ö/Ů Ö
-PFX Ú P p/Ů P
-PFX Ú Q q/Ů Q
-PFX Ú R r/Ů R
-PFX Ú Ř ř/Ů Ř
-PFX Ú S s/Ů S
-PFX Ú Š š/Ů Š
-PFX Ú T t/Ů T
-PFX Ú Ť ť/Ů Ť
-PFX Ú U u/Ů U
-PFX Ú Ú ú/Ů Ú
-PFX Ú Ü ü/Ů Ü
-PFX Ú V v/Ů V
-PFX Ú W w/Ů W
-PFX Ú X x/Ů X
-PFX Ú Y y/Ů Y
-PFX Ú Ý ý/Ů Ý
-PFX Ú Z z/Ů Z
-PFX Ú Ž ž/Ů Ž
-
-SFX ý Y 12 # spolu s pravidlem Ú a Ů nabízí možnost vytvořit z pomístního jména adjektivum prostým přidáním koncovky -ský
-SFX ý 0 ský/ÚŮ .
-SFX ý 0 ská/ÚŮ .
-SFX ý 0 ské/ÚŮ .
-SFX ý 0 ského/ÚŮ .
-SFX ý 0 skému/ÚŮ .
-SFX ý 0 ském/ÚŮ .
-SFX ý 0 ským/ÚŮ .
-SFX ý 0 skou/ÚŮ .
-SFX ý 0 ští/ÚŮ .
-SFX ý 0 ských/ÚŮ .
-SFX ý 0 skými/ÚŮ .
-SFX ý 0 skýma/ÚŮ .
-
SFX í Y 23 # cizí jména (Victoria, Balzac, Jake, Kennedy, Luigi, Mallarmé), jen sg.
SFX í a e ia
SFX í a i ia
diff --git a/cs_CZ/cs_CZ.dic b/cs_CZ/cs_CZ.dic
index 10b5057..eb51e0f 100644
--- a/cs_CZ/cs_CZ.dic
+++ b/cs_CZ/cs_CZ.dic
@@ -1,4 +1,4 @@
-261171
+261169
a
AACR
áách
@@ -49051,7 +49051,7 @@ genotyp/H
genotypový/YKRN
genový/YKRN
genplk.
-genpor.t
+genpor.
Genrt/PV
Genrtová/Y
Genser/PV
@@ -218699,8 +218699,7 @@ třídeskový/YR
třídicí/Y
třídící/YN
třídič/S
-třidička/Zq
-třídička/Zq
+třídička/Z
třídílný/YKRN
třídimenzionální/YKR
třídírenský/YR
@@ -261166,7 +261165,6 @@ zživotnění/SN
Žyrková/Y
žžonka/ZQ
µA
-μg
µg
µm
µV