Table Of ContentJazykovedný ústav Ľudovíta Štúra Ústav pro jazyk český Akademie věd
Slovenskej akadémie vied České republiky, v. v. i.
ČESKÁ A SLOVENSKÁ
VÝKLADOVÁ LEXIKOGRAFIA
NA ZAČIATKU 21. STOROČIA
Súbor príspevkov v rámci medzinárodného projektu
Princípy a metódy tvorby výkladového slovníka
Tribun EU
Brno 2011
Redakcia:
Mgr. Jindra Světlá, Ph.D.
Mgr. Alexandra Jarošová, CSc.
Albena Rangelova, CSc.
Recenzenti:
doc. PhDr. Tatjana Grigorjanová, CSc.
Mgr. Jana Benkovičová, CSc.
Príprava tlačových podkladov: Mgr. Vladimír Radik
© Klára Buzássyová, Edith Čonosová, Hana Goláňová, Martina Habrová, Jana
Hašanová, Nicol Janočková, Alexandra Jarošová, Eva Kolovecká, Marta Koutová,
Jana Letafková, Zdeňka Opavská, Helena Pernicová, Eva Podruhová, Barbora
Procházková, Albena Rangelova, Jindra Světlá, Zdeňka Tichá, Vojtěch Veselý, Radek
Volejník, 2011
Cover © Vladimír Benko, 2011
© Jazykovedný ústav Ľ. Štúra SAV, 2011
This edition © Tribun EU, 2011
ISBN 978-80-263-0097-7
OBSAH (CONTENT)
JNina dúrvao dS.v..ě...t..l.á............................................................................................................................ 7
................................................................................. ........................................ 9 – 18
SJitnrudkratu Srvaě at lzápracování hesel v lexikální databázi Pralex
Structure and Processing of Entries in the Pralex Lexical Database
.................................................................. ....................................................... 19 – 27
JBiunddorvaá Snví ěhtelásl,á Břea rlebxoirkaá lPnrí odcahtaábzákzoev Páralex
Building the List of Entries of the Pralex Lexical Database
....................................................................... 29 – 38
MK azárktala Kdoníumtouv zápracování substantiv v lexikální databázi Pralex
On Basic Processing of Nouns in the Pralex Lexical Database
..................................................................................................................... 39 – 50
Exemplifikace substantiv v lexikální databázi Pralex (zpracování příkladové
části hesla)
EExdeimthpl iČfiocantioons oofv Náouns in the Pralex Lexical Database (Processing of the Example Part of
an Entry)
............................................................ ....................................................... 51 – 57
MZparratcionvaá Hnía zbdrroovbánělin v lexikální databázi Pralex
Processing of Deminutives in the Pralex Lexical Database
..................................................... ........................................................... 59 – 67
HZperlaecnoav áPneír annictoonvyám v lexikální databázi Pralex
Processing of Antonyms in the Pralex Lexical Database
............................................................................................................... 69 – 76
HZparnaac oGvoálnáíň noávzávů osob a jmen přechýlených v lexikální databázi Pralex
Processing of Personal Names and Gender Inflected Names in the Pralex Lexical Database
.................................................................................................................... 77 – 84
EKve az pProadcorvuáhnoí vráegionálních lexikálních jednotek v lexikální databázi Pralex
On Processing of Regional Lexical Units in the Pralex Lexical Database
.................................................................................................................... 85 – 93
VZáokjtlěadchn íV cehsaerlaýkteristika kompozit v lexikální databázi Pralex
Basic Characteristics of Compounds in the Pralex Lexical Database
...................................................................................................................... 95 – 103
JKaen zap Lraectoavfkáonví ázájmen v lexikální databázi Pralex
Processing of Pronouns in the Pralex Lexical Database
..................................................................................................................... 105 – 114
RZpardaecko vVáonlíe vjnlaísktních jmen v lexikální databázi Pralex
Processing of Proper Names in the Pralex Lexical Database
.................................................................................................................... 115 – 124
EZpvara Kcoovloánveí chkypáokoristik v lexikální databázi Pralex
Processing of Hypocorisms in the Pralex Lexical Database
...................................................................................................................... 125 – 136
Zpracování přirovnání v lexikální databázi Pralex
Processing of Similes in the Pralex Lexical Database
Zdeňka Opavská
................................................................................................................. 137 – 152
Zpracování víceslovných lexikálních jednotek v lexikální databázi
Pralex (se zaměřením na zpracování nefrazeologických víceslovných
lexémů)
PArlobceesnsian gR oaf nMgueltlio-Wvoard Lexical Units in the Pralex Lexical Database (with Focus on the
Processing of Non-Phraseological Multi-Word Lexemes)
.............................................................................................................. 153 – 164
ZTdypeoňlkoag iTe iacbhráeviačních útvarů v lexikální databázi Pralex
Typology of Abbreviated Forms in the Pralex Lexical Database
....................................................................................................................... 165 – 173
KJeldánroap Bísumzeánsnsyéo zvkáratky a značky ve slovnících a v lexikální databázi Pralex
One-Letter Abbreviations and Acronyms in Dictionaries and the Pralex Lexical Database
ne-
............................................................................................................... 175 – 191
K aspektom tvorenia antonymných lexém s prefixom ne -(nominácia,
lexikalizácia, pragmatické komponenty)
SJaomnae Hasapšeactns oovf áF, oNrmicaotilo Jna nofo čAknotovnáymous Lexemes with Prefix (Nomination,
Lexicalization, Pragmatic Components)
............................................................................... 193 – 205
ASlloevxeasnod arkao J laerxoikšoogvráafická výzva
Verb as a Lexicographic Challenge
.......................................................................................................... 207 – 218
Ustálené prirovnania: problémy ich chápania a lexikografického zachytenia
Similes: Problems of Their Understanding and Lexicographic Processing
Na úvod
Predkladaný zborník príspevkov je výsledkom spolupráce českého a slovenské-
ho lexikografickPérhinoc kípoyle ak tmíveut óvd ryá mtvcoir bspy ovlýokčlnaédhoov éphroo jselokvtun íÚkas tavu pro jazyk český
Akademie věd České republiky, v. v. i. a Jazykovedného ústavu Ľ. Štúra Slovenskej
akadémie vied 1 (Principles and Me-
thods of Compiling a Monolingual Dictionary) .
Obsah príspevkov predstavuje problémové okruhy, ktoré boli identifikované
v priebehu práce s bohatým lexikálnom materiálom a prediskutúvané na spoločných
pracovných stretnutiach uskutočnených striedavo na českom a slovenskom akade-
mickom pracovisku (2009 – 2011). Autori sa pri riešení nastolených otázok pokúsili
uplatniť nový, netradičný pohľad na jazykové javy, na princípy výstavbPyr iaclhex lexikolo-
gicko-lexikografického opisu a na používané počítačové nástroje.
Väčšiu časť rukopiVsyut vtvoořerinaí pdraátaceb átýzke alejúxcikeá slna íl ezáxiskoáblyn čeej sdkaéthaob ájazzyy ka poč,á ntkau k 2to1-.
srteoj lpetríacuje lexikografický kolektív v Ústave pro jazyk český AV ČR v Prahe v rámci
výskumného zámeru
(AV0Z90610521). V šestnástich príspevkoch sa podáva systematický výklad
problematiky spracovania lexikálnej databázy ako fundamentálnej opory budúce-
ho výkladového slovníka súčasnej češtiny, takže čitateľ dostáva komplexný obraz
databázy, získava prehľad o jej štruktúre, nadobúda hlbšie znalosti o jej funkciách,
o možnostiach jej využSiltoivan, aíklea dsúôčkalasndénheo s sal omveônžsek oébhoo zjnazáymkiať aj s problémami.
Tri slovenské príspevky vychádzajú zo skúseností z koncipovania a redigovania
prvých troch zväzkov (tlačou zatiaľ vyšli dva)
a ponúkajú nové riešenia niektorých koncepčných otázok (reinterpretácia typov an-
tonymie, opis vybraných slovesných kategórií s ohľadom na ich fungovanie v komu-
nikácii, prehodnotenie spracovania ustálených prirovnaní).
Redakcia
Lexikografie v kontextu informační společnosti
1 Ide o druhú etapu pokračujúceho projektu. Publikačným výstupom prvej etapy (2006 – 2008)
je zborník (2008).
7
Česká a slovenská výkladová lexikografia na začiatku 21. storočia.
Struktura a zpracování hesel v lexikální databázi Pralex1
Jindra Světlá
ÚTshtea vS ptrruo cjatuzyrke čaenskdý T ArVe aČtRm, ve. nv.t i .of the Entries in the Pralex Lexical Database
The article deals with the program as well as content part of the theoretical conception of
capturing Czech lexis in the form of a lexical database. It briefly outlines the development
of the Praled software and describes the overall structure of the Pralex LDB in terms of its
macrostructure as well as microstructure and the main principles of the treatment of database
items (the data obligatorily provided with every entry). The ending is devoted to the potential
of the application of this lexical database not only for a future monolingual dictionary and
specialised dictionaries but also for various linguistic research projects.
1. Úvod
Vytvoření databáze lexikální zásoby českého jazyka počátku 21. století
Cíl této databáze byl stanoven v zadání výzkumného záměru ÚJČ AV ČR, v. v. i.,
nazvaného : jde
o zp2racování a výzkum současné české slovní zásoby v rovině teoretické a materiá-
lové . Z hlediska rozsahu se v tomto projektu uvažovalo o celkovém počtu 100 000
až120 000 databázových položek. Tento počet však vycházel z předpokladu, že za-
koupíme hotový lexikografický software i podpůrné programy a rovnou začneme
databázi nvaýpclňhoovdaits.k Ze mme ptordoo vloygpircakcéohvoá hnlíe dviýskklaa mdoěvlaé hboýt s dloavtanbíákzue soodu zčaačsánték uč ekšotni--
cniypována tak, aby se její věcný obsah, tj. informace obsažená v každé její položce,
mohl stát
, který svým obsahemma tbeurdiáel oslvoýu žziátk jalakd p proro b věyžnpér aucžoivvaátneíl ep, řtíaskl upšrnoý úcčhe slylo zvpnraíkcoo--
vváýnchí p hřeirsoezleného jazyka v informačních technologiích; jednotlivé položky databáze
tedy mají sloužit jako
. Z tohoto zadání také vyplývá především popisná funkce této databáze
– zaměřujeme se na shromáždění a roztřídění jazykového materiál3u dokládajícího
především dnešní úzus (zatím výhradně na základě korpusu SYN ), nikoli na vy-
hodnocení současné lexikální normy; to bude cíl4em až následujícího úkolu, k němuž
v této databázi připravujeme rozsáhlé podklady .
Ve skutečnosti jsme se první dva roky projektu zabývali především vývojem
a zprovozněním naší vlastní databáze, protože pro potřebyV syltovovřaennsí kdýatcahb ájazez ylekxůik ánlincí
zásoby českého jazyka počátku 21. století
1 Příspěvek vznikl v rámci výzkumného záměru ÚJČ AV ČR, v. v. i.,
(AV0Z90610521), jehož vedoucím je doc. RNDr. Karel
Oliva, Dr.
2 K dalším úkolům v rámci tohoto výzkumného záměru viz Rangelova – Králík 2007, Rangelova
2008.
3 Od roku 2011 byl původní korpus SYN přejmenován na orig_syn.
4 Přihláška grantového projektu Vytvoření koncepce nového akademického výkladového
slovníku češtiny byla podána v roce 2011. Koncepce má vzniknout v letech 2012–2014 a na ni
by pak mělo navázat zpracování nového slovníku středního až velkého rozsahu (v elektronické
i tištěné podobě).
9
Česká a slovenská výkladová lexikografia na začiatku 21. storočia, 2011, s. 9–18.
Jindra Světlá
vhodného neexistovalo. Nejprve tedy byla v letech 2005–2006 vyvinuta bohatě
strukturovaná lexikální databáze, a to podle našeho vlastního návrhPuR vAeL EspDolupráci
s Centrem zpracování přirozeného jazyka FI MU v Brně. Spolpečrnoěg rvaymvi nutý lexiko-
grafický software specializovaný pro potřeby češtiny byl nazván (název
vznikl v Brně z označení “Pražská lexikální databáze”); tentos oftwarovopur oč ádsatt pabroá--
zjeokvtéu zpracování slovní zásoby spolu s navrženým jádrem databáze a uživatelským
rozhra5ním pro zápis dat, jejich zobrazení a vyhledávání tvoří teoretickou koncepci
zachy.c ení českého lexika formou lexikální databáze.
Zároveň bylo pochopitelně třeba pro naši práci vytvořit i
Ta je sice součástí zadání
celého projektu, ale proto, že na její přípravu nebyl vymezen dostatek času na po-
čátku úkolu (v souvislosti s potřebou vývoje vlastní databáze), tato koncepce vzniká
po jednotlivých částech průběžně po celou dobu projektu v závislosti na postupu
prací (podle toho, jaké úkoly aktuálně řešíme). Má dvě části – programovou (vývoj
Praledu) a opbrsoaghroavmouo v–é v čyámsetiz ednaít nabašáezhoov ép okjoetníc ae pstcaenovení zásad pro zpracování
jednotlivých slovních druhů a dílčích typů hesel.
V rámci jsme nejprve ve fázi vývoje
programu navrhli celkovou strukturu databáze, formuláře pro zápis dat pro jednot-
livé slovní druhy a v jejich rámci potřebné nástroje (samostatná okna) a v nich různé
položky – pole pro zápis dat, v relevantních případech i kompletní dílčí nabídky (ro-
letová menu), ze kterých se dají vybírat předem definované údaje. Při tvorbě databá-
zové koncepce jsme se zpočátku věnovali souběžně i přípravě kon6cepce budoucího
slovníku, který jsme pracovně nazvali Lexikon 21, zkráceně L21. Z tohoto důvodu
(pro budoucí slovník) jsme rovnou navrhli všechny položky a nabídky potřebné pro
komplexní lexikografický popis, i když nyní se všemi nepracujeme. Z časových i ji-
ných důvodů jsme se totiž museli postupně omezit pouze na koncepci databázo-
vou a vymezit jen zásady prop otzvvi.n znáék lpaodlnoí žzkpyracování databázových položek, které
není se slovníkovým zpracováním strzovv. nzáatkellandén –í hmoá z jpinréa ccoílveá i npíarametry. Proto byly
v roce 2007 vymezeny tzv. , které v rámci výzkumného záměru
vyplňujeme vždy – ty jsou součástí hesel v lexikální da-
tabázi (dále LDB) Pralex. obsahová
nápDlňruhou částí projektu (podle zadání výzkumného záměru jedinou, protože s vý-
vojem našíP vRlaAsLtnEíX d atabáze se v projektu původně vůbec nepočítalo) je data-
bázi slo zvp, rsolovvonzíncěhn tév adraůt aab sálzoev,n kícther sopuo jjesnmíe pro odlišení od části programové pracov-
ně nazvali (tato zkratka vznikla z označení “Pražský lexikon” – jde o
).
Lexikální databázi Pralexs jtsamneo vzeačnaíl zi ánsaapdlň porvoat z láekxilkaodgnría zfipckrayc roevleávnaínjtendímnoi tdlaivtyý cahž
psloo vzmníícnhě ndér ufáhzůi ,v rýevsopje. r aů tzensýtochvá tnyíp sůo fhtwesaerlu v, tdeadtya vb ápzroůvbéě hpuo drookbuě 2007. K tomu bylo
třeba se nejprve zaměřit na
. Průběžné zpraco-
5 Podrobně k etapám vývoje, struktuře heslového formuláře a funkcím LDB Praled viz Světlá
2008; viz též Pala et al. 2007.
Computer Treatment of Slavic and East European Langugages
6 Tento název jsme používali v letech 2005–2007, viz Světlá 2007 a další stati našeho kolektivu
publikované ve sborníku ,
Bratislava 2007 (SLOVKO 2007), které byly zaměřeny spíše k uvažované koncepci slovníkové.
10
Description:radio-, stereo- a zoo-. Jako příklady můžeme uvést kompozita agrometeorolog, antropogeograf, biokli- vitamín A (hovor. A-vitamín). 4. [á] neskl.