Wikidata:WikiProject Czech Republic/Pro instituce: Difference between revisions

From Wikidata
Jump to navigation Jump to search
Content deleted Content added
+poslední
Tag: 2017 source edit
Tag: 2017 source edit
Line 5: Line 5:


*'''Co jsou Wikidata a jak se liší od Wikipedie?''' – Zatímco Wikipedie je encyklopedie, Wikidata jsou databáze. Wikipedii čtou lidé, záznamy na Wikidatech procházejí především stroje (programy). Aby se ve Wikidatech byly stroje schopné orientovat, dodržuje tato databáze pevně danou strukturu dat. Jinak ovšem mají Wikipedie a Wikidata leccos společného – jsou to kolaborativní projekty spravované nadací Wikimedia, jsou licencované pod svobodnými licencemi a jsou vzájemně propojené. Pro každý článek na Wikipedii tak existuje jeden datový záznam (položka) ve Wikidatech. Naopak to ovšem neplatí – ne každá položka na Wikidatech musí mít článek na Wikipedii a některé položky asi článek mít nikdy nebudou. Ve Wikidatech totiž platí [[WD:Notability/cs|mnohem volnější pravidla významnosti]] objektů než na Wikipedii.
*'''Co jsou Wikidata a jak se liší od Wikipedie?''' – Zatímco Wikipedie je encyklopedie, Wikidata jsou databáze. Wikipedii čtou lidé, záznamy na Wikidatech procházejí především stroje (programy). Aby se ve Wikidatech byly stroje schopné orientovat, dodržuje tato databáze pevně danou strukturu dat. Jinak ovšem mají Wikipedie a Wikidata leccos společného – jsou to kolaborativní projekty spravované nadací Wikimedia, jsou licencované pod svobodnými licencemi a jsou vzájemně propojené. Pro každý článek na Wikipedii tak existuje jeden datový záznam (položka) ve Wikidatech. Naopak to ovšem neplatí – ne každá položka na Wikidatech musí mít článek na Wikipedii a některé položky asi článek mít nikdy nebudou. Ve Wikidatech totiž platí [[WD:Notability/cs|mnohem volnější pravidla významnosti]] objektů než na Wikipedii.
*'''Co z toho bude naše instituce/databáze mít? Jak na tom vyděláme?''' – Propojení vaší databáze s Wikidaty má pro vás celou řadu výhod kromě samotného faktu, že pomáháte dobré věci, na níž spolupracují lidé po celém světě a která slouží milionům uživatelů internetu každý den k získávání informací. Zaprvé se vaše data zviditelní – z Wikidat čerpá třeba Wikipedie, jeden z nejnavštěvovanějších webů na světě. Pomůžete jim najít správnou odpověď a navíc zvýšíte návštěvnost své databáze, protože údaje ve Wikidatech jsou vždy opatřené referencí (odkazem na původní zdroj – tedy vaši databázi). Vaše databáze se také posune o několik stupínků výše v kvalitě, neboť její napojení na Wikidata fakticky znamená vstupenku do vesmíru [[:en:Linked data|propojených dat]] (linked data). To dále umožní kontrolu správnosti vašich dat – srovnáním s jinými databázemi můžeme zjistit nesrovnalosti, které vám mohou posloužit pro další rozvíjení vaší databáze. '''Více na stránkách: [[Wikidata:Data_donation/cs|Wikidata:Darování dat]] a [[Wikidata:WikiProject_Czech_Republic/Příklady spolupráce s institucemi#Národní knihovna České republiky|Příklady spolupráce s institucemi: Národní knihovna České republiky]]'''
*'''Co z toho bude naše instituce/databáze mít? Jak na tom vyděláme?''' – Propojení vaší databáze s Wikidaty má pro vás celou řadu výhod kromě samotného faktu, že pomáháte dobré věci, na níž spolupracují lidé po celém světě a která slouží milionům uživatelů internetu každý den k získávání informací. Zaprvé se vaše data zviditelní – z Wikidat čerpá třeba Wikipedie, jeden z nejnavštěvovanějších webů na světě. Pomůžete jim najít správnou odpověď a navíc zvýšíte návštěvnost své databáze, protože údaje ve Wikidatech jsou vždy opatřené referencí (odkazem na původní zdroj – tedy vaši databázi). Vaše databáze se také posune o několik stupínků výše v kvalitě, neboť její napojení na Wikidata fakticky znamená vstupenku do vesmíru [[:en:Linked data|propojených dat]] (linked data). To dále umožní kontrolu správnosti vašich dat – srovnáním s jinými databázemi můžeme zjistit nesrovnalosti, které vám mohou posloužit pro další rozvíjení vaší databáze. '''Více na stránkách: [[Wikidata:Data_donation/cs|Wikidata:Darování dat]]<!-- a [[Wikidata:WikiProject_Czech_Republic/Příklady spolupráce s institucemi#Národní knihovna České republiky|Příklady spolupráce s institucemi: Národní knihovna České republiky]]'''-->
*'''Jak mohu data kontrolovat poté, co byla importována do Wikidat?''' – Data, která importujeme do Wikidat, se stávají součástí kolektivně budované databáze, kterou může kdokoliv dále upravovat (včetně vás). Vaše instituce nemá formálně silnější slovo než zbytek komunity, ale v praxi autoritám pečlivě nasloucháme. Některé databáze pečlivě sledují vývoj "své" datové sady na Wikidatech, protože to pro ně představuje zajímavý zdroj informací o vlastní databázi. Například je možné srovnávat shodu některých parametrů mezi Wikidaty a vaší databází (u personálních databází například porovnávat datum narození) a tím vyhledávat zřejmé rozpory mezi oběma databázemi. '''Více na stránce: [[Wikidata:WikiProject_Czech_Republic/Příklady spolupráce s institucemi#Křížky a vetřelci|Příklady spolupráce s institucemi: Křížky a vetřelci]]'''
*'''Jak mohu data kontrolovat poté, co byla importována do Wikidat?''' – Data, která importujeme do Wikidat, se stávají součástí kolektivně budované databáze, kterou může kdokoliv dále upravovat (včetně vás). Vaše instituce nemá formálně silnější slovo než zbytek komunity, ale v praxi autoritám pečlivě nasloucháme. Některé databáze pečlivě sledují vývoj "své" datové sady na Wikidatech, protože to pro ně představuje zajímavý zdroj informací o vlastní databázi. Například je možné srovnávat shodu některých parametrů mezi Wikidaty a vaší databází (u personálních databází například porovnávat datum narození) a tím vyhledávat zřejmé rozpory mezi oběma databázemi.<!-- '''Více na stránce: [[Wikidata:WikiProject_Czech_Republic/Příklady spolupráce s institucemi#Křížky a vetřelci|Příklady spolupráce s institucemi: Křížky a vetřelci]]'''-->
*'''Jak v rámci pravidel Wikidat maximálně zajistit uvedení původu dat (externí odkazy z Wikidat směrem do institucí, abychom si uchovali návštěvnost)? Můžete garantovat odkazy z Wikidat a Wikipedie?''' – Pokud od vás získáme data, dle pravidel na Wikidatech budete u každého údaje uvedeni jako původce i s odkazem na něj. Výhodou pro vás bude, pokud půjde vaše data nějak identifikovat (unikátní identifikátory či [[w:Permalink|permalinky]], kontrolní součet, …), protože takové odkazy tolik [[w:Link rot|nezastarávají]]. Odkazy z Wikipedie nebo od jiných uživatelů dat garantovat nemůžeme, protože data jsou na Wikidatech dostupná pod [https://creativecommons.org/publicdomain/zero/1.0/deed.cs licencí CC-0], která po třetích stranách nevyžaduje uvedení původu. Platí, že pro Wikipedii i pro mnohé třetí strany bývají zajímavější data s označením původu (zdroje), neboť působí hodnověrněji, takže tuto skutečnost například Wikipedie často uvádí [[w:cs:Wikipedie:Reference|formou řádkových referencí]] na původní pramen informací.
*'''Jak v rámci pravidel Wikidat maximálně zajistit uvedení původu dat (externí odkazy z Wikidat směrem do institucí, abychom si uchovali návštěvnost)? Můžete garantovat odkazy z Wikidat a Wikipedie?''' – Pokud od vás získáme data, dle pravidel na Wikidatech budete u každého údaje uvedeni jako původce i s odkazem na něj. Výhodou pro vás bude, pokud půjde vaše data nějak identifikovat (unikátní identifikátory či [[w:Permalink|permalinky]], kontrolní součet, …), protože takové odkazy tolik [[w:Link rot|nezastarávají]]. Odkazy z Wikipedie nebo od jiných uživatelů dat garantovat nemůžeme, protože data jsou na Wikidatech dostupná pod [https://creativecommons.org/publicdomain/zero/1.0/deed.cs licencí CC-0], která po třetích stranách nevyžaduje uvedení původu. Platí, že pro Wikipedii i pro mnohé třetí strany bývají zajímavější data s označením původu (zdroje), neboť působí hodnověrněji, takže tuto skutečnost například Wikipedie často uvádí [[w:cs:Wikipedie:Reference|formou řádkových referencí]] na původní pramen informací.



Revision as of 14:32, 8 January 2020

Otázky byly sesbírány na technickém setkání české komunity Wikimedia na hackathonu v Národní technické knihovně

Úkolem této stránky je poskytnout odpovědi na základní otázky, které si kladou české instituce při seznamování s Wikidaty. Odpovědi byly sestaveny na základě dotazování české technické komunity tak, aby co nejvíce odpovídaly převládajícím pravidlům, normám a zvyklostem. Pokud zde nenajdete to, co jste hledali, budeme rádi, když na diskuzní stránce váš problém popíšete.

Principiální otázky

  • Co jsou Wikidata a jak se liší od Wikipedie? – Zatímco Wikipedie je encyklopedie, Wikidata jsou databáze. Wikipedii čtou lidé, záznamy na Wikidatech procházejí především stroje (programy). Aby se ve Wikidatech byly stroje schopné orientovat, dodržuje tato databáze pevně danou strukturu dat. Jinak ovšem mají Wikipedie a Wikidata leccos společného – jsou to kolaborativní projekty spravované nadací Wikimedia, jsou licencované pod svobodnými licencemi a jsou vzájemně propojené. Pro každý článek na Wikipedii tak existuje jeden datový záznam (položka) ve Wikidatech. Naopak to ovšem neplatí – ne každá položka na Wikidatech musí mít článek na Wikipedii a některé položky asi článek mít nikdy nebudou. Ve Wikidatech totiž platí mnohem volnější pravidla významnosti objektů než na Wikipedii.
  • Co z toho bude naše instituce/databáze mít? Jak na tom vyděláme? – Propojení vaší databáze s Wikidaty má pro vás celou řadu výhod kromě samotného faktu, že pomáháte dobré věci, na níž spolupracují lidé po celém světě a která slouží milionům uživatelů internetu každý den k získávání informací. Zaprvé se vaše data zviditelní – z Wikidat čerpá třeba Wikipedie, jeden z nejnavštěvovanějších webů na světě. Pomůžete jim najít správnou odpověď a navíc zvýšíte návštěvnost své databáze, protože údaje ve Wikidatech jsou vždy opatřené referencí (odkazem na původní zdroj – tedy vaši databázi). Vaše databáze se také posune o několik stupínků výše v kvalitě, neboť její napojení na Wikidata fakticky znamená vstupenku do vesmíru propojených dat (linked data). To dále umožní kontrolu správnosti vašich dat – srovnáním s jinými databázemi můžeme zjistit nesrovnalosti, které vám mohou posloužit pro další rozvíjení vaší databáze. Více na stránkách: Wikidata:Darování dat
  • Jak mohu data kontrolovat poté, co byla importována do Wikidat? – Data, která importujeme do Wikidat, se stávají součástí kolektivně budované databáze, kterou může kdokoliv dále upravovat (včetně vás). Vaše instituce nemá formálně silnější slovo než zbytek komunity, ale v praxi autoritám pečlivě nasloucháme. Některé databáze pečlivě sledují vývoj "své" datové sady na Wikidatech, protože to pro ně představuje zajímavý zdroj informací o vlastní databázi. Například je možné srovnávat shodu některých parametrů mezi Wikidaty a vaší databází (u personálních databází například porovnávat datum narození) a tím vyhledávat zřejmé rozpory mezi oběma databázemi.
  • Jak v rámci pravidel Wikidat maximálně zajistit uvedení původu dat (externí odkazy z Wikidat směrem do institucí, abychom si uchovali návštěvnost)? Můžete garantovat odkazy z Wikidat a Wikipedie? – Pokud od vás získáme data, dle pravidel na Wikidatech budete u každého údaje uvedeni jako původce i s odkazem na něj. Výhodou pro vás bude, pokud půjde vaše data nějak identifikovat (unikátní identifikátory či permalinky, kontrolní součet, …), protože takové odkazy tolik nezastarávají. Odkazy z Wikipedie nebo od jiných uživatelů dat garantovat nemůžeme, protože data jsou na Wikidatech dostupná pod licencí CC-0, která po třetích stranách nevyžaduje uvedení původu. Platí, že pro Wikipedii i pro mnohé třetí strany bývají zajímavější data s označením původu (zdroje), neboť působí hodnověrněji, takže tuto skutečnost například Wikipedie často uvádí formou řádkových referencí na původní pramen informací.

Právní otázky

  • Co je to licence CC-0? – Licence CC-0, pod níž je publikován veškerý obsah na Wikidatech, dává svolení s vystavením díla jako díla volného bez jakýchkoliv dalších podmínek. Veškerá data na Wikidatech jsou distribuována pod touto licencí. Chce-li kdokoliv užít data z Wikidat, nemusí uvádět ani zdroj těchto dat. Přesto Wikidata na základě svých vnitřních pravidel vždy uvádí zdroj dat, a to formou referencí (odkazů) na původní pramen dané informace. Licencí CC-0 se dále vzdáváme i tzv. zvláštního práva pořizovatele databáze (další informace dále).
  • Co je to vzdání se práv pořizovatele databáze? A kde je hranice systematického vytěžování? Může pořizovatel databáze vyjádřit souhlas jen ústně/písemně/e-mailem (a jak má takový souhlas vypadat)? – Databáze vytvořené občany a rezidenty Evropské unie a organizacemi se sídlem v EU podléhají speciálnímu typu autorskoprávní ochrany, tzv. právu pořizovatele databáze, které upravuje systematické vytěžování databází a v praxi představuje jedinou právní překážku pro využití většiny databází. Pokud tedy chceme do Wikidat systematicky přenést databázi vytvořenou českými občany či společnostmi, musí se pořizovatel databáze tohoto zvláštního práva vzdát. Nejvhodnějším způsobem je licencovat svou databázi pod licencí CC-0, připouštíme i prosté vzdání se práv pořizovatele databáze, například e-mailem či písemně (ústní svolení není vhodné). Wikidata postupně zpřesňují svá pravidla a postupy pro zpřístupňování datových sad.
  • Je možné propojit databázi s Wikidaty (odkazováním na identifikátor), aniž bychom měli souhlas pořizovatele databáze? – Propojení databází na základě importu vašich unikátních identifikátorů je dobrým prvním krokem v přípravě dlouhodobé spolupráce, protože skutečně nevyžaduje souhlas pořizovatele (provozovatele) databáze. Zjednodušeně řečeno, jedná se o prosté odkazování, a nikoliv vytěžování databáze. Po tomto propojení je daleko jednodušší následný import (který už často podléhá svolení pořizovatele databáze).
  • Naši databázi tvoří komunita přispěvatelů. Můžeme ji jako pořizovatelé importovat do Wikidat, nebo se musíme zeptat jednotlivých vkladatelů? – Pokud je již databáze vytvářena pod licencí CC-0, není potřeba se přispěvatelů ptát. Pokud je však nutná změna licencování vašich dat, situace může být složitější. Nejprve je nutné si ujasnit, zda jsou výstupem činnosti jednotlivých vkladatelů autorská díla, podléhající ochraně podle autorského zákona (například multimédia nebo dlouhé texty). V mnoha případech jsou záznamy v databázi spíše strukturovanými tabulkovými přehledy, na které se pravděpodobně autorskoprávní ochrana nevztahuje, a v tom případě přichází v úvahu jen zvláštní právo pořizovatele databáze. Práce jednotlivých přispěvatelů se ovšem většinou nedá klasifikovat jako pořizování celé databáze. Výjimkou jsou snad případy, kdy konkrétní jedinci přispěli do databáze procentuálně vysokým počtem záznamů a tehdy je vhodné získat jejich výslovné svolení.
  • Nebrání ve sdílení našich dat evropská směrnice GDPR? – Mnoho databází žádné osobní údaje ve smyslu evropské směrnice GDPR neobsahuje a v tom případě si není nutné dělat starosti. Pokud vaše databáze osobní údaje shromažďuje a jsou veřejně přístupné, pak již pravděpodobně musela pro práci s nimi získat patřičné svolení. Wikidata zatím příliš nepracují s neveřejnými databázemi, kde by mohl být problém s ochranou osobních dat – mj. proto, že Wikidata se snaží uvádět zdroj pro každé tvrzení, jež obsahují, což se pro data z uzavřených databází dělá jen velmi těžko.
  • Mohu jako "řádný hospodář" dovolit import dat naší instituce do Wikidat? Nebudu právně popotahován? – Ano, mohu. Právní úprava nakládání s majetkem státu jako jeden ze základních důvodů pro využití majetku státu jeho organizačními složkami uvádí „plnění funkcí státu“ s přidanou povinností, že majetek musí být využíván účelně a hospodárně. Poskytování a šíření informací veřejného sektoru, které umožňuje následné využití je plněním funkcí státu. To vyplývá zejména z evropské právní úpravy informací veřejného sektoru (směrnice 2003/98/ES). Krom toho, pokud databáze není nijak chráněná (například proto, že už došlo ke vzdání se práv pořizovatele databáze, případně proto, že tam žádná práva ani nebyla), není možné hovořit o tom, že by importem došlo k nakládání s majetkem. Samotná data nejsou nijak právně chráněná.

Podrobné informace o autorskoprávní ochraně databází najdete také na stránce Stanovení podmínek užití otevřených dat na opendata.gov.cz (návod na vytvoření licenčních oprávnění pro bezproblémové užití otevřených dat).

Logistické otázky

  • Naši lidé na to nemají čas. Co s tím? Koho kontaktovat? – Wikidata jsou projekt nadace Wikimedia Foundation a v České republice jim zajišťuje institucionální podporu spolek Wikimedia Česká republika. V otázkách týkajících se Wikidat nás můžete kontaktovat na adrese databazewikimedia.cz. Spolek vám z kapacitních důvodů nemůže garantovat plnou realizaci vašich záměrů, ale pokusíme se odpovědět na vaše otázky a poradit ohledně dalšího postupu. U dlouhodobějších či složitějších projektů se ve světě osvědčuje model tzv. wikidatistů „in residence“ (wikidatistů-rezidentů), kteří jsou na určitou dobu najímáni organizacemi k realizaci vašich záměrů. Můžeme vám pomoci najít tu správnou osobu a metodicky ji společně s vámi vést. Se svými dotazy a návrhy se také můžete zkusit obrátit na českou komunitu dobrovolníků spravujících Wikidata – nejživější diskuze naleznete na Facebooku ve skupině Wikidata CS.
  • Jak dlouho bude import trvat? – Samotný import dat je obvykle otázka několika hodin, ale příprava dat může trvat velmi dlouho. V první fázi je potřeba ujasnit si datový model vhodný pro váš typ dat a založit případně nové vlastnosti na míru vašim databázím. V druhé fázi musíme spárovat vaše data s existujícími položkami ve Wikidatech, aby importem nevznikly zbytečné duplicity. Teprve pak následuje import, po němž ještě data zkontrolujeme a opravíme. Je potřeba počítat s tím, že ne vždy se hned najde dobrovolník ochotný pracovat s vašimi daty, někdy to trvá.
  • Záznamy v naší databázi už položky ve Wikidatech mají, jen nejsou propojeny. Není to problém? – Propojení dvou databází vždy představuje výzvu pro jejich provozovatele. Na Wikidatech s propojováním databází máme velké zkušenosti. Velmi pomůže, pokud vaše databáze už používá unikátní identifikátory (například číselné kódy odpovídající jednotlivým záznamům ve vaší databázi). Těmto identifikátorům založíme tzv. vlastnost na Wikidatech. K samotnému spárování s existujícími záznamy používáme různé metody – k těm automatickým patří párování podle společného identifikátoru, jež obě databáze už evidují, nebo u osob např. párování podle stejného jména a data narození. Poloautomatické a manuální propojení zpravidla realizujeme za pomoci různých nástrojů, jako je Mix'n'Match nebo POI Import.
  • K databázi neexistují žádné Wikidata položky, je to „pole neorané“. Není to problém? – To naopak může situaci usnadnit. Proces párování je poměrně pracná záležitost a zabere mnoho času. Pokud záznamy ve vaší databázi splňují definici záznamů ve Wikidatech, nic nebrání jejich importování do Wikidat, i kdyby to mělo vést k vytvoření tisíců nových položek.