Děkujeme za pochopení.
P89e68t70r 82K22r94á33l
V úvaze Michala Škopa postrádám přihlédnutí k tomu, že za chyby jsou považovány i duplicity, které ve druhém vzorku mohly vznikat i v důsledku přítomnosti shodného záznamu v 1. vzorku. Tudíž, za předpokladu, že rozhodující většina duplicit byla způsobena pouze dvojicemi shodných záznamů v rámci celého souboru, je zcela zákonité, že počet duplicit zjištěných ve 2. vzorku by měl být zhruba trojnásobný oproti počtu duplicit zjištěných v rámci 1. vzorku. Počet nalezených duplicit roste totiž s druhou mocninou velikosti zkoumaného vzorku, pro dvojnásobně velký vzorek složený z 1. a 2. vzorku by tudíž měl být čtyřnásobný, a protože první čtvrtina byla započtena již v chybovosti 1. vzorku, zbývající 3/4 lze očekávat ve druhém vzorku. Při tomto způsobu extrapolace chybovosti na celý soubor dat zveřejněný v rozhodnutí o paní Janě Bobošíkové vychází odhad chybovosti 15,24%, tj. o 1 procentní bod víc než dle vzorce použitého panem Václavem Henychem. Její vyřazení lze tudíž považovat za oprávněné.
J52a29n 74J83u27r98n81í28č31e64k
Postup schválený zákonodárci ale s vlivem duplicit nepočítá. mlčky předpokládá, že chybovost dostatečně velkého náhodně vybraného vzorku podpisů je stejná, jako chybovost celého souboru.
Mimoto - kde jste přišel na to, že chybovost pocházející z duplicit roste s kvadrátem velikosti vzorku?
K95a97r31e10l 34B40u70c45h58t94a
Ja tedy nejsem statistik, dokonce ani matematik, ale podle me se jedna o serii bernoulli nezavislych pokusu s pravd. p. Neboli nezavisle na sobe taham n=8500 jmen ze vsech signataru daneho kandidata (N), pricemz pravd. p, ze vytahnu nejake falesne jmeno, je odhadnuta jako celkova chybovost na obou kontrolnich vzorcich (tedy prumer z prvniho a druheho). Celkovy pocet vytazenych falesnych pak bude nahodna velicina s binom. rozdelenim, jehoz str. hodnota je n*p a rozptyl n*p*(1-p), viz wikipedia. Zadne odhady pomoci souctu kvadratu odchylek, na to by byly potreba vsechny podpisy z kontrolnich vzorku (i tak by to vyslo stejne). Vzhledem k velkemu n pak autor binom. rozdeleni aproximuje normalnim rozdelenim a na nem spocita pravd., ze chybovost na jednom dosahne namerene hodnoty nebo mene.
Nevim, jestli je vse koser, ptze napr. N neni nekonecno, tedy p neni konst., nebo zda by se to nemelo pocitat pres konf. intervaly apod., ale i tak vse naznacuje, ze vzorky nebyly zpracovany ekvivalentne.
K33a50r36e24l 87B25u71c11h13t91a
Toto mela byt reakce na Vladimír Hrubý, 25.11.2012 15:34.
V65l69a27d77i53m14í15r 17H25r90u28b95ý
K r á s n ý výpočet .... j e n jaksi vzorec ve sloupci "J" je použit zcela nepatřičně. Zřejmě kdosi (neznalý) chtěl vypočítat směrodatnou odchylku. Jenže ta se počítá z odchylek od průměru. Pokud pominu nesmyslně nízký počet případů (pouhé dva) pro vůbec nějaké statistické výpočty, je samozřejmě směrodatná odchylka pro dvě veličiny odmocninou ze dvou (1,41) krát odchylka od průměru, tedy pro pana Okimuru je směrodatná odchylka 1,80*1,41 = 2,55 %. S 99% (!!!) pravděpodobností budou tedy chyby v rozsahu (průměr +- 3,09 směrodatné odchylky) 21,15 % +- 7,86 %. Tedy v rozmezí 13,1 ÷ 28,8 %. (Znalcům statistiky se omlouvám, že vůbec s pouhými dvěma čísly ve statistice pracuji.)
Z á v ě r: Uváděný výpočet pravděpodobnosti je nesmyslem non plus ultra. Škoda, doposud jsem články autorů četl se zájmem.
D68a68l45i52b51o58r 73M56a81r22t93i93š58e55k
Já sice přímo znalec statistiky nejsem, ale za matematika se tak trochu považuji. Děsivé chyby ve výpočtu mě nepřekvapují. Já jsem článek odsoudil už včera (viz můj příspěvek z 24.11.2012 22:13) ze zcela jiného důvodu. A na výpočet jsem se prakticky ani nedíval.
O91n16d64ř40e17j 61Č26e41r52n86o31t70í69k
Zapomínáte na jednu důležitou věc - počet duplicitních podpisů bude větší ve dvou vzorcích než v jednom. Proto bude v druhém vzorku větší chybovost, což je také u většiny kandidátů pravda. A pokud někdo nabízel za každý podpis finanční odměnu, těch duplicitních podpisů může mít celkem dost.
D36a35l67i55b52o72r 30M51a38r44t82i57š32e82k
Řekl bych, že matematici ze sdružení KohoVolit.eu dělají ostudu své profesi. Především: ministerstvo vnitra nekontrolovalo pravost podpisů, ale adres a dat narození. Matematik by na tuto jemnou nuanci měl přijít a především se pozastavit nad volebním panoptikem jako celkem.
Při způsobu „získávání podpisů“, který není v rozporu se zákonem, a následném způsobu kontroly, který zákon přímo nařizuje, mají totiž poctivě získaná jména daleko menší naději na úspěch než jména zfalšovaná.. Kdejaký úředník na městském úřadě totiž může vyjet seznam tisíců údajných příznivců toho či onoho kandidáta na tiskárně – údaje jsou všechny čitelné a s minimem chyb. Zato poctivci, kteří oslovují lidi na ulici a vnucují jim do ruky propisky, budou mít hromadu údajů nečitelných nebo chybných a proti podvodníkům nemají šanci. Dělat z takto získaných dat výběr, ať už náhodný (jak to požaduje zákon a Michal Škop), anebo jakýkoliv jiný, je naprostý nesmysl. A něco počítat a vyvozovat je blbost ještě větší.
P94a58v12e73l 75K60u39l13a
Je mi to jasné. Náhodné by to bylo, kdyby oba vzorky byly naprosto stejné.
J13a37n 37N89o35v27á30k
Mě přijdou na celém tom sčítání pochybné dvě věci:
1) Proč se nekontrolovaly všechny podpisy? Prostě by se přijalo víc brigádníků než teď na tu 1/3 zkontrolovaných podpisů.
2) Který idiot proboha vymyslel ten vzorec na odpočet hlasů. Vidím jen dvě možnosti - blbej nebo navedenej.
V69i60k50t34o66r 32N86o57h90a
Ježišmarjá, zase spiklenecké teorie
Celá úvaha má jeden základní háček - ať vybíráte data ke kontrole jak chcete náhodně, nevybíráte mezi daty náhodně vzniklými. A na takovém vzorku opravdu nebudou jednoduché statistické postupy fungovat.
J22i54ř20í 39P33l27a64v27s24k81ý
no, a pak je tady jeste moznost, ze podpisove archy nekterych kandidatu vyrabeli studenti behem veselych veceru u lahvinky ... take jsem byl student, a take jsem si privydelaval "sberem dat pro sociologicke pruzkumy", ale vysledky podobnych statistickych setreni bych zpracovavat nenechal ani fisera ... i kdyz, fisera mozna zrovna jo
P93a34v18e74l 31K16u97r26a71l
Jistě že proč pracovat když je prakticky nemožné zjistit že člověk nic neudělal.