Děkujeme za pochopení.
P46e84t35r 35K76r71á57l
V úvaze Michala Škopa postrádám přihlédnutí k tomu, že za chyby jsou považovány i duplicity, které ve druhém vzorku mohly vznikat i v důsledku přítomnosti shodného záznamu v 1. vzorku. Tudíž, za předpokladu, že rozhodující většina duplicit byla způsobena pouze dvojicemi shodných záznamů v rámci celého souboru, je zcela zákonité, že počet duplicit zjištěných ve 2. vzorku by měl být zhruba trojnásobný oproti počtu duplicit zjištěných v rámci 1. vzorku. Počet nalezených duplicit roste totiž s druhou mocninou velikosti zkoumaného vzorku, pro dvojnásobně velký vzorek složený z 1. a 2. vzorku by tudíž měl být čtyřnásobný, a protože první čtvrtina byla započtena již v chybovosti 1. vzorku, zbývající 3/4 lze očekávat ve druhém vzorku. Při tomto způsobu extrapolace chybovosti na celý soubor dat zveřejněný v rozhodnutí o paní Janě Bobošíkové vychází odhad chybovosti 15,24%, tj. o 1 procentní bod víc než dle vzorce použitého panem Václavem Henychem. Její vyřazení lze tudíž považovat za oprávněné.
J85a92n 14J61u41r95n46í70č81e67k
Postup schválený zákonodárci ale s vlivem duplicit nepočítá. mlčky předpokládá, že chybovost dostatečně velkého náhodně vybraného vzorku podpisů je stejná, jako chybovost celého souboru.
Mimoto - kde jste přišel na to, že chybovost pocházející z duplicit roste s kvadrátem velikosti vzorku?
K31a92r51e88l 79B13u91c48h27t70a
Ja tedy nejsem statistik, dokonce ani matematik, ale podle me se jedna o serii bernoulli nezavislych pokusu s pravd. p. Neboli nezavisle na sobe taham n=8500 jmen ze vsech signataru daneho kandidata (N), pricemz pravd. p, ze vytahnu nejake falesne jmeno, je odhadnuta jako celkova chybovost na obou kontrolnich vzorcich (tedy prumer z prvniho a druheho). Celkovy pocet vytazenych falesnych pak bude nahodna velicina s binom. rozdelenim, jehoz str. hodnota je n*p a rozptyl n*p*(1-p), viz wikipedia. Zadne odhady pomoci souctu kvadratu odchylek, na to by byly potreba vsechny podpisy z kontrolnich vzorku (i tak by to vyslo stejne). Vzhledem k velkemu n pak autor binom. rozdeleni aproximuje normalnim rozdelenim a na nem spocita pravd., ze chybovost na jednom dosahne namerene hodnoty nebo mene.
Nevim, jestli je vse koser, ptze napr. N neni nekonecno, tedy p neni konst., nebo zda by se to nemelo pocitat pres konf. intervaly apod., ale i tak vse naznacuje, ze vzorky nebyly zpracovany ekvivalentne.
K73a75r49e96l 84B26u85c34h32t63a
Toto mela byt reakce na Vladimír Hrubý, 25.11.2012 15:34.
V61l70a45d11i95m22í45r 63H45r54u82b57ý
K r á s n ý výpočet .... j e n jaksi vzorec ve sloupci "J" je použit zcela nepatřičně. Zřejmě kdosi (neznalý) chtěl vypočítat směrodatnou odchylku. Jenže ta se počítá z odchylek od průměru. Pokud pominu nesmyslně nízký počet případů (pouhé dva) pro vůbec nějaké statistické výpočty, je samozřejmě směrodatná odchylka pro dvě veličiny odmocninou ze dvou (1,41) krát odchylka od průměru, tedy pro pana Okimuru je směrodatná odchylka 1,80*1,41 = 2,55 %. S 99% (!!!) pravděpodobností budou tedy chyby v rozsahu (průměr +- 3,09 směrodatné odchylky) 21,15 % +- 7,86 %. Tedy v rozmezí 13,1 ÷ 28,8 %. (Znalcům statistiky se omlouvám, že vůbec s pouhými dvěma čísly ve statistice pracuji.)
Z á v ě r: Uváděný výpočet pravděpodobnosti je nesmyslem non plus ultra. Škoda, doposud jsem články autorů četl se zájmem.
D89a93l88i88b58o72r 66M80a43r85t58i11š83e20k
Já sice přímo znalec statistiky nejsem, ale za matematika se tak trochu považuji. Děsivé chyby ve výpočtu mě nepřekvapují. Já jsem článek odsoudil už včera (viz můj příspěvek z 24.11.2012 22:13) ze zcela jiného důvodu. A na výpočet jsem se prakticky ani nedíval.
O52n16d75ř24e20j 22Č47e28r15n59o57t50í92k
Zapomínáte na jednu důležitou věc - počet duplicitních podpisů bude větší ve dvou vzorcích než v jednom. Proto bude v druhém vzorku větší chybovost, což je také u většiny kandidátů pravda. A pokud někdo nabízel za každý podpis finanční odměnu, těch duplicitních podpisů může mít celkem dost.
D67a67l37i13b71o86r 25M84a55r18t95i66š22e67k
Řekl bych, že matematici ze sdružení KohoVolit.eu dělají ostudu své profesi. Především: ministerstvo vnitra nekontrolovalo pravost podpisů, ale adres a dat narození. Matematik by na tuto jemnou nuanci měl přijít a především se pozastavit nad volebním panoptikem jako celkem.
Při způsobu „získávání podpisů“, který není v rozporu se zákonem, a následném způsobu kontroly, který zákon přímo nařizuje, mají totiž poctivě získaná jména daleko menší naději na úspěch než jména zfalšovaná.. Kdejaký úředník na městském úřadě totiž může vyjet seznam tisíců údajných příznivců toho či onoho kandidáta na tiskárně – údaje jsou všechny čitelné a s minimem chyb. Zato poctivci, kteří oslovují lidi na ulici a vnucují jim do ruky propisky, budou mít hromadu údajů nečitelných nebo chybných a proti podvodníkům nemají šanci. Dělat z takto získaných dat výběr, ať už náhodný (jak to požaduje zákon a Michal Škop), anebo jakýkoliv jiný, je naprostý nesmysl. A něco počítat a vyvozovat je blbost ještě větší.
P51a29v74e21l 43K27u85l68a
Je mi to jasné. Náhodné by to bylo, kdyby oba vzorky byly naprosto stejné.
J38a86n 30N44o70v19á70k
Mě přijdou na celém tom sčítání pochybné dvě věci:
1) Proč se nekontrolovaly všechny podpisy? Prostě by se přijalo víc brigádníků než teď na tu 1/3 zkontrolovaných podpisů.
2) Který idiot proboha vymyslel ten vzorec na odpočet hlasů. Vidím jen dvě možnosti - blbej nebo navedenej.
V87i38k41t18o78r 97N23o16h82a
Ježišmarjá, zase spiklenecké teorie
Celá úvaha má jeden základní háček - ať vybíráte data ke kontrole jak chcete náhodně, nevybíráte mezi daty náhodně vzniklými. A na takovém vzorku opravdu nebudou jednoduché statistické postupy fungovat.
J40i47ř23í 33P17l97a38v50s82k37ý
no, a pak je tady jeste moznost, ze podpisove archy nekterych kandidatu vyrabeli studenti behem veselych veceru u lahvinky ... take jsem byl student, a take jsem si privydelaval "sberem dat pro sociologicke pruzkumy", ale vysledky podobnych statistickych setreni bych zpracovavat nenechal ani fisera ... i kdyz, fisera mozna zrovna jo
P26a15v24e66l 79K63u58r42a68l
Jistě že proč pracovat když je prakticky nemožné zjistit že člověk nic neudělal.