Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.
P15e83t90r 25K82r81á72l
V úvaze Michala Škopa postrádám přihlédnutí k tomu, že za chyby jsou považovány i duplicity, které ve druhém vzorku mohly vznikat i v důsledku přítomnosti shodného záznamu v 1. vzorku. Tudíž, za předpokladu, že rozhodující většina duplicit byla způsobena pouze dvojicemi shodných záznamů v rámci celého souboru, je zcela zákonité, že počet duplicit zjištěných ve 2. vzorku by měl být zhruba trojnásobný oproti počtu duplicit zjištěných v rámci 1. vzorku. Počet nalezených duplicit roste totiž s druhou mocninou velikosti zkoumaného vzorku, pro dvojnásobně velký vzorek složený z 1. a 2. vzorku by tudíž měl být čtyřnásobný, a protože první čtvrtina byla započtena již v chybovosti 1. vzorku, zbývající 3/4 lze očekávat ve druhém vzorku. Při tomto způsobu extrapolace chybovosti na celý soubor dat zveřejněný v rozhodnutí o paní Janě Bobošíkové vychází odhad chybovosti 15,24%, tj. o 1 procentní bod víc než dle vzorce použitého panem Václavem Henychem. Její vyřazení lze tudíž považovat za oprávněné.
J43a26n 19J85u80r43n78í10č35e47k
Postup schválený zákonodárci ale s vlivem duplicit nepočítá. mlčky předpokládá, že chybovost dostatečně velkého náhodně vybraného vzorku podpisů je stejná, jako chybovost celého souboru.
Mimoto - kde jste přišel na to, že chybovost pocházející z duplicit roste s kvadrátem velikosti vzorku?
K35a74r71e90l 49B60u52c30h84t29a
Ja tedy nejsem statistik, dokonce ani matematik, ale podle me se jedna o serii bernoulli nezavislych pokusu s pravd. p. Neboli nezavisle na sobe taham n=8500 jmen ze vsech signataru daneho kandidata (N), pricemz pravd. p, ze vytahnu nejake falesne jmeno, je odhadnuta jako celkova chybovost na obou kontrolnich vzorcich (tedy prumer z prvniho a druheho). Celkovy pocet vytazenych falesnych pak bude nahodna velicina s binom. rozdelenim, jehoz str. hodnota je n*p a rozptyl n*p*(1-p), viz wikipedia. Zadne odhady pomoci souctu kvadratu odchylek, na to by byly potreba vsechny podpisy z kontrolnich vzorku (i tak by to vyslo stejne). Vzhledem k velkemu n pak autor binom. rozdeleni aproximuje normalnim rozdelenim a na nem spocita pravd., ze chybovost na jednom dosahne namerene hodnoty nebo mene.
Nevim, jestli je vse koser, ptze napr. N neni nekonecno, tedy p neni konst., nebo zda by se to nemelo pocitat pres konf. intervaly apod., ale i tak vse naznacuje, ze vzorky nebyly zpracovany ekvivalentne.
K94a79r56e89l 78B47u39c23h67t43a
Toto mela byt reakce na Vladimír Hrubý, 25.11.2012 15:34.
V15l72a23d28i76m53í55r 60H28r31u35b54ý
K r á s n ý výpočet .... j e n jaksi vzorec ve sloupci "J" je použit zcela nepatřičně. Zřejmě kdosi (neznalý) chtěl vypočítat směrodatnou odchylku. Jenže ta se počítá z odchylek od průměru. Pokud pominu nesmyslně nízký počet případů (pouhé dva) pro vůbec nějaké statistické výpočty, je samozřejmě směrodatná odchylka pro dvě veličiny odmocninou ze dvou (1,41) krát odchylka od průměru, tedy pro pana Okimuru je směrodatná odchylka 1,80*1,41 = 2,55 %. S 99% (!!!) pravděpodobností budou tedy chyby v rozsahu (průměr +- 3,09 směrodatné odchylky) 21,15 % +- 7,86 %. Tedy v rozmezí 13,1 ÷ 28,8 %. (Znalcům statistiky se omlouvám, že vůbec s pouhými dvěma čísly ve statistice pracuji.)
Z á v ě r: Uváděný výpočet pravděpodobnosti je nesmyslem non plus ultra. Škoda, doposud jsem články autorů četl se zájmem.
D22a18l25i52b23o69r 65M32a47r93t97i62š76e62k
Já sice přímo znalec statistiky nejsem, ale za matematika se tak trochu považuji. Děsivé chyby ve výpočtu mě nepřekvapují. Já jsem článek odsoudil už včera (viz můj příspěvek z 24.11.2012 22:13) ze zcela jiného důvodu. A na výpočet jsem se prakticky ani nedíval.
O68n29d16ř43e14j 64Č41e91r41n61o61t52í24k
Zapomínáte na jednu důležitou věc - počet duplicitních podpisů bude větší ve dvou vzorcích než v jednom. Proto bude v druhém vzorku větší chybovost, což je také u většiny kandidátů pravda. A pokud někdo nabízel za každý podpis finanční odměnu, těch duplicitních podpisů může mít celkem dost.
D94a14l90i11b62o92r 50M67a48r74t36i34š68e57k
Řekl bych, že matematici ze sdružení KohoVolit.eu dělají ostudu své profesi. Především: ministerstvo vnitra nekontrolovalo pravost podpisů, ale adres a dat narození. Matematik by na tuto jemnou nuanci měl přijít a především se pozastavit nad volebním panoptikem jako celkem.
Při způsobu „získávání podpisů“, který není v rozporu se zákonem, a následném způsobu kontroly, který zákon přímo nařizuje, mají totiž poctivě získaná jména daleko menší naději na úspěch než jména zfalšovaná.. Kdejaký úředník na městském úřadě totiž může vyjet seznam tisíců údajných příznivců toho či onoho kandidáta na tiskárně – údaje jsou všechny čitelné a s minimem chyb. Zato poctivci, kteří oslovují lidi na ulici a vnucují jim do ruky propisky, budou mít hromadu údajů nečitelných nebo chybných a proti podvodníkům nemají šanci. Dělat z takto získaných dat výběr, ať už náhodný (jak to požaduje zákon a Michal Škop), anebo jakýkoliv jiný, je naprostý nesmysl. A něco počítat a vyvozovat je blbost ještě větší.
P44a94v20e74l 60K50u23l84a
Je mi to jasné. Náhodné by to bylo, kdyby oba vzorky byly naprosto stejné.
J36a53n 83N26o69v23á29k
Mě přijdou na celém tom sčítání pochybné dvě věci:
1) Proč se nekontrolovaly všechny podpisy? Prostě by se přijalo víc brigádníků než teď na tu 1/3 zkontrolovaných podpisů.
2) Který idiot proboha vymyslel ten vzorec na odpočet hlasů. Vidím jen dvě možnosti - blbej nebo navedenej.
V75i62k90t69o55r 69N27o56h92a
Ježišmarjá, zase spiklenecké teorie
Celá úvaha má jeden základní háček - ať vybíráte data ke kontrole jak chcete náhodně, nevybíráte mezi daty náhodně vzniklými. A na takovém vzorku opravdu nebudou jednoduché statistické postupy fungovat.
J31i86ř10í 11P10l20a77v47s26k46ý
no, a pak je tady jeste moznost, ze podpisove archy nekterych kandidatu vyrabeli studenti behem veselych veceru u lahvinky ... take jsem byl student, a take jsem si privydelaval "sberem dat pro sociologicke pruzkumy", ale vysledky podobnych statistickych setreni bych zpracovavat nenechal ani fisera ... i kdyz, fisera mozna zrovna jo
P32a36v47e71l 21K45u63r23a86l
Jistě že proč pracovat když je prakticky nemožné zjistit že člověk nic neudělal.