Blog iDNES.cz

iDNES.cz

Premium

Získejte všechny články
jen za 49 Kč / 1. měsíc

Politika
- Politická aréna
Ekonomika
- Energetika
Společnost
Kultura
Poezie a próza
Ostatní
- Sport
- Cestování
- Miniblogy
- Pozvánky, akce
- Osobní
- Hobby
- Ona
Hyde park
Blogeři
Můj Blog

Diskuse

Matematik: Další nesrovnalost s prezidentskými podpisy

Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.

P89e68t70r 82K22r94á33l

28. 11. 2012 18:44

V úvaze Michala Škopa postrádám přihlédnutí k tomu, že za chyby jsou považovány i duplicity, které ve druhém vzorku mohly vznikat i v důsledku přítomnosti shodného záznamu v 1. vzorku. Tudíž, za předpokladu, že rozhodující většina duplicit byla způsobena pouze dvojicemi shodných záznamů v rámci celého souboru, je zcela zákonité, že počet duplicit zjištěných ve 2. vzorku by měl být zhruba trojnásobný oproti počtu duplicit zjištěných v rámci 1. vzorku. Počet nalezených duplicit roste totiž s druhou mocninou velikosti zkoumaného vzorku, pro dvojnásobně velký vzorek složený z 1. a 2. vzorku by tudíž měl být čtyřnásobný, a protože první čtvrtina byla započtena již v chybovosti 1. vzorku, zbývající 3/4 lze očekávat ve druhém vzorku. Při tomto způsobu extrapolace chybovosti na celý soubor dat zveřejněný v rozhodnutí o paní Janě Bobošíkové vychází odhad chybovosti 15,24%, tj. o 1 procentní bod víc než dle vzorce použitého panem Václavem Henychem. Její vyřazení lze tudíž považovat za oprávněné.

0 1

možnosti

zavřít

zobrazit vlákno

J52a29n 74J83u27r98n81í28č31e64k

2. 1. 2013 12:38

Postup schválený zákonodárci ale s vlivem duplicit nepočítá. mlčky předpokládá, že chybovost dostatečně velkého náhodně vybraného vzorku podpisů je stejná, jako chybovost celého souboru.

Mimoto - kde jste přišel na to, že chybovost pocházející z duplicit roste s kvadrátem velikosti vzorku?

0 0

možnosti

zavřít

zobrazit vlákno

Zobrazit další reakce

K95a97r31e10l 34B40u70c45h58t94a

27. 11. 2012 13:28

Ja tedy nejsem statistik, dokonce ani matematik, ale podle me se jedna o serii bernoulli nezavislych pokusu s pravd. p. Neboli nezavisle na sobe taham n=8500 jmen ze vsech signataru daneho kandidata (N), pricemz pravd. p, ze vytahnu nejake falesne jmeno, je odhadnuta jako celkova chybovost na obou kontrolnich vzorcich (tedy prumer z prvniho a druheho). Celkovy pocet vytazenych falesnych pak bude nahodna velicina s binom. rozdelenim, jehoz str. hodnota je n*p a rozptyl n*p*(1-p), viz wikipedia. Zadne odhady pomoci souctu kvadratu odchylek, na to by byly potreba vsechny podpisy z kontrolnich vzorku (i tak by to vyslo stejne). Vzhledem k velkemu n pak autor binom. rozdeleni aproximuje normalnim rozdelenim a na nem spocita pravd., ze chybovost na jednom dosahne namerene hodnoty nebo mene.

Nevim, jestli je vse koser, ptze napr. N neni nekonecno, tedy p neni konst., nebo zda by se to nemelo pocitat pres konf. intervaly apod., ale i tak vse naznacuje, ze vzorky nebyly zpracovany ekvivalentne.

0 0

možnosti

zavřít

zobrazit vlákno

K33a50r36e24l 87B25u71c11h13t91a

27. 11. 2012 13:29

Toto mela byt reakce na Vladimír Hrubý, 25.11.2012 15:34.

0 0

možnosti

zavřít

zobrazit vlákno

V65l69a27d77i53m14í15r 17H25r90u28b95ý

25. 11. 2012 15:34

K r á s n ý výpočet .... j e n jaksi vzorec ve sloupci "J" je použit zcela nepatřičně. Zřejmě kdosi (neznalý) chtěl vypočítat směrodatnou odchylku. Jenže ta se počítá z odchylek od průměru. Pokud pominu nesmyslně nízký počet případů (pouhé dva) pro vůbec nějaké statistické výpočty, je samozřejmě směrodatná odchylka pro dvě veličiny odmocninou ze dvou (1,41) krát odchylka od průměru, tedy pro pana Okimuru je směrodatná odchylka 1,80*1,41 = 2,55 %. S 99% (!!!) pravděpodobností budou tedy chyby v rozsahu (průměr +- 3,09 směrodatné odchylky) 21,15 % +- 7,86 %. Tedy v rozmezí 13,1 ÷ 28,8 %. (Znalcům statistiky se omlouvám, že vůbec s pouhými dvěma čísly ve statistice pracuji.)

Z á v ě r: Uváděný výpočet pravděpodobnosti je nesmyslem non plus ultra. Škoda, doposud jsem články autorů četl se zájmem.

1 1

možnosti

zavřít

zobrazit vlákno

D68a68l45i52b51o58r 73M56a81r22t93i93š58e55k

25. 11. 2012 17:20

Já sice přímo znalec statistiky nejsem, ale za matematika se tak trochu považuji. Děsivé chyby ve výpočtu mě nepřekvapují. Já jsem článek odsoudil už včera (viz můj příspěvek z 24.11.2012 22:13) ze zcela jiného důvodu. A na výpočet jsem se prakticky ani nedíval.

0 0

možnosti

zavřít

zobrazit vlákno

OČ

O91n16d64ř40e17j 61Č26e41r52n86o31t70í69k

25. 11. 2012 14:00

Zapomínáte na jednu důležitou věc - počet duplicitních podpisů bude větší ve dvou vzorcích než v jednom. Proto bude v druhém vzorku větší chybovost, což je také u většiny kandidátů pravda. A pokud někdo nabízel za každý podpis finanční odměnu, těch duplicitních podpisů může mít celkem dost.

0 0

možnosti

zavřít

zobrazit vlákno

D36a35l67i55b52o72r 30M51a38r44t82i57š32e82k

24. 11. 2012 22:13

Řekl bych, že matematici ze sdružení KohoVolit.eu dělají ostudu své profesi. Především: ministerstvo vnitra nekontrolovalo pravost podpisů, ale adres a dat narození. Matematik by na tuto jemnou nuanci měl přijít a především se pozastavit nad volebním panoptikem jako celkem.

Při způsobu „získávání podpisů“, který není v rozporu se zákonem, a následném způsobu kontroly, který zákon přímo nařizuje, mají totiž poctivě získaná jména daleko menší naději na úspěch než jména zfalšovaná.. Kdejaký úředník na městském úřadě totiž může vyjet seznam tisíců údajných příznivců toho či onoho kandidáta na tiskárně – údaje jsou všechny čitelné a s minimem chyb. Zato poctivci, kteří oslovují lidi na ulici a vnucují jim do ruky propisky, budou mít hromadu údajů nečitelných nebo chybných a proti podvodníkům nemají šanci. Dělat z takto získaných dat výběr, ať už náhodný (jak to požaduje zákon a Michal Škop), anebo jakýkoliv jiný, je naprostý nesmysl. A něco počítat a vyvozovat je blbost ještě větší.

2 1

možnosti

zavřít

zobrazit vlákno

P94a58v12e73l 75K60u39l13a

24. 11. 2012 21:13

Je mi to jasné. Náhodné by to bylo, kdyby oba vzorky byly naprosto stejné.

1 3

možnosti

zavřít

zobrazit vlákno

J13a37n 37N89o35v27á30k

24. 11. 2012 20:37

Mě přijdou na celém tom sčítání pochybné dvě věci:

1) Proč se nekontrolovaly všechny podpisy? Prostě by se přijalo víc brigádníků než teď na tu 1/3 zkontrolovaných podpisů.

2) Který idiot proboha vymyslel ten vzorec na odpočet hlasů. Vidím jen dvě možnosti - blbej nebo navedenej.

4 0

možnosti

zavřít

zobrazit vlákno

V69i60k50t34o66r 32N86o57h90a

24. 11. 2012 19:12

Ježišmarjá, zase spiklenecké teorie

Celá úvaha má jeden základní háček - ať vybíráte data ke kontrole jak chcete náhodně, nevybíráte mezi daty náhodně vzniklými. A na takovém vzorku opravdu nebudou jednoduché statistické postupy fungovat.

2 5

možnosti

zavřít

zobrazit vlákno

KŠ

K75a19r46e62l 70Š81i82n83d77e30l82á50ř

24. 11. 2012 18:17

Celé to nějak... nevoní

2 1

možnosti

zavřít

zobrazit vlákno

J22i54ř20í 39P33l27a64v27s24k81ý

24. 11. 2012 17:07

no, a pak je tady jeste moznost, ze podpisove archy nekterych kandidatu vyrabeli studenti behem veselych veceru u lahvinky ... take jsem byl student, a take jsem si privydelaval "sberem dat pro sociologicke pruzkumy", ale vysledky podobnych statistickych setreni bych zpracovavat nenechal ani fisera ... i kdyz, fisera mozna zrovna jo

5 0

možnosti

zavřít

zobrazit vlákno

P93a34v18e74l 31K16u97r26a71l

24. 11. 2012 17:29

Jistě že proč pracovat když je prakticky nemožné zjistit že člověk nic neudělal.

0 0

možnosti

zavřít

zobrazit vlákno

Zobrazit další reakce

Načíst další

předchozí

1 2

další

D K

Počet článků 395
Celková karma 0
Průměrná čtenost 1168x

Podpořeno fondem Otakara Motejla.

Seznam rubrik

Komerční sdělení

OH Paříž 2024

Medailové naděje

Termíny

Biatlon

Vláda

Témata

Nepřehlédněte

iDNES.cz

© 1998–2024 MAFRA, a. s. a dodavatelé Profimedia, Reuters, ČTK, AP. Rozmnožování obsahu pro účely automatizované analýzy textů nebo dat dle ustanovení § 39c autorského zákona je bez souhlasu MAFRA, a. s. zakázáno. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s. zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s. IČ: 45313351.

mobilní verze

Přihlášení