Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.
PK

P46e84t35r 35K76r71á57l

28. 11. 2012 18:44

V úvaze Michala Škopa postrádám přihlédnutí k tomu, že za chyby jsou považovány i duplicity, které ve druhém vzorku mohly vznikat i v důsledku přítomnosti shodného záznamu v 1. vzorku. Tudíž, za předpokladu, že rozhodující většina duplicit byla způsobena pouze dvojicemi shodných záznamů v rámci celého souboru, je zcela zákonité, že počet duplicit zjištěných ve 2. vzorku by měl být zhruba trojnásobný oproti počtu duplicit zjištěných v rámci 1. vzorku. Počet nalezených duplicit roste totiž s druhou mocninou velikosti zkoumaného vzorku, pro dvojnásobně velký vzorek složený z 1. a 2. vzorku by tudíž měl být čtyřnásobný, a protože první čtvrtina byla započtena již v chybovosti 1. vzorku, zbývající 3/4 lze očekávat ve druhém vzorku. Při tomto způsobu extrapolace chybovosti na celý soubor dat zveřejněný v rozhodnutí o paní Janě Bobošíkové vychází odhad chybovosti 15,24%, tj. o 1 procentní bod víc než dle vzorce použitého panem Václavem Henychem. Její vyřazení lze tudíž považovat za oprávněné.

0 1
možnosti
JJ

Postup schválený zákonodárci ale s vlivem duplicit nepočítá. mlčky předpokládá, že chybovost dostatečně velkého náhodně vybraného vzorku podpisů je stejná, jako chybovost celého souboru.

Mimoto - kde jste přišel na to, že chybovost pocházející z duplicit roste s kvadrátem velikosti vzorku?

0 0
možnosti
KB

Ja tedy nejsem statistik, dokonce ani matematik, ale podle me se jedna o serii bernoulli nezavislych pokusu s pravd. p. Neboli nezavisle na sobe taham n=8500 jmen ze vsech signataru daneho kandidata (N), pricemz pravd. p, ze vytahnu nejake falesne jmeno, je odhadnuta jako celkova chybovost na obou kontrolnich vzorcich (tedy prumer z prvniho a druheho). Celkovy pocet vytazenych falesnych pak bude nahodna velicina s binom. rozdelenim, jehoz str. hodnota je n*p a rozptyl n*p*(1-p), viz wikipedia. Zadne odhady pomoci souctu kvadratu odchylek, na to by byly potreba vsechny podpisy z kontrolnich vzorku (i tak by to vyslo stejne). Vzhledem k velkemu n pak autor binom. rozdeleni aproximuje normalnim rozdelenim a na nem spocita pravd., ze chybovost na jednom dosahne namerene hodnoty nebo mene.

Nevim, jestli je vse koser, ptze napr. N neni nekonecno, tedy p neni konst., nebo zda by se to nemelo pocitat pres konf. intervaly apod., ale i tak vse naznacuje, ze vzorky nebyly zpracovany ekvivalentne.

0 0
možnosti
KB

Toto mela byt reakce na Vladimír Hrubý, 25.11.2012 15:34.

0 0
možnosti
VH

K r á s n ý  výpočet .... j e n  jaksi vzorec ve sloupci "J" je použit zcela nepatřičně.  Zřejmě kdosi (neznalý) chtěl vypočítat směrodatnou odchylku. Jenže ta se počítá z odchylek od průměru.  Pokud pominu nesmyslně nízký počet případů (pouhé dva) pro vůbec nějaké statistické výpočty, je samozřejmě směrodatná odchylka pro dvě veličiny odmocninou ze dvou (1,41) krát odchylka od průměru, tedy pro pana Okimuru je směrodatná odchylka 1,80*1,41 = 2,55 %.  S 99% (!!!) pravděpodobností budou tedy chyby v rozsahu (průměr +- 3,09 směrodatné odchylky) 21,15 % +- 7,86 %. Tedy v rozmezí 13,1 ÷ 28,8 %. (Znalcům statistiky se omlouvám, že vůbec s pouhými dvěma čísly ve statistice pracuji.)

    Z á v ě r:   Uváděný výpočet pravděpodobnosti je nesmyslem non plus ultra.  Škoda, doposud jsem články autorů četl se zájmem.

1 1
možnosti
DM

Já sice přímo znalec statistiky nejsem, ale za matematika se tak trochu považuji. Děsivé chyby ve výpočtu mě nepřekvapují. Já jsem článek odsoudil už včera (viz můj příspěvek z 24.11.2012 22:13) ze zcela jiného důvodu. A na výpočet jsem se prakticky ani nedíval.

0 0
možnosti

Zapomínáte na jednu důležitou věc - počet duplicitních podpisů bude větší ve dvou vzorcích než v jednom. Proto bude v druhém vzorku větší chybovost, což je také u většiny kandidátů pravda. A pokud někdo nabízel za každý podpis finanční odměnu, těch duplicitních podpisů může mít celkem dost.

0 0
možnosti
DM

Řekl bych, že matematici ze sdružení KohoVolit.eu dělají ostudu své profesi. Především: ministerstvo vnitra nekontrolovalo pravost podpisů, ale adres a dat narození. Matematik by na tuto jemnou nuanci měl přijít a především se pozastavit nad volebním panoptikem jako celkem.

Při způsobu „získávání podpisů“, který není v rozporu se zákonem, a následném způsobu kontroly, který zákon přímo nařizuje, mají totiž poctivě získaná jména daleko menší naději na úspěch než jména zfalšovaná.. Kdejaký úředník na městském úřadě totiž může vyjet seznam tisíců údajných příznivců toho či onoho kandidáta na tiskárně – údaje jsou všechny čitelné a s minimem chyb. Zato poctivci, kteří oslovují lidi na ulici a vnucují jim do ruky propisky, budou mít hromadu údajů nečitelných nebo chybných a proti podvodníkům nemají šanci. Dělat z takto získaných dat výběr, ať už náhodný (jak to požaduje zákon a Michal Škop), anebo jakýkoliv jiný, je naprostý nesmysl. A něco počítat a vyvozovat je blbost ještě větší.

2 1
možnosti
PK

P51a29v74e21l 43K27u85l68a

24. 11. 2012 21:13

Je mi to jasné. Náhodné by to bylo, kdyby oba vzorky byly naprosto stejné. 8-o

1 3
možnosti
JN

J38a86n 30N44o70v19á70k

24. 11. 2012 20:37

Mě přijdou na celém tom sčítání pochybné dvě věci:

1) Proč se nekontrolovaly všechny podpisy? Prostě by se přijalo víc brigádníků než teď na tu 1/3 zkontrolovaných podpisů.

2) Který idiot proboha vymyslel ten vzorec na odpočet hlasů. Vidím jen dvě možnosti - blbej nebo navedenej.

4 0
možnosti
VN

V87i38k41t18o78r 97N23o16h82a

24. 11. 2012 19:12

Ježišmarjá, zase spiklenecké teorie ;-O  

Celá úvaha má jeden základní háček - ať vybíráte data ke kontrole jak chcete náhodně, nevybíráte mezi daty náhodně vzniklými. A na takovém  vzorku opravdu nebudou jednoduché statistické postupy fungovat.

2 5
možnosti

Celé to nějak... nevoní

2 1
možnosti
JP

no, a pak je tady jeste moznost, ze podpisove archy nekterych kandidatu vyrabeli studenti behem veselych veceru u lahvinky ... take jsem byl student, a take jsem si privydelaval "sberem dat pro sociologicke pruzkumy", ale vysledky podobnych statistickych setreni bych zpracovavat nenechal ani fisera ... i kdyz, fisera mozna zrovna jo ;-D

5 0
možnosti
PK

P26a15v24e66l 79K63u58r42a68l

24. 11. 2012 17:29

Jistě že proč pracovat když je prakticky nemožné zjistit že člověk nic neudělal.

0 0
možnosti
  • Počet článků 395
  • Celková karma 0
  • Průměrná čtenost 1168x
Podpořeno fondem Otakara Motejla.

Seznam rubrik