Zkratka na hlavní stranu: Alt + Shift + horní 2(ě)
Linkedin FB e-mail Google Plus Twitter

Hledat na tomto webu

 
 

Analýza skladby příspěvků na freeware editor – mocniny dvou vs. všechny platby

 

Vytvořeno
17. 6. 2013

 

Po několika letech používání českého freeware editoru PSPad určeného zejména pro programování v mnoha různých jazycích podle mnoha různých syntaxí mi před pár dny při hledání pokročilejších informací o jeho možnostech padly do oka také informace o možnosti přispět autorovi PSPadu na vývoj (jiný web, nový panel).

I napadlo mě, že by to asi nebylo od věci, program používám už docela dlouho (a učil jsem v něm i zahraniční studenty, kterým fakulta na jejich učebnu nekoupila specializovaný SW umožňující snadnější rozjezd, nacházející se vždy na jedné z učeben pro studenty české). Na webu je uveden seznam přispěvatelů, a při pohledu na něj se zdá, že drtivá většina uživatelů tento rozšířený program používá opravdu jako freeware – takže se nějaký ten příspěvek může hodit.

Výše částky je libovolná a na první obrazovce jsou na webu vidět platby v hodnotách 30 až 1000 Kč, což odpovídá mému odhodlání poslat asi tak dvě stovky… které zaokrouhluji na 256 Kč (dvě na osmou). Nejbližší kulaté hodnoty jsou 128 a 512, ale zůstávám u těch 256.

Po prvotní myšlence, že z částky aspoň bude vidět, že je PSPad používán k programování, mě napadá, že při uvážení cílové skupiny tohoto programu by takových částek (dvě na entou … tedy mocnina dvou) mohlo být více a že asi nebudu až tak těžce originální.

Opravdu – nějaké mocniny dvou lze v seznamu příspěvků vidět. A napadá mě otázka: Jsou hardcore programátoři (resp. osoby se takto stylizující) štědřejší, nebo jsou větší škrti? (nemyšleno doslovně… pošle-li někdo dobrovolně libovolný kladný příspěvek za využívání bezplatného programu, těžko ho zváti škrtem… ale dalo by se z toho soudit, kolik je za SW ochoten pustit, což je dáno jak důležitostí produktu pro daného uživatele, tak i uživatelovým rozpočtem).

Udělejme si malou analýzu…

Všechny příspěvky

Příspěvků je celkem 258 kusů.

  • 543 Kč průměr
  • 256 Kč (hle !) medián (střední hodnota)
  • 100 Kč modus (nejčastější hodnota)

Při selském pohledu do dat lze ale nalézt extrémní hodnoty, které nejsou příliš reprezentativní (typické),
a které se, pamatuji-li si to ze školy správně, někdy škrtají, aby se data očistila od anomálií.

Když vynecháme jeden nejnižší (10 Kč) a jeden nejvyšší (30 000 Kč) příspěvek, máme tyto souhrnné hodnoty:

  • 430 Kč průměr
  • 256 Kč medián (střední hodnota)
  • 100 Kč modus (nejčastější hodnota)

Extrémů je ale vidět více… i celkově druhá nejvyšší hodnota je několikanásobkem třetí nejvyšší hodnoty,
a navíc jde o příspěvek od pojišťovny, nikoliv od člověka, takže vzhledem k účelu analýzy (zjištění, jak se hardcorově stylizující programátoři projevují mezi ostatními uživateli, vesměs také programátory) je vhodné dar od takové instituce nepočítat.

Pro zachování symetrie vynechávám ze všech dat dva nejnižší (10 Kč, 16 Kč) a dva nejvyšší (12 000 Kč, 30 000 Kč) příspěvky,
tím v seznamu zůstávají platby 30 Kč až 4 100 Kč, a dostávám tyto souhrnné hodnoty:

  • 386 Kč průměr
  • 256 Kč medián (střední hodnota)
  • 100 Kč modus (nejčastější hodnota)

Nejčastěji tedy autor programu dostane stovku,
uprostřed ve výčtu příspěvků se nachází magických 256 Kč
a průměr je 386 Kč.

Pan Gauss by asi spokojen nebyl, nejde o Normální rozdělení podle jeho grafu, ale je to naprosto reálně se vyskytující časté rozdělení, ve kterém je vyšších hodnot (např. příjmů) méně než hodnot nižších, a proto je průměr větší než střední nebo obvyklá hodnota.
S tím souvisí i to, proč je pro většinu lidí průměrná mzda jen sen.
A rovnou bych asi mohl poukázat na to, že rádoby vtipný či nedej bože filosofický vtip, který říká, že "Polovina lidí má plat menší než průměrný" je v praxi nesmysl, protože v praxi má podprůměrný plat mnohem více lidí, než jen polovina. Protože průměr je (v případě mzdy) obvykle vyšší než střední hodnota.
Má to být vtipný povzdech nad tím, že polovina lidí má podprůměrný plat, a přitom je to celé špatně, protože ve skutečnosti má polovina lidí plat nižší než medián… medián se ale neuvádí, protože je nižší než průměr. Oproti průměru má svůj plat nižší mnohem více než polovina lidí, protože průměr zvedá pár lidí s extremním příjmem. Jen si zkuste představit jednoduchou modelovou situaci: 3 lidi berou po deseti, 1 bere 30. Tzn. hodnoty jsou 10, 10, 10, 30. Průměr je 60/4=15… a 3/4 lidí jsou pod průměrem, nikoliv jen polovina.

U rychlosti jízdy (na kole v kopcích nebo autem zatáčkami) je to podobně… jenom naopak… tam se zase divíme, jak je možné, že máme tak nízkou průměrnou rychlost, když pořád jedeme rychle… tam je to dáno tím, že průměr se počítá podle času (jak dlouho jedeme pomalu vs. rychle), zatímco my si představu o něm odhadem z hlavy psychologicky děláme podle vzdálenosti (jak dlouhý úsek jedeme pomalu vs. rychle) …a když jedeme pomalu, tak i krátký úsek obsadí dlouhý čas. Např. když pojedete 20 km, z toho, pro jednoduchost, 10 km pojedete 20 km/h a 10 km pojedete 40 km/h, tak můžete mít pocit, že jste jeli jakoby 30 km/h… jenže realita je jiná: Půl hodiny jste jeli 20 km/h a čtvrt hodiny jste jeli 40 km/h… takže průměrná rychlost je 80/3, tedy 26,7 km/h. Proto není důležité, jak jedete nejrychleji, ale jak jedete nejpomaleji. A ani nemá smysl spěchat autem – i když chvílemi pojedete drsně, tak při započítání toho, co vás cestou brzdí (jiná auta, zatáčky, semafory, … ) klesne časový rozdíl na hodnotu zanedbatelně malou v porovnání s nárustem maximální rychlosti. Více jsem se o tomto tématu rozepsal kdysi v článku Zákon nízké průměrné rychlosti.

Mocniny dvou

Abych se ale vrátil k původnímu tématu… podívejme se tedy na příspěvky vyjádřitelné jako mocnina dvou.
Je jich jen 13, takže pravověrní statistici srdcem, duší a hlavně vzděláním teď raději stisknou Ctrl+W pro zavření panelu nebo Alt+doleva pro návrat zpět nebo si vyberou z menu jiný článek,
a my ostatní se na vlastní zodpovědnost opatrně podíváme na souhrn příspěvků od stylových programátorů (i když podle módní policie asi často nestylových):

  • 297průměr
  • 256medián (střední hodnota)
  • 256modus (nejčastější hodnota)

Když vynecháme jednu nejnižší (16 Kč) a jednu nejvyšší (1024 Kč) platbu,
tak nám zbudou výhradně částky 128, 256 a 512 Kč (celkem 11 kusů) s tímto souhrnem:

  • 256průměr
  • 256medián (střední hodnota)
  • 256modus (nejčastější hodnota)

Takže průměrná hodnota je u nejprogramátorovitějštích programátorů nižší než u ostatních uživatelů (byť asi do značné míry také programátorů), což by se dalo interpretovat třeba tak, že lidé si buď vyhrají třeba s tím, že posílají hezké částky, anebo jdou po efektivitě, fofrem pošlou větší částku, a jdou dělat něco jiného.
(Dalo by se uvažovat i o tom, že příčinou výskytu nehezkých vyšších částek je větší vzájemný rozestup vyšších hezkých částek oproti hustěji zastoupeným nižším hezkým částkám, ale tuto domněnku vyvrací samotný účel užívání logaritmů, logaritmických stupnic a logaritmických potenciometrů: U vyšších hodnot už na pár drobných nesejde. V případě mocnin dvou máme vždy volbu mezi x, x/2 a 2*x. Z toho už se ve zvolené oblasti dá vybrat.)

Ale nejčastější hodnota je u programátorovitějštích programátorů vyšší. Což by se dalo vysvětlit třeba tak, že je pro ně ten program důležitý a vyhovuje jim (jak rád bych ještě věděl, kolik z nich si nastavilo old-school klasické pro oči zdravé zobrazení světlého textu na tmavém pozadí a lá textový režim dřívějších operačních systémů).

Když uvážíme výše popsaný efekt neúměrného zvyšování aritmetického průměru několika výrazně vyššími hodnotami (nějaké ve výpočtu za všechny uživatele zůstaly i po zahození dvou a dvou krajních hodnot) a podíváme se, jak jsou platby od programátorů vyrovnané, resp. podobné, vyvážené, konzistentní, blízké, nebo jak to nazvat …aha, mají, od oka soudě, menší rozptyl, a navíc jsou i symetričtější (malých hodnot je více přesně tolikrát, že přesně vyvažují velké hodnoty, takže se průměr, medián a modus přesně sešly… tu přesnost sice umožnilo i to, že jde o tři kulaté (ve dvojkové soustavě) opakující se hodnoty, ale odlišnost mediánu, modu a průměru u všech plateb (očištěných o extrémy) je proti tomu do oka bijící), lze v určitém kontextu medián a modus vnímat jako více vypovídající než průměr.

Závěr:

Mezi lidmi nezaokrouhlujícími podle kulatosti ve dvojkové soustavě je sice malá část uživatelů, kteří zvedají průměr nad průměr příspěvků od lidí binárních,
ale většina uživatelů přispívá méně, takže
obvyklý příspěvek je vyšší u dvojkově zaokrouhlujích programátorů, než u ostatních.

A to celé vychází z malého statistického vzorku, protože částky jsoucí mocninami dvou neposlal dostatek uživatelů,
takže jako bych nic neřekl.

Ostatně, je to článek, ne odborná studie …a hlavním smyslem literatury je cestou podnítit k zamyšlení,
a ne na závěr říct, jak to dopadlo.

Poznámka: Ono by se dalo závěrem konstatovat i „Průměrný příspěvek je nižší u dvojkově zaokrouhlujících programátorů, než u ostatních”. Což by se mi ale jako dvojkově zaokrouhlujícímu programátorovi nehodilo do krámu.
Skutečný závěr? „Nevěřte statistikám”.
Začíná to tím, že se u příjmů občanů uvádí vyšší (hezčí) průměr, a ne pro většinu interpretací mnohem reprezentativnější medián, a končí to tím, že si každý ke zveřejnění vybere takovou hodnotu zjištěnou za takových okolností, aby se mu to hodilo.

Skok nahoru na: Navigační menu
(klávesová zkratka Alt + Shift + horní „5”)

Zaujala Vás tato stránka?

  • Přidat do záložek (Ctrl+D)
  • Sdílet odkaz (vysílačka)Skok nahoru na:
  • Vytisknout (Ctrl+P)
  • Citovat podle ČSN ISO 690

    Tuto stránku

    ADÁMEK, Martin. Analýza skladby příspěvků na freeware editor – mocniny dvou vs. všechny platby. Martin Adámek [online]. Náchod / Meziměstí [cit. 2024-11-21]. Dostupné z: https://www.adamek.cz/clanky/postrehy/statistika-prispevky-freeware-programatori

    Celý web

    ADÁMEK, Martin. Martin Adámek [online]. Náchod / Meziměstí [cit. 2024-11-21]. Dostupné z: https://www.adamek.cz

 

 
 

Národní kulturní dědictví

WebArchiv – Stránky archivovány Národní knihovnou ČR Tyto stránky jsou pravidelně archivovány Národní knihovnou ČR pro svou kulturní, vzdělávací, vědeckou, výzkumnou nebo jinou informační hodnotu za účelem dokumentace autentického vzorku českého webu. Jsou součástí kolekce českých webových stránek, které NK ČR hodlá dlouhodobě uchovávat a zpřístupňovat pro budoucí generace. Jejich záznam je součástí České národní bibliografie a katalogu NK ČR.  

 

 
 

Pro rozptýlení

Jaký je rozdíl mezi pokročilým a začínajícím informatikem?
Začínající informatik si myslí, že 1 kB je 1000 B,
zatímco pokročilý je přesvědčen, že 1 km je 1024 m.

 

Pro zamyšlení

O člověku více než jeho odpovědi vypovídají jeho otázky.
[(autor nezjištěn)]