despre statistică: distribuții.
sâmbătă, 27 oct. 2012, 18:43
Statistica este domeniul care studiază folosirea unor volume (cât mai mari, sau mai bine zis cât mai generale cu putință) de date spre a extrage ceva util din acestea. Definiția „utilului” diferă de obicei de la o aplicație la alta: în fizică ne poate da o intuiție asupra felului în care se deplasează lichidele sau electronii; în biologie poate explica evoluția anumitor caracteristici ale speciilor; în medicină poate corela evoluția unei boli cu anumiți factori din viața pacientului; în inteligența artificială raționamentul statistic e o metodă de inferență și așa mai departe. Toate acestea au însă un numitor comun.
Am stabilit mai demult că nu e de ajuns să avem date, trebuie să și știm cum să le folosim. Un set de date oarecare e dat de una sau mai multe variabile, cum ar fi de exemplu populația unui oraș măsurată la intervale egale de timp. Variabila din exemplu poate să crească sau să scadă de la momentul la momentul
; nu știm cu certitudine în care direcție o ia, motiv pentru care o numim variabilă aleatoare. În plus, mărimea intervalului
e relevantă. De la o zi la alta pot muri zece oameni și se pot naște trei, sau invers. De la o lună la alta atât sporul negativ cât și cel pozitiv cresc, nu știm exact cu cât. Dar dacă luăm evoluția din ultima sută de ani a populației Pământului, pe perioade de cinci ani? Știm exact că per total a crescut.
Dacă ați făcut liceul, atunci cu siguranță că vă aduceți aminte că la analiza matematică tendința funcțiilor de a scădea sau de a crește putea fi studiată cu ajutorul derivatelor. Ei, derivata asta, precum și inversa ei, integrala, se dovedește a fi extrem de utilă în algebra probabilităților [i]: putem afirma că există o funcție care exprimă evoluția probabilistică a unei variabile aleatoare, pe care o vom numi densitate de probabilitate. Din aceasta poate fi calculată, printr-o sumă sau o integrală, o distribuție cumulativă, care dă probabilitatea ca variabila aleatoare să se afle într-un interval dat. Și așa am ajuns și la cuvântul cheie „distribuție”. (mai mult…)
- Care pleacă de la spații boreliene și axiome ale lui Kolmogorov și în fine, trece prin teoria mulțimilor și ajunge la chestii care ne depășesc pe noi ăștia care nu suntem experți într-ale matematicilor. Ne limităm la a spune că algebra și analiza matematică sunt foarte utile pentru statistică și probabilități și e bine să aveți o idee despre ele, chit că poate n-o să le aplicați niciodată direct. [↩]
probleme cu lumea de astăzi
duminică, 30 sept. 2012, 14:41
În ultima vreme tineretul de pe Interneți are un obicei interesant, acela de a publica pe diverse site-uri citate, din care unele aforisme ale unor personalități marcante (de obicei) ale secolului trecut. Mă găsesc de-a dreptul încântat de faptul că oamenii caută a exprima idei deseori complexe sub forme simple; sunt cu atât mai încântat cu cât acestea sunt preluate din cărți marcante, fapt ce denotă într-o anumită măsură cultivarea. În același timp mă dezamăgește totuși faptul că mulți indivizi dau dovadă de o slabă înțelegere a citatelor pe care le folosesc cu atâta pricepere. Unul din aceste citate sună după cum urmează:
The trouble with the world is that the stupid are so confident while the intelligent are full of doubt.
Textul îi aparține cică lui Bertrand Russell și sună de fapt în felul următor:
The fundamental cause of trouble in the world today is that the stupid are cocksure while the intelligent are full of doubt. (mai mult…)
despre statistică: numere mari.
sâmbătă, 22 sept. 2012, 13:19
Dacă matematica e o știință naturală într-un sens anume, atunci putem spune că statistica este acea ramură a matematicii care e cea mai apropiată de concret, adică de natură în sensul ei propriu. E chiar atât de apropiată încât am putea comite eroarea de a rupe statistica de domeniul matematicii și a o introduce bine mersi în alte științe care dispun de dânsa. Legătura e de fapt atât de strânsă încât practicarea științei ar fi imposibilă dacă nu am avea la dispoziție o unealtă atât de utilă cum este statistica. Mai mult, nu am exagera deloc spunând că necesitatea se extinde de la nivelul științei-scientia către cel al științei-knowledge, adică în toate epistemele posibile și imposibile.
Cuvântul „statistică” a fost aparent „coined” [i] de un individ pe nume Gottfried Achenwall, un prusac care a căutat să eficientizeze funcționarea statului prin diverse metode, scriind câteva lucrări notabile [ii] pe temă. Una din lucrări [iii] menționează termenul „statistik” cu referire la afacerile statului și în particular la colectarea și organizarea datelor numerice în cadrul acestuia. De aici și motivul pentru care nu putem vorbi despre date fără a ne gândi la statistică, și vice versa.
Privind problema din alte puncte de vedere, cum ar fi cel al inteligenței artificiale, statistica e un mod de a raționa, la fel ca deducția, care la rândul ei reprezintă o întreagă familie de așa-zise „metode de inferență”. Raționamentul inductiv are atât avantaje cât și dezavantaje față de cel deductiv: de exemplu îmi e foarte ușor să afirm că „toți câinii sunt animale”, pe baza faptului că nu am observat până în prezent vreun câine care să nu fie animal. Pe de altă parte nu pot să trag concluzia că „toate florile sunt galbene” dacă de exemplu eu am observat doar flori galbene pe parcursul existenței mele ca observator, la fel cum nu pot afirma că „Pământul se încălzește” doar pe baza faptului că vara asta a fost mai călduroasă decât cea de acum zece ani. (mai mult…)
- Cuvânt pentru care nu există sinonim în română. [↩]
- Staatsverfassung der Europäischen Reiche im Grundrisse, 1752. [↩]
- Vorbereitung zur Staatswissenschaft, 1748. [↩]
cu poli și copiat
miercuri, 5 sept. 2012, 23:57
N-am mai abordat de ceva vreme subiectul, deci să reluăm: Mihai scrie despre un student care cere lucrări pe o listă de discuții oarecare, pe marginea unei materii oarecare din facultate. Cele două (lista și materia) sunt prea puțin relevante; e importantă însă observația că este vorba despre o disciplină de master, unde participanții sunt deja ingineri, adică oameni cu capul pe umeri și toate cele. Ei, ți-ai găsit. Lăsând la o parte faptul că trebuie să fii naiv — să nu zic altfel — să cumperi lucrări pe liste publice, în văzul lumii, problema copiatului aduce iar discuții pro și contra [i], care se rezumă în final la starea „sistemului” [ii], care-i așa și pe dincolo, adică putrezit!
Drept să o spun, și eu sunt student la master și pot să spun că programul nu s-a ridicat pe deplin la așteptările mele. Un argument care îmi invalidează dezamăgirea ar fi acela că la Politehnică-ACS (secția calculatoare) mai toate materiile faine sunt înghesuite în ultimii doi ani de licență, astfel că la master se fac în mare parte subiecte ce țin pur de specializare, nu cum se face la UT Cluj sau prin alte părți — ba chiar la multe facultăți dinafară, pentru că argumentul „dacă-i dinafară e musai mai bine ca la noi” e foarte popular. Totuși un lucru e clar: mulți titulari nu își organizează la fel de bine cursurile la master în raport cu cele de licență, pentru că mulți sunt ocupați cu altele și au mai degrabă așteptări de implicare din partea studenților. Stilul nu-i unul deosebit, ba ar fi chiar interesant dacă unele materii nu ar fi atât de plictisitoare. (mai mult…)
- Păi cum, nu știți? românul s-a născut filosof. Ce contează că nu suntem în stare să lucrăm cu algebre și categorii, noi discutăm probleme profunde de etică, alea. Ce contează regulamentele la care am aderat încă de când am semnat foaia de înscriere? „Dăle-n măsa”, noi suntem mai presus de toate prostiile astea. [↩]
- De parcă oamenii ar fi familiari cu teoria sistemelor; haha, ce glumă bună. [↩]