despre statistică: distribuții.

sâmbătă, 27 oct. 2012, 18:43

Statistica este domeniul care studiază folosirea unor volume (cât mai mari, sau mai bine zis cât mai generale cu putință) de date spre a extrage ceva util din acestea. Definiția „utilului” diferă de obicei de la o aplicație la alta: în fizică ne poate da o intuiție asupra felului în care se deplasează lichidele sau electronii; în biologie poate explica evoluția anumitor caracteristici ale speciilor; în medicină poate corela evoluția unei boli cu anumiți factori din viața pacientului; în inteligența artificială raționamentul statistic e o metodă de inferență și așa mai departe. Toate acestea au însă un numitor comun.

Am stabilit mai demult că nu e de ajuns să avem date, trebuie să și știm cum să le folosim. Un set de date oarecare e dat de una sau mai multe variabile, cum ar fi de exemplu populația unui oraș măsurată la intervale egale de timp. Variabila din exemplu poate să crească sau să scadă de la momentul t la momentul t + \delta t; nu știm cu certitudine în care direcție o ia, motiv pentru care o numim variabilă aleatoare. În plus, mărimea intervalului \delta t e relevantă. De la o zi la alta pot muri zece oameni și se pot naște trei, sau invers. De la o lună la alta atât sporul negativ cât și cel pozitiv cresc, nu știm exact cu cât. Dar dacă luăm evoluția din ultima sută de ani a populației Pământului, pe perioade de cinci ani? Știm exact că per total a crescut.

Dacă ați făcut liceul, atunci cu siguranță că vă aduceți aminte că la analiza matematică tendința funcțiilor de a scădea sau de a crește putea fi studiată cu ajutorul derivatelor. Ei, derivata asta, precum și inversa ei, integrala, se dovedește a fi extrem de utilă în algebra probabilităților [i]: putem afirma că există o funcție care exprimă evoluția probabilistică a unei variabile aleatoare, pe care o vom numi densitate de probabilitate. Din aceasta poate fi calculată, printr-o sumă sau o integrală, o distribuție cumulativă, care dă probabilitatea ca variabila aleatoare să se afle într-un interval dat. Și așa am ajuns și la cuvântul cheie „distribuție”. (mai mult…)

  1. Care pleacă de la spații boreliene și axiome ale lui Kolmogorov și în fine, trece prin teoria mulțimilor și ajunge la chestii care ne depășesc pe noi ăștia care nu suntem experți într-ale matematicilor. Ne limităm la a spune că algebra și analiza matematică sunt foarte utile pentru statistică și probabilități și e bine să aveți o idee despre ele, chit că poate n-o să le aplicați niciodată direct. []

alcătuirea comunității pe internet, studiu de caz

duminică, 7 oct. 2012, 16:42

Unde prin „alcătuirea comunității” înțelegem că nu a unei comunități anume, ci a unei comunități oarecare din spațiul virtual, adică a comunității în sens abstract. Unde prin „comunitate” înțelegem un grup de persoane constituit pe baza unor idei și/sau interese comune, deci un loc într-un subspațiu al lumii ideilor [i] unde diverse celule converg pe baza unor atribute comune. Un punct de plecare pentru studiul de față îl poate reprezenta abordarea Trilemei din „Comunitati si metode numerice”, care menționează două moduri de alcătuire a comunității:

Pentru a avea o comunitate deci revine a avea o aglomeratie de oameni cu idei macar in mare similare. Aceasta necesitate se poate satisface in exact doua moduri : ori luam un set de oameni care deja se gasesc in acelasi spatiu si-i fortam sa treaca toti la acelasi set de idei, ori alegem dintre multimile nesfirsite ale umanitatii doar oamenii cu ideile potrivite, si-i instalam intr-un spatiu.

Noi situându-ne în contextul Internetului, suntem interesați mai degrabă de al doilea mod decât de primul, având în vedere faptul că în lumea virtuală nu există pârghii de control bine stabilite în acest sens, in ciuda eforturilor de a le crea. Astfel a apărut întâi Usenet-ul, unde s-au format mai multe comunități — de exemplu una pentru indivizii interesați de tehnică, alta pentru „entertainment” etc. — stabilite în virtutea unui Internet la începuturi încă mic, unde foamea de comunicare era însă uriașă. Apoi au răsărit multe grupuri fărâmițate alcătuite din oameni pasionați de exemplu de open-source, de Linux, care pe lângă participarea virtuală la discuții se mai întâlnesc din când în când la un hackfest sau mai știu eu ce. O parte din comunități s-au stabilit inclusiv (sau exclusiv) pe IRC, „live chat”-ul dovedindu-se deseori a fi un mijloc foarte eficient de a rezolva varii probleme. (mai mult…)

  1. Al cărei exponent în lumea reală este acum calculatorul și mai concret Internetul. []

probleme cu lumea de astăzi

duminică, 30 sept. 2012, 14:41

În ultima vreme tineretul de pe Interneți are un obicei interesant, acela de a publica pe diverse site-uri citate, din care unele aforisme ale unor personalități marcante (de obicei) ale secolului trecut. Mă găsesc de-a dreptul încântat de faptul că oamenii caută a exprima idei deseori complexe sub forme simple; sunt cu atât mai încântat cu cât acestea sunt preluate din cărți marcante, fapt ce denotă într-o anumită măsură cultivarea. În același timp mă dezamăgește totuși faptul că mulți indivizi dau dovadă de o slabă înțelegere a citatelor pe care le folosesc cu atâta pricepere. Unul din aceste citate sună după cum urmează:

The trouble with the world is that the stupid are so confident while the intelligent are full of doubt.

Textul îi aparține cică lui Bertrand Russell și sună de fapt în felul următor:

The fundamental cause of trouble in the world today is that the stupid are cocksure while the intelligent are full of doubt. (mai mult…)

despre statistică: numere mari.

sâmbătă, 22 sept. 2012, 13:19

Dacă matematica e o știință naturală într-un sens anume, atunci putem spune că statistica este acea ramură a matematicii care e cea mai apropiată de concret, adică de natură în sensul ei propriu. E chiar atât de apropiată încât am putea comite eroarea de a rupe statistica de domeniul matematicii și a o introduce bine mersi în alte științe care dispun de dânsa. Legătura e de fapt atât de strânsă încât practicarea științei ar fi imposibilă dacă nu am avea la dispoziție o unealtă atât de utilă cum este statistica. Mai mult, nu am exagera deloc spunând că necesitatea se extinde de la nivelul științei-scientia către cel al științei-knowledge, adică în toate epistemele posibile și imposibile.

Cuvântul „statistică” a fost aparent „coined” [i] de un individ pe nume Gottfried Achenwall, un prusac care a căutat să eficientizeze funcționarea statului prin diverse metode, scriind câteva lucrări notabile [ii] pe temă. Una din lucrări [iii] menționează termenul „statistik” cu referire la afacerile statului și în particular la colectarea și organizarea datelor numerice în cadrul acestuia. De aici și motivul pentru care nu putem vorbi despre date fără a ne gândi la statistică, și vice versa.

Privind problema din alte puncte de vedere, cum ar fi cel al inteligenței artificiale, statistica e un mod de a raționa, la fel ca deducția, care la rândul ei reprezintă o întreagă familie de așa-zise „metode de inferență”. Raționamentul inductiv are atât avantaje cât și dezavantaje față de cel deductiv: de exemplu îmi e foarte ușor să afirm că „toți câinii sunt animale”, pe baza faptului că nu am observat până în prezent vreun câine care să nu fie animal. Pe de altă parte nu pot să trag concluzia că „toate florile sunt galbene” dacă de exemplu eu am observat doar flori galbene pe parcursul existenței mele ca observator, la fel cum nu pot afirma că „Pământul se încălzește” doar pe baza faptului că vara asta a fost mai călduroasă decât cea de acum zece ani. (mai mult…)

  1. Cuvânt pentru care nu există sinonim în română. []
  2. Staatsverfassung der Europäischen Reiche im Grundrisse, 1752. []
  3. Vorbereitung zur Staatswissenschaft, 1748. []

cu poli și copiat

miercuri, 5 sept. 2012, 23:57

N-am mai abordat de ceva vreme subiectul, deci să reluăm: Mihai scrie despre un student care cere lucrări pe o listă de discuții oarecare, pe marginea unei materii oarecare din facultate. Cele două (lista și materia) sunt prea puțin relevante; e importantă însă observația că este vorba despre o disciplină de master, unde participanții sunt deja ingineri, adică oameni cu capul pe umeri și toate cele. Ei, ți-ai găsit. Lăsând la o parte faptul că trebuie să fii naiv — să nu zic altfel — să cumperi lucrări pe liste publice, în văzul lumii, problema copiatului aduce iar discuții pro și contra [i], care se rezumă în final la starea „sistemului” [ii], care-i așa și pe dincolo, adică putrezit!

Drept să o spun, și eu sunt student la master și pot să spun că programul nu s-a ridicat pe deplin la așteptările mele. Un argument care îmi invalidează dezamăgirea ar fi acela că la Politehnică-ACS (secția calculatoare) mai toate materiile faine sunt înghesuite în ultimii doi ani de licență, astfel că la master se fac în mare parte subiecte ce țin pur de specializare, nu cum se face la UT Cluj sau prin alte părți — ba chiar la multe facultăți dinafară, pentru că argumentul „dacă-i dinafară e musai mai bine ca la noi” e foarte popular. Totuși un lucru e clar: mulți titulari nu își organizează la fel de bine cursurile la master în raport cu cele de licență, pentru că mulți sunt ocupați cu altele și au mai degrabă așteptări de implicare din partea studenților. Stilul nu-i unul deosebit, ba ar fi chiar interesant dacă unele materii nu ar fi atât de plictisitoare. (mai mult…)

  1. Păi cum, nu știți? românul s-a născut filosof. Ce contează că nu suntem în stare să lucrăm cu algebre și categorii, noi discutăm probleme profunde de etică, alea. Ce contează regulamentele la care am aderat încă de când am semnat foaia de înscriere? „Dăle-n măsa”, noi suntem mai presus de toate prostiile astea. []
  2. De parcă oamenii ar fi familiari cu teoria sistemelor; haha, ce glumă bună. []