relevanța științifică a wikipediei
luni, 24 dec. 2012, 14:08
Wikipedia e un proiect început în anul 2001 de către un individ pe nume Jimmy Wales. Misiunea site-ului s-ar putea spune că a fost și este de-a dreptul lăudabilă: crearea unui mediu online de informare pe orice subiect al cunoașterii, adică a unei enciclopedii online care în plus să fie liberă atât din punctul de vedere al accesului cât și din cel al adăugării și editării de conținut. Firește că acest deziderat nu este fezabil în practică, motiv pentru care Wikipedia nu este liberă în sensul absolut al cuvântului. Pe de o parte accesul la informație e limitat uneori de „nag screen”-uri, sau mai pe românește cerșeală de donații, și pe de altă parte nu oricine poate edita conținut și nu în orice condiții.
Motivul impunerii acestor ultime limitări este destul de simplu de intuit. Wikipedia a plecat inițial de la câteva presupuneri complet nerealiste. Una din ele este cea că atât cititorii cât și contribuitorii unui anumit subiect sunt interesați de subiect, mai exact în sensul deslușirii adevărului. Alta este aceea că contribuitorii vor stabili în mod implicit standarde înalte pentru calitatea conținutului. În fine, o altă presupunere falsă este cea că cititorii vor trata articolele Wikipediei similar cu cele ale oricărei enciclopedii, și anume doar în scop pur informativ.
Astfel, moderatorii enciclopediei s-au trezit în timp loviți de șocul unor contribuții de proastă calitate, al trolling-ului și al disputelor inutile, dat fiind că oamenii caută deseori doar adevărul care le reprezintă mai bine interesele. Întâmplările astea nu ar fi fost grave dacă Wikipedia nu ar fi devenit de-a lungul timpului o sursă foarte căutată de informare, iar dacă era doar o sursă de (pură) informare, totul era ok; prostia omenească a ajuns să se răsfrângă asupra mediului educațional și academic, unde Wikipedia e deseori folosită ca sursă absolută și unică de cunoștințe, în virtutea ușurinței regăsirii informației. (mai mult…)
despre statistică: distribuții.
sâmbătă, 27 oct. 2012, 18:43
Statistica este domeniul care studiază folosirea unor volume (cât mai mari, sau mai bine zis cât mai generale cu putință) de date spre a extrage ceva util din acestea. Definiția „utilului” diferă de obicei de la o aplicație la alta: în fizică ne poate da o intuiție asupra felului în care se deplasează lichidele sau electronii; în biologie poate explica evoluția anumitor caracteristici ale speciilor; în medicină poate corela evoluția unei boli cu anumiți factori din viața pacientului; în inteligența artificială raționamentul statistic e o metodă de inferență și așa mai departe. Toate acestea au însă un numitor comun.
Am stabilit mai demult că nu e de ajuns să avem date, trebuie să și știm cum să le folosim. Un set de date oarecare e dat de una sau mai multe variabile, cum ar fi de exemplu populația unui oraș măsurată la intervale egale de timp. Variabila din exemplu poate să crească sau să scadă de la momentul la momentul
; nu știm cu certitudine în care direcție o ia, motiv pentru care o numim variabilă aleatoare. În plus, mărimea intervalului
e relevantă. De la o zi la alta pot muri zece oameni și se pot naște trei, sau invers. De la o lună la alta atât sporul negativ cât și cel pozitiv cresc, nu știm exact cu cât. Dar dacă luăm evoluția din ultima sută de ani a populației Pământului, pe perioade de cinci ani? Știm exact că per total a crescut.
Dacă ați făcut liceul, atunci cu siguranță că vă aduceți aminte că la analiza matematică tendința funcțiilor de a scădea sau de a crește putea fi studiată cu ajutorul derivatelor. Ei, derivata asta, precum și inversa ei, integrala, se dovedește a fi extrem de utilă în algebra probabilităților [i]: putem afirma că există o funcție care exprimă evoluția probabilistică a unei variabile aleatoare, pe care o vom numi densitate de probabilitate. Din aceasta poate fi calculată, printr-o sumă sau o integrală, o distribuție cumulativă, care dă probabilitatea ca variabila aleatoare să se afle într-un interval dat. Și așa am ajuns și la cuvântul cheie „distribuție”. (mai mult…)
- Care pleacă de la spații boreliene și axiome ale lui Kolmogorov și în fine, trece prin teoria mulțimilor și ajunge la chestii care ne depășesc pe noi ăștia care nu suntem experți într-ale matematicilor. Ne limităm la a spune că algebra și analiza matematică sunt foarte utile pentru statistică și probabilități și e bine să aveți o idee despre ele, chit că poate n-o să le aplicați niciodată direct. [↩]
probleme cu lumea de astăzi
duminică, 30 sept. 2012, 14:41
În ultima vreme tineretul de pe Interneți are un obicei interesant, acela de a publica pe diverse site-uri citate, din care unele aforisme ale unor personalități marcante (de obicei) ale secolului trecut. Mă găsesc de-a dreptul încântat de faptul că oamenii caută a exprima idei deseori complexe sub forme simple; sunt cu atât mai încântat cu cât acestea sunt preluate din cărți marcante, fapt ce denotă într-o anumită măsură cultivarea. În același timp mă dezamăgește totuși faptul că mulți indivizi dau dovadă de o slabă înțelegere a citatelor pe care le folosesc cu atâta pricepere. Unul din aceste citate sună după cum urmează:
The trouble with the world is that the stupid are so confident while the intelligent are full of doubt.
Textul îi aparține cică lui Bertrand Russell și sună de fapt în felul următor:
The fundamental cause of trouble in the world today is that the stupid are cocksure while the intelligent are full of doubt. (mai mult…)
despre statistică: numere mari.
sâmbătă, 22 sept. 2012, 13:19
Dacă matematica e o știință naturală într-un sens anume, atunci putem spune că statistica este acea ramură a matematicii care e cea mai apropiată de concret, adică de natură în sensul ei propriu. E chiar atât de apropiată încât am putea comite eroarea de a rupe statistica de domeniul matematicii și a o introduce bine mersi în alte științe care dispun de dânsa. Legătura e de fapt atât de strânsă încât practicarea științei ar fi imposibilă dacă nu am avea la dispoziție o unealtă atât de utilă cum este statistica. Mai mult, nu am exagera deloc spunând că necesitatea se extinde de la nivelul științei-scientia către cel al științei-knowledge, adică în toate epistemele posibile și imposibile.
Cuvântul „statistică” a fost aparent „coined” [i] de un individ pe nume Gottfried Achenwall, un prusac care a căutat să eficientizeze funcționarea statului prin diverse metode, scriind câteva lucrări notabile [ii] pe temă. Una din lucrări [iii] menționează termenul „statistik” cu referire la afacerile statului și în particular la colectarea și organizarea datelor numerice în cadrul acestuia. De aici și motivul pentru care nu putem vorbi despre date fără a ne gândi la statistică, și vice versa.
Privind problema din alte puncte de vedere, cum ar fi cel al inteligenței artificiale, statistica e un mod de a raționa, la fel ca deducția, care la rândul ei reprezintă o întreagă familie de așa-zise „metode de inferență”. Raționamentul inductiv are atât avantaje cât și dezavantaje față de cel deductiv: de exemplu îmi e foarte ușor să afirm că „toți câinii sunt animale”, pe baza faptului că nu am observat până în prezent vreun câine care să nu fie animal. Pe de altă parte nu pot să trag concluzia că „toate florile sunt galbene” dacă de exemplu eu am observat doar flori galbene pe parcursul existenței mele ca observator, la fel cum nu pot afirma că „Pământul se încălzește” doar pe baza faptului că vara asta a fost mai călduroasă decât cea de acum zece ani. (mai mult…)
- Cuvânt pentru care nu există sinonim în română. [↩]
- Staatsverfassung der Europäischen Reiche im Grundrisse, 1752. [↩]
- Vorbereitung zur Staatswissenschaft, 1748. [↩]