despre statistică: eșantionare.

sâmbătă, 1 dec. 2012, 21:34

Povesteam cu ceva timp în urmă că rolul statisticii este în esență acela de a organiza seturi mari de date în așa fel încât să putem spune ceva despre acestea din urmă. Având un sistem — fizic sau chimic sau informatic sau de orice alt fel, importantă e posibilitatea de a-l analiza cantitativ –, statistica ne ajută deci să îi putem evalua proprietățile dintr-un anumit punct de vedere, nu unicul și nicidecum cel mai eficient din punctul de vedere al consistenței, însă un punct anume de vedere, foarte util prin prisma avantajelor teoretice și practice pe care ni le oferă.

Să presupunem bunăoară că deținem o bucată de metal, a cărei compoziție chimică o cunoaștem apriori. Bucata respectivă este un unic obiect solid despre care știm foarte bine că este în același timp format din o mulțime de atomi legați prin forțe chimice numite și metalice. Despre metale cunoaștem și că au diverse proprietăți fizice cum ar fi conductivitatea electrică sau anumite temperaturi de topire, însă dat fiind numărul mare de molecule dintr-o bucată de metal, ar fi nepractic să cuantificăm aceste proprietăți ale bucății noastre luând în considerare fiecare moleculă în parte. Fizica statistică se dovedește în acest punct a fi esențială pentru a stabili o legătură între efectele mecanicii clasice și/sau cuantice la nivel microscopic și proprietățile macroscopice ale obiectului.

Acesta este un avantaj teoretic al statisticii. Pe de altă parte avantajele practice sunt nenumărate, mai ales dacă alegem drept context Internetul, a cărui cantitate literalmente imensă de date poate fi „minerită” și prelucrată în diverse scopuri, cel mai banal exemplu fiind acela al publicității targetate. În același timp un fișier audio sau o imagine reprezintă ele însele mine de date, acestea putând la rândul lor să fie analizate pentru a extrage cuvinte, respectiv obiecte reale. Putem realiza de exemplu un program care să cunoască un măr într-o imagine oarecare prin alcătuirea unui model statistic și testarea acestuia folosind exemple pozitive și negative [i]. (mai mult…)

  1. Sigur, o întrebare perfect validă ar fi „cum mai exact facem asta?”. Din fericire Christopher Bishop a scris deja o carte pe temă, cred că am mai menționat-o într-un articol anterior. Ceea ce înseamnă că există deja metode consacrate de a elabora și testa modele statistice, ceea ce face ca lucrurile să fie o idee mai ușoare pentru ingineri. []

despre statistică: distribuții.

sâmbătă, 27 oct. 2012, 18:43

Statistica este domeniul care studiază folosirea unor volume (cât mai mari, sau mai bine zis cât mai generale cu putință) de date spre a extrage ceva util din acestea. Definiția „utilului” diferă de obicei de la o aplicație la alta: în fizică ne poate da o intuiție asupra felului în care se deplasează lichidele sau electronii; în biologie poate explica evoluția anumitor caracteristici ale speciilor; în medicină poate corela evoluția unei boli cu anumiți factori din viața pacientului; în inteligența artificială raționamentul statistic e o metodă de inferență și așa mai departe. Toate acestea au însă un numitor comun.

Am stabilit mai demult că nu e de ajuns să avem date, trebuie să și știm cum să le folosim. Un set de date oarecare e dat de una sau mai multe variabile, cum ar fi de exemplu populația unui oraș măsurată la intervale egale de timp. Variabila din exemplu poate să crească sau să scadă de la momentul t la momentul t + \delta t; nu știm cu certitudine în care direcție o ia, motiv pentru care o numim variabilă aleatoare. În plus, mărimea intervalului \delta t e relevantă. De la o zi la alta pot muri zece oameni și se pot naște trei, sau invers. De la o lună la alta atât sporul negativ cât și cel pozitiv cresc, nu știm exact cu cât. Dar dacă luăm evoluția din ultima sută de ani a populației Pământului, pe perioade de cinci ani? Știm exact că per total a crescut.

Dacă ați făcut liceul, atunci cu siguranță că vă aduceți aminte că la analiza matematică tendința funcțiilor de a scădea sau de a crește putea fi studiată cu ajutorul derivatelor. Ei, derivata asta, precum și inversa ei, integrala, se dovedește a fi extrem de utilă în algebra probabilităților [i]: putem afirma că există o funcție care exprimă evoluția probabilistică a unei variabile aleatoare, pe care o vom numi densitate de probabilitate. Din aceasta poate fi calculată, printr-o sumă sau o integrală, o distribuție cumulativă, care dă probabilitatea ca variabila aleatoare să se afle într-un interval dat. Și așa am ajuns și la cuvântul cheie „distribuție”. (mai mult…)

  1. Care pleacă de la spații boreliene și axiome ale lui Kolmogorov și în fine, trece prin teoria mulțimilor și ajunge la chestii care ne depășesc pe noi ăștia care nu suntem experți într-ale matematicilor. Ne limităm la a spune că algebra și analiza matematică sunt foarte utile pentru statistică și probabilități și e bine să aveți o idee despre ele, chit că poate n-o să le aplicați niciodată direct. []

naturalețea în matematici

duminică, 19 aug. 2012, 19:34

Începem scurta noastră – căci nu-mi aparține mie personal mai mult decât aparține oricărui individ care a dat cu privirea peste știința matematicii măcar o dată în viața sa – sinteză cu o precizare: în caz că vă întrebați ce treabă ar putea avea naturalețea cu matematica, mă ofer să vă lămuresc, deși sunt de părere că ar fi trebuit să vă lămuriți și singuri până acum, iar dacă sunteți ceva mai tineri nu-i vremea pierdută. Matematica nu-i o chestiune așa, pur abstractă, sau dacă este, atunci nu-i degeaba în felul respectiv. Orice, dar absolut orice structură matematică are un corespondent mai mult sau mai puțin direct în lumea reală.

Se face că lumea reală, așa cum o priviți, auziți și toate cele, conține structuri – în sensul pur algebric al cuvântului – care pot fi naturale sau nu, opusul fiind poate „nenaturale”, sau „artificiale” în funcție de context. Naturalul face în general referire la ceva preexistent, care e într-un anumit fel din capul locului, ori în contextul nostru matematic sensul e o idee diferit: „natural” înseamnă mai degrabă „imediat” sau „intuitiv”, adică un sens și/sau o formă care se mapează direct pe mintea umană și mecanismele sale. Ideea e valabilă însă și în zisa „lume reală”, care e într-un fel anume în virtutea faptului că așa e percepută dânsa, individul neavând un punct clar de reper legat de un alt fel în care ar putea fi aceasta. (mai mult…)

dinamica traficului, un model

duminică, 5 aug. 2012, 17:29

DEX dă termenului de trafic o definiție particulară și cvasi-improprie:

TRAFÍC, traficuri, s. n. 1. Totalitatea transporturilor de mărfuri sau de persoane care se fac pe o anumită cale de comunicație, cu anumite mijloace de transport, într-un interval de timp și în condiții precizate. ♦ Totalitatea legăturilor de telecomunicație stabilite într-un anumit interval de timp și în anumite condiții tehnice.

În fapt traficul este sinonim cu conceptul abstract de transport, care presupune un spațiu S al cărui obiect o (nu neapărat unicul) poate fi mutat de la un punct x_1 către un alt punct x_2. Mutarea va duce astfel la transformarea lui S într-un alt spațiu, tot S, însă cu poziția lui o schimbată [i]. Ținând cont de faptul că două obiecte distincte o_1, o_2 \in S nu pot ocupa aceeași poziție la un moment dat – sau, dacă ar fi să ne luăm după definiție, în același spațiu dat -, dorim să modelăm transportul unei mulțimi (posibil infinite) de obiecte prin S.

Complexitatea deloc redusă a problemei prezentate mai sus mă obligă să îi aduc simplificări acesteia din urmă. Cazul particular ilustrativ în acest sens este o găselniță a unor matematicieni și calculatoriști celebri – printre care se numără și John von Neumann -, anume automatul celular – mai cu seamă cel unidimensional, ale cărui proprietăți le voi enunța în cele ce urmează. (mai mult…)

  1. A se observa că definiția face complet abstracție de natura spațiului sau a obiectelor aflate într-însul. La urma urmei nu ne interesează dacă avem de-a face cu vaci, saci de făină sau biți, elementele ce țin de detaliu – cum ar fi de exemplu un protocol de transport – fiind lăsate în totalitate implementării. []

o introducere ușor neobișnuită în domeniul arhitecturii software

duminică, 29 iul. 2012, 16:24

Arhitectura, sau mai general proiectarea chestiilor este un subdomeniu al ingineriei ca oricare altul, care se ocupă, am putea spune lipsiți de rigoare, cu descrierea chestiilor în cauză. Bunăoară, dacă doresc, inginer fiind, să proiectez un ciocan spre a rezolva o problemă dată (de obicei bătutul cuielor), va trebui – dat fiind că-s om, iară nu orice om, ci inginer – să îmi formulez un set de cerințe și întrebări adiacente acesteia, legate printre altele de: părțile componente ale ciocanului, felul în care arată acestea, din ce sunt formate și cum se îmbină ele spre a forma mai mult decât suma părților lor.

Fundamentele acestei paradigme sunt aceleași în cazul sistemelor software, motiv pentru care și există în prezent acest domeniu oarecum bizar al ingineriei programelor pe calculator [i]. Diavolul se regăsește bineînțeles în detalii, acolo unde teoreticienii încearcă să prezică evoluția software-ului în timp. Dacă în cazul unui ciocan lucrurile stau destul de simplu – dai cu el până se strică -, software-ul evoluează destul de haotic în timp, degradându-se și pierzându-și din fiabilitate în moduri greu de prevăzut. Colac peste pupăză, inginerii noștri plini de creativitate gândesc modele și implementări care de care mai complexe, când rolul abstractizării e tocmai opusul, anume acela de a simplifica lucrurile. Deci aici zic că ar ajuta un pic să luăm lucrurile de la zero, deci să regândim problema. (mai mult…)

  1. Da, dragi cititori, ingineria software e un ceva anume extrem de bizar prin felul ei de a fi. Aceasta ba apare în, ba dispare din mintea inginerului programator, existând și în același timp încetând să existe pentru acesta la un moment dat. Fenomenul se datorează nu numai faptului că lumea ideilor e volatilă în cadrul unui singur individ, ci și aceluia că oameni diferiți pot privi o singură problemă în moduri complet disjuncte, ajungând astfel să petreacă o perioadă considerabilă de timp stabilindu-și un limbaj comun. Astfel au apărut hack-uri imense dezvoltate de oameni cu interese profund diferite, cum e nucleul Linux, și astfel au luat viață inclusiv unele produse ale consumului de LSD, cum e Unix. []