să scriem împreună un generator de text markov (i)
sâmbătă, 15 dec. 2012, 15:29
Invit cititorul de Cărămizi să ia parte la o inițiativă
- (a) destul de rar întâlnită pe blog-urile românești,
- (b) pur didactică,
- (c) destinată programatorilor amatori, profesioniști sau pur și simplu oamenilor cărora le place să-și folosească chestia aia dintre umeri, și nu în ultimul rând
- (d) aparent inutilă.
De fapt punctul (d) e în mare parte fals; stând un pic și cugetând, realizez că ar fi foarte util să urmăriți tutorialul dacă doriți de exemplu să învățați Haskell sau să vă faceți o idee legată de analiză statistică și lanțuri Markov, sau pur și simplu dacă vreți să vă dezvoltați un generator de spam [i]. (mai mult…)
- Nu văd care-i problema. Scopul meu e acela de a le arăta oamenilor cum să folosească cuțitul, nu să le explic cum ar putea să-l vâre în alți indivizi. [↩]
o scurtă analiză a inutilității activismului
sâmbătă, 8 dec. 2012, 13:49
Urmăresc de ceva timp un site numit Acces Now, sau mai nou doar Access. Înainte de a comenta pe marginea misiunii site-ului sau a organizației din spatele său, să vedem cum se descriu dânșii, și anume cu ajutorul unui citat de pe pagina lor „About us”:
Access is a global movement premised on the belief that political participation and the realization of human rights in the 21st century is increasingly dependent on access to the internet and other forms of technology. Founded in the wake of the 2009 Iranian post-election crackdown, Access teams with digital activists and civil society groups internationally to build their technical capacity and to help them advocate globally for their digital rights. Access provides thought leadership and practical policy recommendations in the broader field of internet freedom, and based on that expertise mobilizes its global movement of citizens to campaign for an open internet accessible to all.
Access este cu alte cuvinte un site care caută să promoveze un așa-zis „awareness” pe diverse subiecte delicate care țin de libertatea pe Internet, intimitate/anonimitate și alte drepturi ale utilizatorilor. Am aflat de ei cel mai probabil de când cu ACTA, când o droaie de ONG-uri făceau efortul de a-i convinge pe reprezentanții Uniunii Europene că înțelegerea cu pricina este o prostie de cea mai joasă speță. Cu ocazia asta am semnat printre altele petiția inițiată de reprezentanții site-ului și am ajuns să rămân abonat la feed-urile lor de știri, care-s suficient de informative pentru sufletul meu. (mai mult…)
despre statistică: eșantionare.
sâmbătă, 1 dec. 2012, 21:34
Povesteam cu ceva timp în urmă că rolul statisticii este în esență acela de a organiza seturi mari de date în așa fel încât să putem spune ceva despre acestea din urmă. Având un sistem — fizic sau chimic sau informatic sau de orice alt fel, importantă e posibilitatea de a-l analiza cantitativ –, statistica ne ajută deci să îi putem evalua proprietățile dintr-un anumit punct de vedere, nu unicul și nicidecum cel mai eficient din punctul de vedere al consistenței, însă un punct anume de vedere, foarte util prin prisma avantajelor teoretice și practice pe care ni le oferă.
Să presupunem bunăoară că deținem o bucată de metal, a cărei compoziție chimică o cunoaștem apriori. Bucata respectivă este un unic obiect solid despre care știm foarte bine că este în același timp format din o mulțime de atomi legați prin forțe chimice numite și metalice. Despre metale cunoaștem și că au diverse proprietăți fizice cum ar fi conductivitatea electrică sau anumite temperaturi de topire, însă dat fiind numărul mare de molecule dintr-o bucată de metal, ar fi nepractic să cuantificăm aceste proprietăți ale bucății noastre luând în considerare fiecare moleculă în parte. Fizica statistică se dovedește în acest punct a fi esențială pentru a stabili o legătură între efectele mecanicii clasice și/sau cuantice la nivel microscopic și proprietățile macroscopice ale obiectului.
Acesta este un avantaj teoretic al statisticii. Pe de altă parte avantajele practice sunt nenumărate, mai ales dacă alegem drept context Internetul, a cărui cantitate literalmente imensă de date poate fi „minerită” și prelucrată în diverse scopuri, cel mai banal exemplu fiind acela al publicității targetate. În același timp un fișier audio sau o imagine reprezintă ele însele mine de date, acestea putând la rândul lor să fie analizate pentru a extrage cuvinte, respectiv obiecte reale. Putem realiza de exemplu un program care să cunoască un măr într-o imagine oarecare prin alcătuirea unui model statistic și testarea acestuia folosind exemple pozitive și negative [i]. (mai mult…)
- Sigur, o întrebare perfect validă ar fi „cum mai exact facem asta?”. Din fericire Christopher Bishop a scris deja o carte pe temă, cred că am mai menționat-o într-un articol anterior. Ceea ce înseamnă că există deja metode consacrate de a elabora și testa modele statistice, ceea ce face ca lucrurile să fie o idee mai ușoare pentru ingineri. [↩]
frank herbert față cu sexismul
duminică, 2 dec. 2012, 00:12
Am avut ocazia mai adineauri să citesc pe diagonală recenzia redactată de un anume Russ Allbery pe marginea unui roman vechi de aproape cincizeci de ani, mai exact Dune-ul lui Frank Herbert. Articolul mi se pare că tinde să descrie exhaustiv universul Dune așa cum este el prezentat în primul volum din seria Dune, ceea ce face scrierea lui Allbery una interesantă mai ales pentru cei ce au parcurs romanul cu ceva timp în urmă și vor să reintre în miezul universului. Cu toate astea pasajele critice ale articolului tind să aibă un „bias” destul de puternic. Să cităm două paragrafe relevante din acest punct de vedere: