brick quote #16

vineri, 3 mai 2013, 21:34

We talk about the tyranny of words, but we like to tyrannise over them too; we are fond of having a large superfluous establishment of words to wait upon us on great occasions; we think it looks important, and sounds well. As we are not particular about the meaning of our liveries on state occassions, if they be but fine and numerous enough, so, the meaning or necessity of our words is a secondary consideration, if there be but a great parade of them. And as individuals get into trouble by making too great a show of liveries, or as slaves when they are too numerous rise against their masters, so I think I could mention a nation that has got into many great difficulties, and will get into many greater, from maintaining too large a retinue of words.

  • Charles Dickens, David Copperfield

despre înțeles: discriminare.

duminică, 24 feb. 2013, 01:18

Atomii limbii, și anume cuvintele, sunt un soi de călător; pe de o parte în timp, de la rădăcini de multe ori greu de găsit, și pe de altă parte în spațiu, de la o cultură la alta sau altele: de obicei dinspre cultura dominantă, care inventează concepte noi, către cele dominate. Explicația fenomenului e una cât se poate de simplă: corespondentul conceptului fie nu există, fie nu poate fi exprimat suficient de concis în cadrul culturii dominate [i], împrumutul dovedindu-se a fi astfel aproape imediat.

În cursul călătoriei sale, cuvântul își schimbă deseori forma, dar nu în ultimul rând semantica. Această schimbare nu se produce brusc și haotic, ci are de obicei un anumit sens, înțelesul nou ajungând să fie mai mult sau mai puțin general față de cel inițial. De exemplu cuvântul „filtru”, provenit din limba franceză, se referea inițial la separarea impurităților de lichide; în prezent, orice lucru abstract sau concret care „lasă să treacă” anumite chestii și „blochează” alte chestii este un filtru, fie el în domeniul chimiei, procesării semnalelor sau al poliției. (mai mult…)

  1. De exemplu, ideea de „Translation Lookaside Buffer” nu există deloc în limba română. Din acest motiv, corespondentul acestuia va fi în mod evident „Translation Lookaside Buffer”, în ciuda opoziției conservatorilor. Același fenomen poate fi observat și în cazul unor termeni mai populari precum „smartphone” sau „laptop”. []

o propunere privind predarea programării în școli

duminică, 10 feb. 2013, 18:10

Prezentul articol pornește de la o discuție iscată pe Facebook [i] de către Laura via rosedu. M-am decis să public o însemnare separată în primul rând pentru că mă ajută să îmi pun oareșce gânduri în ordine, departe de zgomotul rețelelor sociale, și în al doilea rând fiindcă am mai scris în trecut pe tema asta, iar acum doar profit de ocazie pentru a dezvolta subiectul.

A se nota că am folosit termenul „programare” și nu pe cel de „informatică”. Numele atribuit disciplinei în școli e o idee nefericit, pentru că se referă inclusiv la domenii precum teoria informației, ori să fim serioși, copiii de liceu n-au nevoie de exemplu de teorema Shannon-Nyquist. Scopul „informaticii” din învățământul preuniversitar e să îi familiarizeze pe elevi cu utilizarea calculatoarelor — unde GNU/Linux s-ar potrivi de minune, pentru că Windows au deja acasă — și cu programarea acestora, și nu în ultimul rând să îi învețe câteva concepte generale din știința calculatoarelor, adică ce-i ăla un arbore, o listă sau o bază de date, plus doi-trei algoritmi. (mai mult…)

  1. Mă frustrează imens faptul că Facebook e un „walled garden”. Cu toate astea o să-mi calc pe cele mai cele principii și o să las un link la sondajul inițial aici. Postarea inițială a generat multe comentarii, pe care vă invit să le citiți dacă aveți la îndemână un cont de Facebook. []

să scriem împreună un generator de text markov (iv)

sâmbătă, 26 ian. 2013, 12:40

Am stabilit în cadrul părții a treia a seriei că urmează să construim un generator de text Markov format din două componente:

  • O componentă care primește la intrare un model statistic, adică un lanț Markov, și întoarce un text generat aleator. Aceasta a constituit subiectul celei de-a doua părți a tutorial-ului.
  • O componentă care primește la intrare unul sau mai multe texte într-o limbă oarecare și construiește pe baza lui, respectiv a lor, lanțul Markov necesar generării de text. În cele ce urmează vom implementa această a doua parte, care este de fapt prima parte a algoritmului în totalitatea sa.

Am observat de asemenea că problema construirii unui model pentru generarea propozițiilor într-o limbă oarecare este teoretic intractabilă. Pe de o parte un „corpus al limbii” complet ar putea fi constituit doar din totalitatea textelor și cuvintelor scrise în limba respectivă. Pe de altă parte limba este o unealtă flexibilă, cu reguli și excepții care pot fi încălcate în diverse contexte, și a cărei formalizare este un subiect de cercetare intens la ora actuală în știința lingvisticii. (mai mult…)

să scriem împreună un generator de text markov (iii)

vineri, 4 ian. 2013, 23:44

Până acum am povestit despre lanțuri Markov și am găsit un model computațional de reprezentare a acestora, după care am construit pe baza modelului un program care parcurge pseudo-aleator lanțul și întoarce stările parcurse. Am arătat că stările pot diferi de la un apel la altul și că valoarea stării următoare depinde de distribuția de probabilitate formată de stările succesoare. Din fericire generatoarele de numere pseudo-aleatoare din calculatoarele de zi cu zi sunt suficient de bune încât să asigure încadrarea cu o anumită eroare (suficient de mică) în distribuția fiecărei stări.

O abordare mai serioasă a lanțurilor Markov ar presupune parcurgerea unor subiecte destul de aride precum procesele stochastice și distribuțiile de probabilitate. Din nefericire noi nu avem loc aici să intrăm în astfel de subiecte, motiv pentru care abordarea folosită în continuare va fi una așa-zis „intuitivă”, sau mai degrabă o bâjbâială empirică având rolul de a familiariza cititorul cu problema lanțurilor Markov și a generării de text pe baza lor. (mai mult…)