evoluția interacțiunii om-calculator (iv)
sâmbătă, 11 aug. 2012, 14:46
Seria „evoluția interacțiunii om-calculator” a avut un parcurs interesant, căruia îmi voi permite să îi fac un rezumat. Prima parte tratează câteva generalități legate de domeniul interacțiunii om-mașină. Cea de-a doua discută pe marginea interacțiunii dintre oameni și dispozitive digitale oarecare – care însă nu-s mai puțin „mașini” decât calculatoarele personale -, iar în partea cu numărul trei se remarcă existența unei nișe unde interfețele om-calculator au progresat enorm, și anume jocurile pe calculator.
Revenind la problema de fond, s-ar părea că interacțiunea om-calculator se poate reduce – cel puțin parțial – la ceea ce omul numește în general comunicare. Nu ne e clar ce implică asta, însă foarte probabil că într-o lume ideală ar fi de ajuns să îi zicem „calculatorului” [i] să rezolve nu știu ce problemă X („spală-mi șosetele”), iar acesta să se apuce imediat de muncă, ca un adevărat „rabochiĭ” care este dânsul. Observăm definiția vagă a conceptului „calculator”, care-i mai mult o mașină în sensul abstract al cuvântului. În spatele procesului de spălare a șosetelor pot sta unul, două, zece sau o mie de calculatoare fizice, care pentru utilizator vor apărea însă ca o singură entitate, „calculatorul”.
Nu știu dacă vă amintiți, dar în caz că nu, ar fi o idee bună să reluăm: ansamblul de programe sau mașini care apar utilizatorului drept o singură entitate se numește „sistem distribuit”. Ori sistemul distribuit, adică Internet-ul, adică arhiva™ e un pas evolutiv firesc față de telegraf, telefon, televiziune și așa mai departe, ceea ce face problema „interacțiunii”, adică a „comunicării” cu atât mai importantă. Un rol important în rezolvarea acestei probleme îl joacă web-ul, despre care spuneam mai demult că e o platformă socială în virtutea faptului că satisface nevoia de comunicare între oameni; însă comunicarea între oameni nu poate fi în acest caz eficientă dacă intermediarul („calculatorul”) nu satisface aceleași condiții. (mai mult…)
- Care „calculator” e ceva abstract, ca din ceruri, și suficient de inteligent încât să înțeleagă actele de vorbire, posibil mai bine decât ființa umană medie. [↩]
recunoașterea vorbitului, starea actuală
joi, 15 sept. 2011, 21:53
Înainte să intrăm în pâine, să definim clar subiectul problemei. Există două mari direcții în domeniul interdisciplinar analiza sunetului – interacțiunea om-mașină – inteligență artificială. Prima direcție se referă la recunoașterea vocii, în timp ce a doua constă în recunoașterea formelor sunetului, în special a vorbitului. În primul caz, analizăm mai degrabă caracteristici sonore precum timbrul sau „culoarea”, prin metode cum ar fi analiza Fourier.
Al doilea caz vine cumva în analogie cu recunoașterea formelor dintr-o imagine și se referă la învățarea automată a unor caracteristici de nivel mai înalt precum foneme, melodii, genuri muzicale și așa mai departe. Astfel, în realitate ce am zis eu despre cazul anterior este oarecum greșit, fiindcă aspecte precum inflexiunile vocii sau accentul pot fi în fapt utile pentru a recunoaște un vorbitor.
În fine, pe noi ne interesează să analizăm cum a evoluat până în prezent recunoașterea vorbitului, tehnologie care are un impact mare asupra felului în care omul interacționează cu mediul artificial din jurul său. La urma urmei, cine nu și-ar dori să dialogheze verbal cu calculatorul personal în limbaj natural, în stilul Star Trek? Să nu mai vorbim de aplicațiile unde acest aspect e în mod evident necesar, precum interfațarea cu persoane care nu pot să vadă. (mai mult…)