Cum roboții se învață să citească și să gândească
Vorbim tot timpul despre înțelegerea calculatoarelor. Spunem că Google “știut” ce căutam sau că Cortana “a primit” ceea ce spuneam, dar “înţelegere” este un concept foarte dificil. Mai ales când vine vorba de computere.
Un domeniu al lingvisticii computaționale, numit prelucrarea limbajului natural (PNL), lucrează la această problemă deosebit de dificilă. Este un câmp fascinant chiar acum, și odată ce ai o idee despre cum funcționează, vei începe să-i vezi efectele peste tot.
O notă rapidă: Acest articol are câteva exemple de computere care răspund la vorbire, ca atunci când îl întrebi pe Siri pentru ceva. Transformarea discursului audibil într-un format ușor de înțeles de către calculator se numește recunoaștere vocală. NLP nu este preocupat de acest lucru (cel puțin în ceea ce privește capacitatea pe care o discutăm aici). NLP intră în joc doar odată ce textul este pregătit. Ambele procese sunt necesare pentru multe aplicații, dar acestea sunt două probleme foarte diferite.
Definirea înțelegerii
Înainte de a ajunge în modul în care computerele se ocupă de limbajul natural, trebuie să definim câteva lucruri.
Mai întâi de toate, trebuie să definim limbajul natural. Acesta este unul ușor: fiecare limbă folosită în mod regulat de către oameni se încadrează în această categorie. Nu include lucruri cum ar fi limbile construite (Klingon, Esperanto) sau limbile de programare pe calculator. Folosești limba naturală atunci când vorbești cu prietenii tăi. Probabil că îl folosiți pentru a discuta cu asistentul personal digital.
Deci, ce înțelegem atunci când spunem înțelegerea? Ei bine, este complex. Ce înseamnă să înțelegi o propoziție? Poate că ați spune că înseamnă că acum aveți conținutul dorit al mesajului în creierul vostru. Înțelegerea unui concept ar putea însemna că puteți aplica acest concept altor gânduri.
Definitii de cuvinte sunt nebuloase. Nu există un răspuns intuitiv. Filosofii au susținut lucruri de genul asta de secole.
Pentru scopurile noastre, vom spune că înțelegerea este abilitatea de a extrage cu precizie semnificația din limba naturală. Pentru ca un calculator să înțeleagă, trebuie să proceseze cu exactitate un flux de vorbire, să convertească fluxul în unități de semnificație și să fie capabil să răspundă la intrare cu ceva util.
Evident, acest lucru este foarte vag. Dar este cel mai bun lucru pe care îl putem face cu spațiu limitat (și fără un grad de neurofiloză). Dacă un computer poate oferi un răspuns uman sau cel puțin util unui flux de date despre limbajul natural, putem spune că înțelege. Aceasta este definiția pe care o vom folosi înainte.
O problemă complexă
Limba naturală este foarte dificilă pentru un calculator să facă față. Ai putea spune, “Siri, dă-mi indicații pentru Punch Pizza,” în timp ce aș putea spune, “Siri, Punch Pizza, te rog.”
În declarația ta, Siri ar putea alege fraza cheie “dă-mi indicații,” apoi executați o comandă legată de termenul de căutare “Punch Pizza.” În mine, totuși, Siri trebuie să aleagă “traseu” ca și cuvântul cheie și știu asta “Punch Pizza” este locul în care vreau să merg, nu “Vă rog.” Și acesta este doar un exemplu simplist.
Gândiți-vă la o inteligență artificială care citește e-mailuri și decide dacă acestea ar putea fi sau nu înșelătorii. Sau unul care monitorizează posturile social media pentru a evalua interesul pentru o anumită companie. Am lucrat odată la un proiect în care trebuia să învăț un calculator pentru a citi note medicale (care au tot felul de convenții ciudate) și să colecteze informații de la ei.
Acest lucru înseamnă că sistemul trebuia să poată trata abrevierile, sintaxa ciudată, variantele greșite ocazional și o mare varietate de alte diferențe în note. Este o sarcină foarte complexă care poate fi dificilă chiar și pentru oamenii cu experiență, cu atât mai puțin mașinile.
Setarea unui exemplu
În acest proiect, am fost parte din echipa care învăța calculatorul să recunoască anumite cuvinte și relațiile dintre cuvinte. Primul pas al procesului a fost să arate computerului informațiile pe care le conține fiecare notă, așa că am adnotat notele.
Au existat un număr foarte mare de diferite categorii de entități și relații. Luați propoziția “Doamna Green a fost tratată cu ibuprofen,” de exemplu. Doamna Green a fost etichetat (ă) ca PERSON, durere de cap a fost etichetat ca semn sau simptom, ibuprofen a fost etichetat ca MEDICA. Apoi, doamna Green a fost legată de durerea de cap cu o relație PRESENTS. În cele din urmă, ibuprofenul a fost legat de durerea de cap cu o relație TREATS.
Am marcat mii de note în acest fel. Am codificat diagnosticele, tratamentele, simptomele, cauzele care stau la baza, co-morbiditățile, dozele și orice altceva despre care ați putea să vă gândiți la medicamente. Alte echipe de adnotare au codificat alte informații, cum ar fi sintaxa. În cele din urmă, am avut un corpus plin de note medicale pe care AI le-a putut face “citit.”
Citirea este la fel de greu de definit ca și înțelegere. Computerul poate vedea cu ușurință că ibuprofenul tratează o durere de cap, dar când învață acea informație, este convertită în cele fără sens și unul și zero. Cu siguranță, poate oferi informații care se potrivesc oamenilor și care sunt utile, dar nu reprezintă o înțelegere. Inteligența artificială nu este ce inteligență artificială nu este. Sunt roboți inteligenți și sensibili care vor prelua lumea? Nu astăzi - și poate nu vreodată. Citeste mai mult ? Din nou, este în mare măsură o întrebare filosofică.
Învățarea reală
În acest moment, calculatorul a trecut prin note și a aplicat o serie de algoritmi de învățare a mașinilor. 4 Algoritmi de învățare a mașinilor care formează viața dvs. 4 Algoritmi de învățare a mașinilor care vă formează viața Este posibil să nu vă dați seama că învățarea mașinilor este deja în jur. poate exercita un nivel surprinzător de influență asupra vieții voastre. Nu mă credeți? S-ar putea să fii surprins. Citeste mai mult . Programatorii au dezvoltat diferite rutine pentru etichetarea părților de vorbire, analizarea dependențelor și circumscripțiilor, precum și pentru etichetarea rolurilor semantice. În esență, AI învăța “citit” notitele.
Cercetătorii ar putea încerca în cele din urmă testul, oferindu-i o notă medicală și cerându-i să eticheteze fiecare entitate și relație. Când computerul a reprodus corect adnotările umane, ați putea spune că a învățat cum să citească notele medicale menționate.
După aceea, a fost doar o chestiune de a strânge o cantitate enormă de statistici despre ceea ce citise: ce medicamente sunt utilizate pentru a trata care tulburări, care tratamente sunt cele mai eficiente, cauzele care stau la baza unor seturi specifice de simptome și așa mai departe. La sfârșitul procesului, AI ar putea să răspundă la întrebări medicale bazate pe dovezi din note medicale actuale. Nu trebuie să se bazeze pe manuale, companii farmaceutice sau intuiție.
Invatare profunda
Să ne uităm la un alt exemplu. Rețeaua neurală Google DeepMind învață să citească articole de știri. Ca și în cazul AI biomedicală de mai sus, cercetătorii au dorit să scoată informații relevante și utile din mai multe fragmente de text.
Formarea unei AI pe informații medicale a fost destul de dificilă, astfel încât să vă puteți imagina cât de multe date adnotate ar fi necesare pentru ca AI să poată citi articole de știri generale. Angajarea suficient de adnotatori și trecerea la suficiente informații ar fi prohibitiv de costisitoare și de consumatoare de timp.
Echipa DeepMind a apelat la o altă sursă: site-urile de știri. Mai exact, CNN și Daily Mail.
De ce aceste site-uri? Deoarece oferă rezumate subliniate de articole care nu scot pur și simplu propoziții din articolul în sine. AI înseamnă ceva de învățat de la AI. Cercetătorii spun practic AI, “Iată un articol și aici sunt cele mai importante informații din acesta.” Apoi i-au cerut să tragă același tip de informație dintr-un articol fără evidențierea bulletului.
Acest nivel de complexitate poate fi tratat de o rețea neurală profundă, care este un tip de sistem de învățare a mașinilor foarte complicat. (Echipa DeepMind face niște lucruri uimitoare despre acest proiect. Pentru a obține specificul, consultați această imagine de ansamblu de la MIT Technology Review.)
Ce poate face un AI de citire?
Acum avem o înțelegere generală a modului în care calculatoarele învață să citească. Luați o cantitate mare de text, spuneți computerului ce este important și aplicați niște algoritmi de învățare a mașinilor. Dar ce putem face cu un AI care atrage informații din text?
Știm deja că puteți trage informații specifice acționabile din notele medicale și puteți rezuma articolele de știri generale. Există un program open source numit P.A.N. care analizează poezia trăgând teme și imagini. Cercetătorii folosesc adesea învățarea mașinilor pentru a analiza organisme mari de date sociale, care sunt folosite de companii pentru a înțelege sentimentele utilizatorilor, pentru a vedea ce vorbesc oamenii și a găsi modele utile pentru marketing.
Cercetătorii au folosit învățarea în mașină pentru a obține o perspectivă asupra comportamentelor de trimitere prin e-mail și efectele suprasolicitării prin e-mail. Furnizorii de e-mail pot să-l folosească pentru a filtra spamul din căsuța de e-mail și pentru a clasifica anumite mesaje drept prioritare. Reading AIs sunt esentiale in a face eficient chatbots de servicii pentru clienti 8 Bots trebuie sa adaugati la aplicatia dvs. Facebook Messenger 8 Bots trebuie sa adaugati la aplicatia dvs. Facebook Messenger Facebook Messenger sa deschis la chat-uri, permitand companiilor sa livreze servicii pentru clienti, stiri si mai direct pentru tine prin intermediul aplicației. Iată câteva dintre cele mai bune disponibile. Citeste mai mult . Oriunde există text, există un cercetător care lucrează la prelucrarea limbajului natural.
Și, pe măsură ce acest tip de învățare a mașinilor se îmbunătățește, posibilitățile cresc. Computerele sunt mai bune decât oamenii la șah, Go și jocuri video acum. În curând pot fi mai buni la citire și învățare. Acesta este primul pas spre AI puternică Iată de ce oamenii de știință cred că ar trebui să vă îngrijorați de inteligența artificială Iată de ce oamenii de știință cred că trebuie să vă îngrijorați de inteligența artificială Credeți că inteligența artificială este periculoasă? AI poate prezenta un risc serios pentru rasa umană. Acestea sunt câteva motive pentru care ați putea fi interesați. Citeste mai mult ? Va trebui să așteptăm și să vedem, dar ar putea fi.
Ce fel de utilizări vedeți pentru citirea textului și învățarea AI? Ce fel de învățare în mașină credeți că vom vedea în viitorul apropiat? Împărtășiți-vă gândurile în comentariile de mai jos!
Credite de imagine: Vasilyev Alexandr / Shutterstock
Explorați mai multe despre: Inteligența artificială, Futurologia.