Inteligența artificială și prelucrarea limbajului natural

Inteligența artificială și prelucrarea limbajului natural
6 cititori au dat 5


biocause_whiteBG
Prelucrarea limbajului natural, sau lingvistica computațională, este o știință interdisciplinară care combină informatica, inteligența artificială și lingvistica; are ca scop cercetarea limbajelor scrise și vorbite.

În 1950, Alan Turing a publicat celebrul său articol „Computing Machinery and Intelligence” în care a descris cunoscutul test Turing:
Într-o cameră se află un robot și un om, fiecare putând comunica cu exteriorul cu ajutorul unei tastaturi. Un observator neutru, aflat într-o cameră alăturată, conversează cu cei doi, tot prin intermediul unei tastaturi. Robotul este la fel inteligent ca un om dacă în timpul conversației observatorul neutru nu poate face diferența dintre om și robot.

În prezent, instituții academice și mari corporații studiază prelucrarea limbajului natural, pregătind calculatoarele să treacă testul Turing. Scopul final este ca oamenii să poată vorbi cu calculatorul folosind limbajul liber, fără a cunoaște un limbaj de programare; și invers, calculatorul să își poate comunica rezultatele în limbaj natural.

Extragerea de cunoștințe din text (în limba engleză text mining) este un mod prin care calculatoarele pot „învăța” despre limbajul natural.

Un robot la fel de inteligent ca un doctor și care are acces la toate bazele de cunoștințe din domeniul medical

Capacitatea unui calculator de a înțelege limbajul natural este foarte relevantă în domeniul medical. Există numeroare studii medicale, studii de chimie, biochimie, biologie ale căror rezultate ar putea fi folosite în diferite situații:
-companiile farmaceutice pot folosi rezultatele în procesul creării unor noi medicamente
-doctorii pot folosi rezultatele în prescrierea medicamentelor deja existente de piață, în stabilirea diagnosticelor sau a metodelor de tratament etc.

Un calculator care înțelege limbajul natural poate compara eficient și rațional rezultatele studiilor de cercetare; poate stabili felul în care studiile de cercetare se completează reciproc; poate stabili dacă un studiu de cercetare confirmă sau contrazice rezultatele unor studii anterioare.

Un robot care trece testul Turing poate, în teorie, lua decizii cel puțin la fel de inteligente precum deciziile unui doctor care are acces la toate bazele de cunoștințe din domeniul medical.

Prelucrarea limbajului natural: un exemplu

Relațiile de cauzalitate stau la baza informației din domeniul biomedical, cum ar fi diagnoza, patologia sau biologia sistemică; identificarea automatizată a relațiilor de cauzalitate poate reduce semnificativ munca manuală a cercetătorilor și doctorilor oferindu-le sugestii relevante în rezolvarea problemelor cu care se confruntă.

Cercetătorii din Manchester, Marea Britanie, au construit o bază de cunoștințe bazată pe 19 articole științifice din domeniul medical al bolilor infecțioase (în limba engleză).
Doi doctori au analizat relațiile de cauzalitate din aceste articole și au construit o bază de cunoștințe numită BioCause. Cei doi doctori au identificat împreună 851 de relații de cauzalitate în cele 19 articole; relațiile identificate de primul doctor au coincis cu relațiile identificate de cel de-al doilea doctor în proporție de 60%. Pentru adnotarea textului cei doi doctori au folosit un program software numit BRAT (gratuit prin licența MIT).

005-entity-mention-annotation-example

Datele obținute din acest studiu (felul în care se pot exprima relațiile de cauzalitate) vor fi folosite în construirea unor programe care vor contribui la „perfecționarea” inteligenței calculatoarelor.

http://www.biomedcentral.com/1471-2105/14/2/

Claudiu Mihăilă, Tomoko Ohta, Sampo Pyysalo and Sophia Ananiadou
BMC Bioinformatics 2013, 14:2 doi:10.1186/1471-2105-14-2

Alte articole din aceeași categorie

Ți-a plăcut articolul? Urmărește-ne pe Twitter @Streptococcul

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile necesare sunt marcate *

Poți folosi aceste taguri și atribute HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>