Birt í "0", 2(3), 1994.

VÉLIN SEM BREYTIR HEIMINUM

Kristinn R. Thórisson

Lesendur hafa eflaust oft heyrt að framtíðin beri í skauti sér minni tölvur, hraðvirkari tölvur, fullkomnari tölvur. Slíkt er augljóslega gott fyrir tölvufræðinga...á sama hátt og kraftmeiri og fullkomnari bílar koma sér vel fyrir kappakstursmenn. Það er hins vegar ekki alltaf ljóst hvaða þýðingu þessar framfarir hafi fyrir hinn almenna borgara. Ritsjórar Núllsins hafa farið þess á leit við mig að segja lesendum blaðsins frá rannsóknum sem móta framtíð tölvunnar. Hvernig munu tölvur framtíðarinnar líta út frá sjónarhorni hins almenna neytanda?

Ég hef starfað í þrjú ár hjá Rannsóknarstofnun Boðmiðla (the Media Laboratory) við Tækniháskóla Massachusetts (Massachuetts Institute of Technology, eða M.I.T.) í Bandaríkjunum. Á Rannsóknarstofnuninni vinna um 40 vísindamenn og 110 nemendur, sem skiptast svo í smærri rannsóknarhópa. Markmið rannsókna okkar er að finna upp tæki og tækni sem "auðvelda samskipti fólks við vélar og samskipti milli manna með aðstoð véla." Fyrir tólf árum spáði stofnandi Rannsóknnarstofnunarinnar, Nicholas Negroponte, því að upplýsingamiðlun myndi enda með samruna sjónvarps, hljóðvarps, myndbanda, kvikmynda og texta. Samnefnari allra þessara boðmiðla yrði tölvan og stafræn skráning upplýsinga. Jafnframt myndi upplýsingamiðlun beinast meira að einstaklingum heldur en hópum. Í stað fjölmiðlun kæmi "fámiðlun" og jafnvel "einmiðlun." Þessi þróun er nú skemur undan en margur ætlaði.

Á komandi árum munu Bandaríkin til dæmis taka ákvörðun um nýjan sjónvarpsstaðal. Ljóst þykir nú að sá staðall verður al-stafrænn. Það þýðir að tölvur geta lesið sjónvarpssendingar, breytt þeim og birt að vild. Slíkt opnar möguleika á að leyfa neytendum að panta efni, leita að upplýsingum og fá þær samstundis sendar heim í stofu, vinnustað eða hvar sem móttökutæki eru til staðar. Það er einnig skammt í að tónar, tal, og myndefni hvers konar sem safnað er af almenningi jafnt sem atvinnufréttamönnum verði allt skráð og geymt á stafrænu formi-tölvur geta því geymt þær upplýsingar, sent þær eftir símalínum, birt þær á skjám, lesið þær upphátt fyrir mann eða breytt þeim á hvern þann hátt sem maður kýs. Í stað þess að stór fyrirtæki ákveði skemmti- og fréttaefni fyrir alla íbúa heillar borgar eða lands, ræðst dreifing upplýsinga og skemmtiefnis af smekk og þörfum hvers einstaks neytanda. Á næstu öld munu verða gífurlegar breytingar í samskiptum, upplýsingamiðlun og upplýsinganotkun. Ég hef valið fjóra þætti tölvuþróunar sem ég tel að muni skipta miklu máli í framtíðinni. Auk þess að hafa bein áhrif á daglegt líf okkar munu þessir þættir gjörbreyta viðhorfi okkar til véla-og til okkar sjálfra.

Gervigreind

Flestir kannast við kvikmyndir svo sem "Geimferð, árið 2001" (2001: A Space Odyssey), "Tortímandann" (Terminator) og "Stjörnustríð" (Star Wars). Þessar myndir eiga það sameiginlegt að söguhetjur þeirra eru vélar sem gæddar eru því sem við gætum kallað "vélviti." Þótt enn virðist að minnsta kosti nokkrir áratugir í að tölvur öðlist jafn margþátta og flókna greind og menn, þýðir það ekki að gervigreind sé útilokuð-eða ekki til. Vélvit í raunveruleikanum er hinsvegar talsvert frábrugðið því sem sést í kvikmyndum. Mörg forrit sem eru í notkun nú hafa það sem mætti kalla "takmarkað vit"-þekkingu á afmörkuðu sviði. Til eru til dæmis forrit sem spá fyrir um jarðskjálfta, framkvæma sjúkdómsgreiningar, semja sögur og tefla. Mörg þeirra standa sig jafn vel og mennskir starfsbræður þeirra. Það sem háir slíkum forritum hins vegar er heimska þeirra á öllum sviðum öðrum en þeim sem þau voru sérstaklega hönnuð fyrir. Frá því að gervigreindarrannsóknir hófust, fyrir aðeins 38 árum, hafa vísindamenn komist að því að það sem okkur finnst auðvelt er erfitt fyrir tölvur og öfugt. Eins erfitt og mönnum reynist að reikna út kvaðratrótina af tvöþúsundþrjátíuogníu, þá eiga tölvur ótrúlega erfitt með að smyrja brauð, skrúfa frá krana, spila borðtennis eða ganga um herbergi án þess að rekast á.

Nýlegar rannsóknir hafa samt leitt í ljós aðferðir sem gætu gert tölvum mögulegar slíkar athafnir. Rodney Brooks við M.I.T. hefur til dæmis hannað "véldýr" sem hafa næga greind til að ganga um án þess að rekast á. Fremst í flokki véldýra hans er sex lappa málmskordýr sem lærir að hreyfa fæturnar rétt til að komast yfir ójöfnur og forðast að ganga á hluti sem það kemst ekki yfir. Slík véldýr hafa meðal annars nægilega greind til að ferðast ein um á Mars og safna sýnum. Ýmislegt bendir til að greind sem þessi geti verið nytsamleg á mörgum sviðum, ekki aðeins á Mars. Til dæmis hafa svipuð forrit og stjórna véldýrum Brooks verið notuð til að hafa umsjón með tölvugagnavinnslu og búa til tölvuteiknimyndir.

Á næstu öld má búast við að gervigreindarrannóknum fleygi áfram. Tvennt kemur þar til. Í fyrsta lagi hafa rannsóknir á taugakerfum dýra þegar leitt í ljós ýmislegt sem nýst hefur í þróun gervigreindar. Í öðru lagi eru rannsóknir mjög að aukast sem leitast við að sameina niðurstöður úr sálarfræði, tölvufræði og lífeðlisfræði, en slíkt er nauðsynlegt til að auka skilning á þeim ferlum sem liggja að baki greindar hjá mönnum og dýrum. Þótt sum gervigreindarforrit framtíðarinnar verði notuð til að stjórna vélmennum sem ryksuga, hreinsa glugga, bóna gólf eða þrífa klóakksrör munu fleiri þeirra líklega búa í heimi tölvunnar. Hlutverk þeirra verður margþætt; slík forrit geta fært sig milli tölva og birst á hvaða skjá sem er, í hvaða gervi sem er. Sum þeirra munu aðstoða okkur við að finna upplýsingar, panta flugmiða, senda skilaboð eða velja íbúð. Önnur munu verða eins konar "tölvuræstingarmenn" sem hreinsa til í tölvukerfum, sjá um að tölvuvírusar komist ekki inn í kerfið og halda hlutum til reiðu. Enn önnur forrit munu hafa nægilegt vit til að tala við okkur á mæltu máli.

Samskipti við vélar

Rannsóknarstofnun Boðmiðla beinir spjótum sínum meðal annars að því að einfalda samskipti manna við tölvur. Eitt megin markmiðið er að gera samskipti við vélar jafn auðveld og samskipti við annað fólk. Á rannsóknarstofu okkar, undir stjórn Dr. Richard A. Bolt, höfum við þróað tölvukerfi sem gera notendum kleyft að nota tal og handahreyfingar til að gefa tölvunni skipanir. Í stað lyklaborðs notum við litla myndavél sem nemur hvert notandinn er að horfa, sérútbúnir hanskar segja tölvunni hvað hann er að gera með höndunum. Lítill hljóðnemi sendir tal til tölvu sem túlkar mælt mál. Með því að bera saman athafnir notanda í tali og handahreyfingum, ásamt vitneskju um hvert hann er að horfa, getur tölvan framkvæmt flóknar skipanir svo sem að teikna þrívíðar myndir. Notandinn segir til dæmis "búðu til herbergi" og horfir á vissan stað á skjánum. Tölvan teiknar mynd af herbergi þar sem hann horfði. "Settu borð hér" segir notandinn og sýnir með annarri hendinni hvar borðið á að koma. Borðið birtist á þeim stað sem beðið var um. "Það er mús..." (hægri höndin sýnir staðsetningu músarinnar) "...við hliðina á borðinu" (vinstri höndin sýnir hvar borðið er miðað við músina). Innan tveggja sekúndna teiknar tölvan litla mús þeim megin við borðið sem notandinn vildi. "Láttu hana hlaupa í þessa átt" (handahreyfing sýnir í hvaða átt). Músin hleypur eftir gólfinu í sömu átt og höndin sýndi. Samskipti sem þessi ættu að vera öllum kunn-við notum nákvæmlega sömu boðskiptaleiðir þegar við tölum við hvert annað.

Innan áratugar munu framfarir í tölvusjón gera vélum kleift að horfa á okkur í gegnum myndavélar og skilja nákvæmlega hvað við erum að segja. Allir sem eru færir um félagsleg samskipti geta þá notað tölvur-engin ástæða til að lesa leiðarvísa eða læra sérstakt skipanamál...allt sem þarf til er að geta útskýrt mál sitt á sama hátt og við gerum á hverjum degi í samskiptum við aðra. Margt mun breytast í þjóðfélaginu þegar neytendur geta notað einfaldar en jafnframt öflugar samskiptaaðferðir til að sækja upplýsingar í gagnabanka sem geyma fréttir og skemmtiefni. Eftir tuttugu ár gæti ég gengið að tölvunni minni og beðið hana um að finna fyrir mig bíómynd í svipuðum dúr og "Sound of Music"-hún sér svo um að hringja í réttan gagnabanka og jafnframt að færa greiðslu af tölvubankareikningum mínum yfir til eigenda gagnabankanns. Ef ég man ekki nafn á einhverri bíómynd gæti ég lýst fyrir tölvunni atriðum úr myndinni og hún reyndi að túlka um hvaða mynd um væri að ræða. Ekki er ólíklegt að tölva-eða forrit-sem maður hefur samskipti við á þennan hátt taki á sig persónueinkenni. Tölvuforrit sem læra inná einkenni manns, skapgerð og samskiptastíl munu eflaust taka við hlutverki eins konar félaga, ekki ósvipað því sem hundar eða kettir þjóna nú. Þróun í þessa átt er reyndar þegar hafin: Joseph Bates, við Carnegie-Mellon háskólann í Pittsburg, hefur þróað lítil "skjádýr" sem hægt er að hafa samskipti við með lyklaborði og mús. Dýrin, sem hvert hefur sinn sérstaka persónuleika, geta farið í eltingaleiki og leikið ýmsar listir fyrir notandann. Pattie Maes, við Rannsóknarstofnun Boðmiðla, hefur þróað forrit sem hjálpa notendum að skipuleggja fundi, flokka tölvupóst og leita að fréttum (sem birtast í tölvugagnabönkum um allan heim) sem líklegt þykir að notandinn hafi áhuga á. Því meira sem forritin eru notuð, því betur læra þau að þekkja smekk notandans. Þau verða því stöðugt betri "aðstoðarmenn." Slík forrit eru kölluð "agents" á ensku og hef ég kosið að kalla þau "tölvuerindreka" eða bara erindreka á íslensku.

Hvert gætu næstu skref í þessari þróun leitt okkur? Ímyndið ykkur að á skjánum séu ekki aðeins "skjádýr" heldur andlit sem getur sýnt svipbrigði og horft í kringum sig. Notandinn snýr sér að andlitinu og það tekur strax eftir að verið er að horfa á það. Það lítur á móti og spyr "Var það eitthvað sérstakt?" Undanfarið ár hef ég stundað þróun á slíku kerfi sem getur talað við mann, svarað fyrirspurnum og framkvæmt skipanir sem gefnar eru á mæltu máli. Í þessu kerfi er andlitið á skjánum bókstaflega andlit tölvunnar útávið. Á sama hátt og svipbrigði, augnhreyfingar og látbragð fólks í daglegu tali gefa okkur upplýsingar um hvað það er að hugsa, gefur tölvuandlitið notandanum til kynna ástand tölvunnar: er hún upptekin eða er hún að "fylgjast með?" Hefur hún skilið það sem við sögðum eða þurfum við að útskýra eitthvað betur? Í framtíðinni gæti hver maður átt sinn eiginn tölvuerindreka sem vakir yfir honum dag og nótt (hann gæti til dæmis átt heima í armbandsúri). Slíkur erindreki gæti skráð heilsufar notandans, haft samskipti við hann á töluðu máli, svarað tölvupósti, skrifað bréf eftir upplestri, sótt upplýsingar um veðurfar hvar sem er í heiminum, gert sjúkdómsgreiningar, stjórnað lyfjagjöf og fleira. Hann gæti einnig þjónað hlutverki einkakennara. Einkaerindrekar gætu hugsanlega valdið mestu breytingu á daglegu lífi okkar síðan armbandsúr komu til sögunnar. Þeir munu að minnsta kosti gjörbreyta samskiptum okkar við vélar.

Fjarskipti og tenginálægð

Frá því að fyrst var byrjað að leggja símalínur hafa fjarskipti gegnum víra stöðugt aukist. Með tilkomu ljósleiðara stendur nú fyrir dyrum breyting sem mun ekki aðeins gera sjónvarpssíma að raunveruveruleika heldur gerbreyta dreifingu upplýsinga og skemmtiefnis, eins og þegar hefur verið ýjað að. Ljósleiðarar geta borið 6 milljónum sinnum meiri upplýsingar en símalínur þær sem liggja nú í flest heimahús. Þótt varla svari kostnaði að skipta út þeim leiðslum sem þegar hafa verið lagðar má ætla að ljósleiðarar til annarra heimsálfa auki möguleika Íslendinga á aðgangi í ýmsar upplýsingar og þjónustu sem gætu skipt sköpum fyrir samkeppnishæfni okkar á erlendum mörkuðum. Öll skilaboð sem fara um ljósleiðara eru stafræn. Mikið hefur verið rætt um sýndarveruleika í fjölmiðlum að undanförnu. Megin eiginleiki slíkra kerfa er að telja skynfærum okkar trú um að við séum annarstaðar en við erum. Þessi tækni, sem kalla má hermun eða líkingu, notast við tölvulíkön af því hvernig hljóð berst til eyrna okkar og myndir til augnanna til að geta hermt eftir ýmsum skynáreitum á sannfærandi hátt. Þannig getur maður komist inn í "heim" sem er teiknaður af tölvu og hefur í raun aldrei verið til. Svipuð hugmynd er sjón- og hljóðvörpun raunverulegra aðstæðna (í stað tilbúins heims tölvunnar) þannig að manni finnst maður vera á öðrum stað á hnettinum. Fyrir framan augu notandans er komið fyrir litlum skjám (einum fyrir hvort auga) sem tendir eru myndavélum staðsettar á allt öðrum stað. Hreyfingum þessara myndavéla er stjórnað af höfuðhreyfingum notandans. Hann getur því séð umhverfið þar sem myndavélarnar eru eins og hann væri þar sjálfur. Ef skilaboðin frá höfuðhreyfingum notandans eru send nægilega hratt til myndavélanna, þannig að þau fylgi hverri hreyfingu hans nákvæmlega eftir, fær hann á tilfinninguna að hann sé í raun þar sem myndavélarnar eru. Slík upplifun er kölluð "telepresence" á ensku. Við gætum kallað það "tenginálægð" eða "sýndarnærveru" á íslensku.

Athyglisverð útkoma fæst með því að blanda saman, í sömu andrá, sýndarveruleika og tenginærveru. Við gætum til dæmis hugsað okkur að skurðlæknir sem staddur er í Frakklandi gæti framkvæmt uppskurð á Íslandi með því að setja á sig "skjágleraugu" og fjarstýra hreyfingum vélarma á Íslandi sem geta haldið á réttu verkfærunum. Tölva sem tengd er ýmsum mælitækjum gæti teiknað upplýsingar um líkamsstarfsemi sjúklings inná myndina sem sést gegnum myndavélarnar. Þannig gæti læknirinn séð starfsemi hjartans "í gegnum" líkamann, blóðflæði gæti til dæmis verið sýnt með tölvuteiknuðum örvum, hann gæti "heyrt" blóðþrýsting (blóðþrýstingi breytt yfir í tóna með aðstoð tölvu), og "farið inn í" æðar með því að tengja skjágleraugun sjónvarpsmynd sem fengin er gegnum ljósleiðara sem þræddur er inn í æðarnar. Eitt af mikilvægustu sviðum sem nýta má þessa tækni á er menntun. Menntakerfið á eftir að taka stórt skref fram á við þegar kerfi sem þessi gera nemendum til dæmis kleift að fara á bak risaeðlum eða taka þátt í bæjarlífi á fimmtándu öld með hjálp sýndarveruleika og ferðast um á öðrum plánetum með hjálp tenginálægðar.

Rafverur

Virtir vísindamenn eins og til dæmis Marvin Minsky hjá Rannóknarstofnun Boðmiðla og Hans Moravec við Carnegie-Mellon háskólann telja að innan fimmtíu ára muni verða hægt að auka greind manna með beinni tengingu milli tölvu og heilans. Lífverur sem tengdar eru rafeindabúnaði sem hefur áhrif á eða mælir líkams- eða taugastarfsemi eru kallaðar "cyborgs" á ensku og mætti kalla "rafverur" á íslensku. Fram að þessu hafa rafverur eingöngu verið til í heimi bókmennta og kvikmynda. Rannsóknir benda hins vegar til að slíkur samruni manns og vélar sé alls ekki útilokaður, spurningin er aðeins hversu fljótt það muni vera hægt. Ímyndið ykkur að geta flett upp á hvaða blaðsíðu sem er í alfræðiorðabókum, horft á bíómyndir eða leitað uppi uppáhalds tónlist með hugsun einni. Þráðlaus tenging gæfi manni aðgang í öll tölvusöfn heims, allan sólarhringinn, óháð stað og stundu. Maður gæti, með hugsun einni, haft samskipti við hvern sem er, hvar sem er í heiminum.

Tilraunir til að tengja tölvur við skynfæri manna hafa þegar verið reyndar með góðum árangri. Eins og er snúast þær fyrst og fremst um að gefa skynskertu fólki sjón og heyrn. Heyrnarskertir og heyrnarlausir sem hafa heilbrigða heyrnartaug (skyntaugin sem liggur frá eyrum til heila) geta nú gengist undir aðgerð þar sem þræddur er örmjór þráður inn í kuðung eyrans. Þessi þráður er hlaðinn rafskautum sem geta ert taugaenda með rafboðum. Tölva á stærð við vasadiskó sér um að breyta hljóðbylgjum, sem numin eru með hljóðnemum, í rafboð sem líkjast þeim sem heilbrigð eyru búa til. Gæðin á slíkum "gervieyrum" eru ekki eins góð og eðlileg eyru-maður sem hefur verið algjörlega heyrnarlaus frá fæðingu getur þó átt von á að geta greint á milli fuglasöngs, bílvéla, hurðaskella og talaðs máls. Gervisjón er ekki eins langt á veg komin eins og gerviheyrn, enda eru mannsaugun mun flóknari skynfæri en eyrun. Engin tækni hefur enn verið þróuð til að tengja rafeindaljósnema við sjóntaugina, svo að til að gefa manni gervisjón er höfuðkúpan opnuð í hnakkanum þar sem sjónstöðvar heilans eru. Í heilann er stungið fjölda lítilla rafskauta, eða örskauta. Þessi örskaut eru tengd tölvu sem nemur umhverfið í gegnum myndavél. Myndin sem fellur á ljósnema myndavélarinnar er svo send í örskautin. Til þessa hafa aðeins verið notuð 38 örskaut í tilraunum, en rannsóknir benda til að um 600 punkta upplausn sé lágmark til að geta til dæmis gengið um í herbergi án þess að rekast á.

Á síðustu þremur áratugum hafa menn lært meira um heilastarfsemi en á öllum öðrum tímum mannkyns samanlagt. Búast má við stöðugt hraðari framförum á komandi árum. Það er samt sem áður stórt skref frá tölvutengingu til skynfæra og til annarar starfsemi heilans svo sem minnis, rökhugsunar eða þekkingar. Til að tengja rétt inná heilann þarf ekki aðeins nákvæmar upplýsingar um starfsemi þeirra svæða sem tengja á við, heldur líka um hvernig taugar tengjast innbyrðis. Í heilanum er að finna að minnsta kosti milljarð (1.000.000.000) taugafruma og innbyrðist tenginngar þeirra eru breytilegar milli einstaklinga. Að auki er lítið vitað um æðri heilastarfsemi svo sem rökhugsun, skilning og minni. Það vill líka oft gleymast í umræðum um heilatengingu að náttúran hefur valið saman skynfæri og útlimi í fullu samræmi við stjórnunarbúnaðinn, þ.e. heilann. Það er því hugsanlegt að lítið sé unnið með því að senda upplýsingar beint til heilans-skynfærin eru mun betur í stakk búin til að taka á móti skilaboðum heldur en heilasvæði sem voru aldrei til þess gerð. Það er hins vegar ekki útilokað að heilinn geti lært að túlka boð frá tölvum og nýtt sér reiknigetu þeirra ef tengingin er gerð nógu snemma á ævinni, meðan heilinn er enn í mótun. Værir þú, lesandi góður, tilbúinn til að setja nýfætt barnið þitt í uppskurð til að koma fyrir tölvutengingu til heila? Í þjóðfélagi þar sem útreikningar og upplýsingar ráða afkomu einstaklinga gæti það skipt sköpum hvort maður sé með tölvutengingu í höfuðkúpunni. Afkoma barnabarna okkar seint á næstu öld gæti ráðist af ákvörðun foreldra þeirra um að senda þau í réttan uppskurð.