„Fullt af fólki kemur mjög kurteisislega fram við þennan plastkubb“
Úti er hann þekktur sem Gummi Hafsteinsson eða Gummi Haff. Úti, það er í Sílikondal en Sílikondalur er víða þessa dagana. Þegar við heyrumst er Guðmundur á Íslandi. Þú hefur um árabil notað búnað frá honum, jafnvel upp á hvern dag. Að loknu MBA-námi við MIT leiddi Guðmundur þróunina á fyrstu útgáfu Google Maps fyrir farsíma. Staðan sem hann gegndi í því teymi, og ótal teymum síðar, heitir á ensku product manager. Það felst, með orðum Guðmundar, í að „leiða áfram vöruþróun á ákveðinni vöru, stýra teymi eða verkfræðingum, ákveða hvað á að gera, leiða áfram verkefnið í heild sinni, hvers konar vöru skal búa til og hvernig hún virkar“. Í stuttu máli: Google Maps, Guðmundur sá um það. Eitt og sér gerir það svolítið erfitt að tala um manninn eða við hann án þess að hljóma eins og tólf ára gamall strákur frammi fyrir Q úr James Bond-myndunum. Sem er þá fyrsta áskorun viðtalsins. Að hegða sér eins og fullorðinn.
Eftir að leiða þróun fyrstu útgáfu Google Maps á farsíma, leiddi Guðmundur þróun raddleitar hjá Google: tæknina sem gerir þér kleift að nota leitarvélina með tali og hljóðnema í stað lyklaborðs. Alls fékkst Guðmundur við þessi verkefni hjá Google í fimm ár áður en hann færði sig til nýstofnaðs sprotafyrirtækis vinar síns, hins norsk-bandaríska Dags Kittlaus „sem réði mig inn yfir vöruþróun á öllu Siri-dótinu“. „Allt Siri-dótið“ er það sem Apple síðan keypti og gerði að lykilþætti í viðmóti símanna sinna: tæknin sem gerir notendum kleift að gefa símanum raddskipanir. „Það sem er spennandi þar var að taka þetta áfram, ekki bara skilja orðin sem við segjum heldur merkinguna á bakvið þau,“ segir Guðmundur. „Þetta var næsta lógíska skref á bakvið hvernig maður vinnur með tækni og tölvur.“
Guðmundur fylgdi með í kaupum Apple á Siri, þar sem hann vann áfram að þróun búnaðarins í nokkur ár, fram að útgáfu iPhone 4S, þegar hann hætti störfum hjá Apple til að stofna sitt eigið fyrirtæki, Emu. Fyrirtækið vann að þróun hliðstæðs raddbúnaðar fyrir Android-síma til ársins 2014, þegar Google keypti það – og Guðmund með. Innan Google leiddi Guðmundur þróun hugbúnaðarins áfram, þar til hann var kynntur á nýjan leik undir heitinu Google Assistant. Assistant hefur orðið að hornsteini í viðmóti nýrri Android síma, en er ætlað enn veigameiri sess í framtíðinni. Búnaðurinn hefur raunar þegar lagst í útrás, út fyrir símtækin, í aðra hluti sem ætlunin er að þú munir geta talað við.
Samtalið framundan eða talandi blómapottar
„Þetta snýst ekki lengur bara um eitt tæki sem er hægt að tala við,“ segir Guðmundur, „ekki bara um símann, heldur að þú getir talað við hvaða tæki sem er. Þá þarftu að vera með viðmót sem er sveigjanlegt og allir geta notað án þess að þurfa að læra á. Og það eina sem virkar þannig er samtal. Samtal hefur óendanlegan sveigjanleika án þess að þú þurfir notkunarleiðbeiningar til að taka þátt í því.“
Samtal er þannig, að sögn Guðmundar, svarið við spurningunni um hvers konar viðmót henti sameiginlega fyrir „fullt af mismunandi tækjum“. Og hlutverk hans sjálfs? „Nú er ég yfir vöruþróun á því verkefni“. Inntur eftir nánari starfslýsingu segir Guðmundur að hlutverk hans felist ekki fyrst og fremst í að forrita heldur sé hann „meira í því að setja stefnuna fyrir hvert skuli fara, hvaða fítusa við ætlum að þróa. Eins þetta með teymi, hvernig við vinnum með öðrum teymum hjá Google. Það eru margir hópar sem koma að þessu, í símanum vinnum við mikið með Android hópnum. Google Home er tæki sem er búið til af öðru teymi og þar á milli er mikið samstarf. Hvernig passar þetta saman, að þetta virki.“
Ferðalag Google Assistant út úr símunum liggur gegnum Google Home, fyrirbæri sem eins og margar aðrar tækninýjungar á sér enn ekki fyllilega samsvarandi orðaforða. Kannski má kalla þetta kjaftaska þar til betra orð kemur fram: nettengd, kyrrstæð tæki sem minna ýmist á blómapotta eða steinvölur, til þess gerð að tala við þau. Amazon reið á vaðið með Alexa, síðan kom Google Home og bráðum er von á HomePod frá Apple. Það stefnir í, segja þeir, að þau verði útumallt. Og tvö síðastnefndu tækin byggja að verulegu leyti á þróunarstarfi Guðmundar.
Síðast vakti Assistant athygli fjölmiðla fyrr í haust, þegar Google kynnti nýjan síma, Pixel 2. Stærstu tíðindin við símana voru að sögn kunnugra nokkrar nýjungar í þeirri útfærslu Google Assistant sem fylgja símunum, þá ekki síst ný þýðingartækni, sem er ætlað að þýða samtöl notandans jafnóðum af einu tungumáli á annað. Frá upphafi styður kerfið 40 tungumál – og íslenska er nú þegar þar á meðal. Þeir sem til þekkja segja að það sé augljóslega Guðmundi að þakka.

Hugbúnaður sem Guðmundur Hafsteinsson hefur stýrt þróun á: Google Maps fyrir síma, Google Voice, Apple Siri og, síðast, Google Assistant.
Háskólarnir, atvinnulífið og pródúktið
Nokkurt starf hefur verið unnið í þróun íslenskrar máltækni á síðustu árum, ekki síst við háskóla landsins. Ég byrja því á að spyrja Guðmund hversu stór hluti tækninnar að baki þýðingahæfni Assistant sé upprunninn í þróunarstarfi innan Google og hversu stór hluti hennar komi úr rannsóknarverkefnum háskóla og annars staðar að.
„Þetta pródúkt út af fyrir sig,“ segir Guðmundur, „það er, eins og allt annað, samtvinning á fullt af mismunandi hlutum. Öll nútímatækni er búin til úr mörgum kompónentum, pörtum sem maður setur saman í eitt pródúkt. Það er erfitt að tala um einn grunn eða upphaf. Þetta er það sem mér finnst mjög áhugavert við hvernig Google er byggt á þróun og grunnrannsóknum. Mikið af því sem er að gerast í dag er vegna þess að bæði Google, önnur fyrirtæki og háskólarnir hafa stundað grunnrannsóknir og unnið náið saman. Óháð tungumálinu væri mjög gott að sjá meira svoleiðis á Íslandi, í menntakerfinu hérna, samstarf háskóladeilda við atvinnulífið. Ríkið á að borga fyrir að setja peningana í grunnrannsóknir, hjálpa til við það og einkageirinn á að sjá um að starfrækja fyrirtæki. Það væri mjög gott fyrir Ísland að læra hvernig svona gerist úti í Bandaríkjunum, upp á langtímahugsun að gera,“ segir Guðmundur.
Mig fer að renna í grun um að önnur áskorun felist í viðtalinu: ég er ekki viss um að þetta hafi verið svar við spurningunni, heldur frekar í ætt við lipra hreyfingu upplýsingafulltrúa, rétt fram hjá því sem var spurt um. „Þegar er verið að þýða þarf í fyrsta lagi að skilja hvað er verið að segja, með talgreini,“ heldur Guðmundur áfram. „Það hefur verið þróað núna í tíu, fimmtán ár. Þá tækni þarf að láta virka fyrir mörg tungumál, sem er einn partur af þessu. Svo að taka það sem er sagt og þýða milli tungumála, machine translation, sem hefur verið í þróun í ansi langan tíma – ótrúlega byltingarkennd tækni,“ segir Guðmundur og víkur talinu að nýjum undirstöðum þýðingavélarinnar sjálfrar, sem vöktu heimsathygli í nóvember á síðasta ári: „Núna, bara á síðasta ári, kom ný leið til að gera svona þýðingar. Þær eru það góðar að þær eru til jafns við það sem manneskja þýðir. Alveg eins gott og hver önnur þýðing sem maður finnur annars staðar.“ Bókmenntaþýðendur tækju varla undir það, nótera ég í huga mér – en gleymi svo að minnast á það, samtalið fer sínar eigin leiðir. „Bylting að það sé hægt, í rauninni,“ segir Guðmundur um þetta nýja getustig. „Svo þegar þú ert kominn með annað tungumál þarf talgervil til að segja það aftur, taka textann og láta hljóma eins og verið sé að segja hann. Þetta eru tækniþættirnir sem koma saman þar til þú ert með hedfóna í eyrunum, talar og það kemur út sem annað tungumál.“
Þegar fréttir bárust af nýjum undirstöðum þýðingavélarinnar fyrir ári síðan var því slegið upp í fyrirsögnum að Google Translate hefði nú samið sitt eigið tungumál. Guðmundur segir að það sé í öllu falli ekki alrangt.
„Þetta er ekki alveg mitt sérsvið en hingað til, þegar við höfum verið að þýða, segjum úr þýsku á íslensku, þá var áður þýtt gegnum ensku. Úr þýsku í ensku og þaðan á íslensku, vegna þess að það er alltaf hægt að þýða í og úr ensku. En þá bjagast textinn, þú missir upplýsingar á leiðinni: fyrst glatarðu upplýsingum þegar þú þýðir á ensku, og aftur í næsta skrefi þegar þú þýðir af ensku á næsta mál, svo heildarþýðingin er ekki eins góð og hún gæti verið. Nýja aðferðin felur í sér að í staðinn fyrir að þýða svona gegnum þriðja mál geturðu tengt saman hvaða tungumál sem er, vélin þýðir beint úr þýsku á íslensku án þess að fara gegnum þriðja mál. Sem þýðir að þýðingin verður betri, vegna þess að það tapast minni upplýsingar á milli.“
Íslenska eins og ekkert sé
Hugmyndin á bakvið síðustu útfærsluna er þessi: að þú getir talað á íslensku, síminn þýði mál þitt jafnóðum á, segjum japönsku, og þegar þér er svarað á japönsku þýði búnaðurinn það jafnóðum til baka á íslensku. Þannig geti fólk átt greið samskipti óháð tungumáli. Þegar spurðist að íslenska væri á meðal þeirra 40 tungumála sem þessi nýi búnaður gæti þýtt á og af, strax í upphafi, heyrðist fagnað hér og þar, enda hefur á síðustu misserum gætt svolítillar örvæntingar um framtíð þessa fámenna málsamfélags frammi fyrir tækjum og miðlum sem hneigjast til annarra tungumála (sjá m.a. endurteknar ályktanir Íslenskrar málnefndar um efnið). Einhverjir lýstu því yfir að Guðmundur ætti skilið fálkaorðu fyrir framtakið – hann hefði einhendis bjargað íslenskunni yfir þröskuldinn til nýrrar aldar.
Hvernig kom það til að þessi örtunga er á meðal fyrstu fjörutíu tungumálanna sem búnaðurinn styður?
„Það er ákveðin hugmyndafræði með það,“ byrjar Guðmundur. „Smæðin gerir þetta allt miklu erfiðara. Óháð íslenskunni er ágætt að horfa á það að út frá fjölda fólks sem talar tungumál þá þarftu ekki mörg tungumál til að dekka stóran hluta heimsins. En þegar er verið að þróa svona vöru, og við viljum að hún sé aðgengileg fyrir sem flesta, þá viltu hafa stuðning við fleiri og fleiri tungumál. Ef þú horfir á þýðingatækni þá er hugmyndin þarna sú að geta þýtt á milli tungumála, sem flestra. Við viljum auðvitað hafa aðgengi fyrir sem flesta.“
Aftur sækir að mér þessi grunur – þetta hljómaði eins og svar, en ef ég vil festa fingur á því efnislega, hvernig þetta kom til, hvort hann réði því að íslenska væri með í pakkanum, gríp ég í tómt. Það gæti verið ég, auðvitað, kannski var ég ekki skýr. Hversu mikill effort er það, spyr ég næst, að bæta við tungumáli í kerfið? Þarf 20 manna teymi í tvö ár eða er ég að mikla þetta fyrir mér, býr miklu minni vinna og fjárfesting en svo að baki?
„Það sem skiptir máli er: hvað ertu að horfa á?“ segir Guðmundur, „Hversu langt ertu að fara? Það er hægt að gera þetta í mismiklum mæli. Og það er spurning um forgangsröðun. En svo er hitt að það er mikið af sama fólki sem er að fást við þetta fyrir öll tungumálin í einu, þannig að það er ekki auðvelt að mæla vinnuframlagið við hvert og eitt þeirra. Ef þetta væri spurning um spænsku fram yfir íslensku væri erfitt að réttlæta það að gefa íslensku forgang yfir stóru málin. En svo er hægt að vinna að svona verkefni í samstarfi við háskólana og jafnvel yfirvöld hérna, og þá er spurningin hvernig er hægt að gera það til að þetta sé auðveldara, auka líkurnar á að þetta eigi sér stað. Og það hratt og vel. Það er umræða sem er áhugavert að skoða. Google Assistant er rétt að byrja og erfitt að horfa of langt fram í tímann ennþá.“
Auðmýkt plastkubba
Hingað til virðist noktun þessara viðmóta, hvort sem er Siri eða Assistant, einkum felast í tvenns konar málnotkun – að leita upplýsinga og gefa fyrirmæli, skipanir. Hvort tveggja er aðeins hluti af málnotkun fólks sín á milli, jafnvel jaðarfyrirbæri. Hugmyndin er sú að tölvurnar öðlist getu til að skilja það sem nefnt er náttúrulegt tungumál, til aðgreiningar frá forritunarmálum. En á „náttúrulegri“ íslensku virðist mörgum tamara að segja „Heyrðu, hérna, gætirðu nokkuð sagt mér hvað klukkan er?“ – en að spyrja fyrirvaralaust: „Hvað er klukkan?“. Bein fyrirmæli geta virkað sem ókurteisi. Hversu náttúrulegur verður málskilningur þessara tækja? Munu þau skilja tafs og hik, vandræðagang og kurteisi?
„Einmitt,“ segir Guðmundur, „það er mikið um að fólk segi hækkaðu eða gerðu þetta eða gerðu hitt, við búnaðinn. En það er ennþá áhugaverðara að það er fullt af fólki sem segir mjög kurteisislega: „could you please put up the volume?“ Og þakkar svo fyrir. Það virðist mannlegt eðli að finnast maður þurfa að koma rétt fram, jafnvel þó að maður sé að tala við vél. Bara í mannlegu eðli, þegar við erum að tala og með svona umræður, flestir reyna að halda sig réttu megin við strikið. Og já, skilningurinn er sá sami, þetta eru sveigjanleg kerfi og þetta skilst alveg. En það er líka áhugavert að velta fyrir sér hvort það að við tölum við tæki hafi áhrif á hvernig við tölum saman almennt. Það er gaman að fylgjast með þróuninni á þessu. Öll flóran í mannlegum samskiptum er þarna. En gott að sjá að það er fullt af fólki sem kemur mjög kurteisislega fram við þennan plastkubb sem það er með heima hjá sér.“
Í glærusýningu sem fylgdi kynningu á nýjustu útgáfu búnaðarins voru tekin dæmi um setningar sem fela í sér eins konar leiki í tungumálinu, frekar en fyrirmæli eða leit að svari við spurningu – „What does the fox say?“ var ein setning, tilvitnun í lag – hversu mikið er lagt upp úr því að tækið verði fært um ólíka málleiki?
„Við erum með teymi í því sem kallast persónuleiki, sem kemur mikið inn á þetta. Við mótum persónuleikann á Assistant á ákveðinn hátt. Persónuleiki er mjög vítt fyrirbæri, auðvitað, hvernig svararðu og allt þetta. Hugmyndin er að þetta sé auðmjúkur þjónn sem er að hjálpa þér, kurteis og til staðar fyrir þig. Persónuleikinn á að sýna það. En svo kemur eitthvað þegar þú spyrð hvað sé uppáhalds ísinn þinn – eitthvert svar sem á þá að passa við persónuleikann. Þetta teymi samanstendur af þróunarfólki en líka fólki sem hefur unnið við bíómyndir og víðar í skemmtanageiranum og er að pæla í hvernig er hægt að búa til persónuleika þannig að sé áhugavert að eiga samskipti við hann, hann sé ekki bara þurr vél. Og þar kemur líka að tungumáli. Þegar við fórum úr amerískri ensku yfir í breska ensku, þá þarftu að pæla – meira að segja lókal húmorinn er annar – hvers konar spurningar koma, hvaða orð eru notuð, við þurftum að pæla í því. Þetta er annar kúltúr. Við getum ekki verið amerísk vara alls staðar, það gengur ekki. Assistant getur ekki verið amerísk persóna alls staðar, það myndi ekki ganga. Okkur tókst mjög vel til með bresku enskuna. Mörg review fóru í að spyrja um eitthvað týpískt breskt, og vélin stóðst mjög vel prófið. En það er heilmikil pæling þarna. Ekki bara að geta gert hluti eða svarað spurningu, heldur breiðara, búa til persónuleika sem fólk getur átt samskipti við.“
Þegar hermt er eftir persónum með tækni, hvort sem er í þrívíddargrafík eða róbótum, hefur orðið vart við að fólk öðlast aukna samkennd með gervipersónunni eftir því sem hún verður raunverulegri – upp að vissu marki. Þegar gervipersónan verður næstum „eins og alvöru manneskja“ en þó ekki alveg, birtist gervileikinn í litlum frávikum svo fyrirbærið sveiflast milli þess að virðast mennskt og virðast það alls ekki. Þá finnur fólk, segir sagan, fyrir óhugnaði. Þessi óhugnaður, þegar vélin fer of nálægt hinu mennska, hefur verið nefndur „the uncanny valley“, eða óhugnaðardalurinn. Ég spyr Guðmund hvort þetta fyrirbæri sé líka vandamál eða viðfangsefni í þróunarstarfi hans.
„Það er rétt, sérstaklega þegar kemur að vélmennum, þá hittirðu oft á þennan uncanny valley. En við erum ekki að reyna að búa til manneskju. Við erum passasöm í því. Við erum að tala um Google Assistant sem er ætlað að hjálpa þér. Ekki að þykjast vera manneskja eða standast Turin-prófið. Pointið er að þetta sé gagnlegt pródúkt sem á að vera gagn að, það er það sem skiptir máli. Takmarkið er viðmót. Auðvelt og eðlilegt. Þetta er spurning um hvaða takmark þú setur þér. Við erum með skýr og ákveðin markmið um eitthvað sem á að vera gagnlegt hvar og hvenær sem er.“

Grunnur þess sem átti að verða Hús íslenskra fræða er í millitíðinni, vegna áralangra tafa við framkvæmdina, þekkt sem gröf, hola eða pyttur íslenskra fræða – eða þá hin nýja sundlaug Vesturbæjar. Ljósmynd: Hugvísindastofnun.
Samtöl við vélar eru leystur vandi; samtöl um vélar: í vinnslu …
Hvað er sennilegt að tækið muni læra íslensku í hárri upplausn, svo að segja? Hversu vel mun það þekkja íslenska menningu, blæbrigði tungumálsins og referensa?
„Þetta er frábær spurning, einmitt, hversu fínt ofan í það fer það. Það verður bara að koma í ljós, held ég. Margt af því er kannski ekki endilega tengt við kúltúr. Margt af því er bara að gera samtalið aðeins eðlilegra. Það er stærsti parturinn af þessu – að segja góðan daginn og fá góðan daginn til baka, hvernig hefurðu það, eitthvað svoleiðis. Það er tiltölulega almennt, óháð tungumáli eða kúltúr eða öðru lókal samhengi. Það skiptir rosa miklu máli. Hitt fyllir meira í eyðurnar, verður áhugavert fyrir viðkomandi kúltúr eða tungumál. Ég veit ekki nákvæmlega hveresu langt verður farið með það.“
Finnurðu fyrir samstarfsáhuga frá íslenskum yfirvöldum og háskólum í þessu þróunarstarfi?
„Jú, ég heyri það í umræðunni, að það er sterkur vilji, mikið rætt hvaða áhrif tæknin mun hafa á stöðu tungumálsins yfirhöfuð, og verkefni í gangi til að skoða hvað er hægt að gera og hvernig er hægt að takast á við þetta. Það er ekki farið það langt, hvað mig varðar, að skoða ákveðið samstarf milli Google og háskólanna eða yfirvalda. Þar kemur smæðin inn en líka bara að í rauninni þurfum við að tvinna saman hagsmuni okkar og hagsmuni – okkar.“ Ég heyri ekki betur en hér vísi Guðmundur annars vegar til Google sem „okkar“ og hins vegar til Íslands. „Auðvitað bara frá hagsmunum okkar er erfitt að finna samstarfsgrundvöll en út frá hagsmunum beggja er það hægt. Bara skoða þetta – eflaust er hægt að finna góða lendingu á að vinna saman og gera eitthvað gott úr þessu. Ég hef rætt þetta mikið við rektorana í háskólunum og hvernig er best að snúa sér í þessu. En því hefur ekki verið beint til Google.“
Hvað myndi maður annars kalla sviðið á íslensku, spyr ég, máltækni, tungutækni? – sem leiðir huga minn að almennari spurningu: um leið og við fáumst við þann vanda að tala við vélarnar, er þá ekki líka óleystur sá vandi að tala um vélarnar? Skortir ekki íslensku helling af orðaforða á sviðinu?
„Jú en það gildir á ensku líka, við eigum enn ekki orð yfir þetta. Virtual assistant, það er þessi tiltekni hugbúnaður, natural language processing er hugtak yfir ákveðnar lausnir, en þetta eru tiltölulega þröng hugtök þegar kemur að heildarmyndinni. Ég veit ekki hvað ætti að kalla sviðið í heild sinni.“
Hin hliðin, tilraun 1: kerfið þitt heyrir andardráttinn minn
Ég hóf samtalið á spurningum um tækniatriði. Síðan vék ég að því sem tengist fallvaltri stöðu íslenskrar tungu og þeim þætti sem Guðmundur á nú þegar í að bæta úr henni. En allt í kringum Google, þennan risa, sveima auðvitað fleiri spurningar sem virðist óhjákvæmilegt að nefna. Fyrirtækið og lausnir þess hafa bein áhrif á líf okkar allra – áhrif sem enn eru að mörgu leyti ófyrirsjáanleg. Gagnaöflun fyrirtækisins á sér engan líka í sögunni. Viðskiptamódel sem gerir ráð fyrir hagnaði af allri gagnaöflun hlýtur að vekja spurningar um ásetninginn að baki, og hugsanlegar hliðarverkanir þess, að dreifa árvökulum, síhlustandi sýndarþjónum um allar vistarverur fólks.
Við fyrirtækið loða svipmyndir úr vísindaskáldskap: ofurtölvan HAL úr 2001 eða upplýsinganetið Skynet, sem öðlast mannskæða sjálfsvitund, í Terminator-myndunum. Meðal yfirmanna þróunarstarfs hjá Google er fútúristinn og transhúmanistinn Ray Kurzweil, sem enn segist sannfærður um að kringum árið 2045 taki tölvur og tauganet framúr mannlegri vitsmunagetu: þar eftir verði engin leið fyrir okkur kolefniskvikindin að spá fyrir um hvaða stefnu jarðvistin tekur. Ég nefni Kurzweil á nafn, impra kurteisislega á öllu hinu, nokkuð viss um að Guðmundur þekki bæði skáldskapinn og raunveruleikann að baki honum töluvert betur en ég sjálfur, og spyr hann almennt um framtíðarsýn og heildarsamhengi hans eigin starfs.
„Ef þú horfir á þróun tölvutækni gegnum tíðina – við erum framanaf með gífurlega öflugar tölvur með takkaborð og mús – og hvernig þú notar þetta: þú sest niður og virkilega beinir athyglinni að tölvunni, notar hana sem vinnutól, til dæmis þegar til að skrifa ritgerð. Síðan er áhugaverð þróun þaðan yfir í farsímana. Ég var mjög involveraður í því, þegar það var að gerast. Þá var lítill skilningur á hvað væri þar í raun á ferð. Þessir farsímar voru frekar lélegir, skjárinn var lítill, takkaborðið þreytandi, lélegt net. Menn sáu þetta ekki beinlínis sem tækifæri heldur meira sem hækju við tölvuna. En svo kom í ljós að síminn var búinn öðrum eiginleikum. Hann var með staðsetningarbúnað, þú hafðir hann alltaf á þér, á ferðinni, í verslunum, og það komu fram nýjar tegundir af því hvernig þú notar tæknina: sósíal, götukort, nýjar kategoríur af þjónustu sem við sáum ekki fyrir okkur á sínum tíma að væru mögulegar. Í staðinn fyrir að sitja hálftíma í senn við tölvuna ertu með þitt eigið tæki sem þú hefur alltaf með þér, og kemst í upplýsingar hvenær sem er. Og viðmótið varð aðeins náttúrulegra. Ef þú tekur þetta svo áfram, ef fleiri tæki tengjast, mismunandi tæki, öll tengd saman á heimilinu þínu, hvers konar viðmót geturðu búið til sem virkar á öll þessi tæki? Eitthvað sem væri náttúrulegt og eðlilegt fyrir okkur sem manneskjur að nota. Og ef þú horfir á þróunina enn lengra – tengir ljós, þermóstat, skrefateljara, setur það allt saman – þá er það viðmót sem er eðlilegast fyrir okkur, það er samtal. Þegar þú getur stýrt þessu öllu með samtali, þá geturðu losað þá byrði af fólki að skilja hvernig tæknin virkar, því hún er búin að aðlagast fólkinu. Annað sem ég er líka spenntur fyrir við þessa þróun –“
Nú sækir á mig sami grunur og í upphafi samtalsins. Eftir nokkur bitastæð og bein svör við spurningum virðist það sem Guðmundur er að segja við mig ekki hafa beinan snertiflöt við það sem ég spurði hann að. Mér heyrist hann raunar frekar vera að fara með söluræðu. „Ólíkt annarri þróun hingað til,“ heldur hann áfram, „þá eru þessi tæki á hliðarlínunni, með þér, en þau eru ekki að taka alla athyglina. Gott dæmi um það er að ég var heima með dóttur minni að elda á dögunum, og þá gátum við samt verið að spila tónlist, gramsa í uppskriftum og fleira – en það tekur ekki athygli okkar hvort frá öðru. Við erum saman að elda og gera hluti, og ef þú vilt fá upplýsingar um hversu lengi þú ert að sjóða egg, þá geturðu líka gert það. Án þess að hverfa úr aðstæðunum á meðan. Þannig er þetta meira sósíal. Það er ekki eins og ég hafi verið að nota systemið og þar af leiðandi ekki getað veitt dóttur minni athygli á meðan. Þetta er áhugaverð þróun sem leyfir okkur að vera meira saman, sem manneskjum, um leið og við nýtum okkur tæknina.“
Hin hliðin, tilraun 2: munu vélarnar éta okkur lifandi?
Ég er ekki viss um að ég hafi lent í akkúrat þessu áður. Það tók mig svolitla stund eftir að samtalinu lauk að gera mér grein fyrir hvað hefði gerst. Þessi sena með dótturinni í eldhúsinu, hugljúfa fjölskyldustundin – þetta var ekki bara auglýsingatexti eða glærukynning frá fyrirtækinu sem Guðmundur starfar hjá, fyrir vöruna sem hann þróaði. Hann gerði þetta svo lipurlega. Stirðari fulltrúar á rótgrónari sviðum viðskiptalífsins hefðu, sé ég fyrir mér, einfaldlega sagst ekki svara svona spurningu, lokað á hana. Sem er ígildi þess að fá upp 404-síðu í vafra: þessi síða er ekki til, farðu annað. Guðmundur býr að annarri færni, einhvers konar redirect-búnaði: í stað þess að segja berum orðum að síðan sem þú baðst um sé ekki til færir hann þig mjúklega aftur á forsíðuna, birtir þér bara eitthvert annað efni: vel valið, myndskreytt, hugljúft og þannig séð í lauslegu, efnislegu samhengi við það þú baðst um.
Ég prófa að ítreka spurninguna: spurningin um hvort þessi tækniþróun er almennt meinlaus eða stórhættuleg birtist kannski með sýnilegustum hætti, nýverið, í debatt milli Marks Zuckerberg, sem segir að ekkert geti farið úrskeiðis, og Elons Musk sem segir að vélmennin muni éta okkur öll lifandi ef við sláum ekki rétta varnagla strax. Eru einhverjar hættur framundan? Hverjar þá helstar?
„Umræðan á sér stað á mismunandi stigum,“ segir Guðmundur, „en ég blanda mér ekki í Musk-Zuckerberg debatinn. Að sjálfsögðu erum við alltaf að pæla í gagnaöflun og allt þetta. En það sem skiptir mestu máli er bara að notandinn hefur fullkomna stjórn, ræður algjörlega yfir þessu öllu saman. Þau gögn, þegar þú segir eitthvað, það er tengt í ákveðið viðmót. Þú getur séð hvað er farið inn og hvað ekki, strokað út ef þú vilt, þá er það varanlega strokað út. Gegnsæi er alltaf besta lausnin. Og þetta kemur allt niður á það að sjálf erum við miklir notendur. Ég nota þetta mikið sjálfur –“.
Ég er búinn að missa athyglina. Ég veit hvað hann er að fara, fólkið á bakvið hugbúnaðinn notar hann sjálft og hlýtur því að vilja að hann sé skaðlaus notendum. Mér verður hugsað til Baracks Obama, þegar komst upp um gagnasöfnun njósnastofnana í Bandaríkjunum á netinu. Hann sagði eitthvað á sömu leið: áður en líður á löngu verður fylgst með mér, sem fyrrverandi forseta, meira en nokkrum öðrum, auðvitað er mér mikið í mun að tryggja að farið verði vel með þau gögn. Treystið mér.
Hin hliðin, tilraun 3: að velja rödd auðmjúkra þjóna
Ég geri eina tilraun enn, til að bera fram gagnrýna spurningu. Þegar búnaður með svona marga virkni verður hluti af tilveru okkar allra vakna ótal spurningar um hugmyndafræðilegar og pólitískar hliðar. Í tilfelli Siri og Google Assistant vekur það forvitni að fyrstu raddir beggja eru kvenkyns-raddir – karlröddinni er bætt við síðar, sem valmöguleika. Hér stendur þróunarteymið, virðist vera, frammi fyrir vali þar sem enginn valkostur er hlutlaus: hvort sem er karl- eða kvenrödd væri tiltekið val. Þegar kemur að búnaði sem á að koma fram sem auðmjúkur þjónn myndi hvort valið sem er kannski vekja spurningar …
„Að sjálfsögðu getur þetta mótað hluti innan samfélagsins sem þarf að taka tillit til. En ég vil ekki horfa á þetta sem karl- versus kven-, hvort sem þú horfir á raddir eða eitthvað annað. Þetta er frekar – við erum með tvær raddir núna, en nýbúin að þróa tækni sem við köllum Wavenet, sem gerir okkur kleift að þróa raddir hraðar, það er algjör bylting í að búa til raddir og hversu góðar þær eru, hversu náttúrulegar. Hugmyndin væri helst sú að þú getir haft margar raddir. Þá er þetta meira eins og að velja lit á bíla: viltu hafa hann hvítan eða rauðan eða svartan eða gulan? Hvaða rödd finnst þér hljóma best? Að geta sniðið þetta þannig að það henti þér best sem notanda. Því þetta á einmitt ekki að fara út í steríótýpur, það viljum við ekki, það getur haft alls konar hliðarverkanir. Enda köllum við raddirnar tvær sem er hægt að velja um núna ekki kvenrödd og karlrödd heldur rödd 1 og rödd 2. Hugmyndin er sú að Google Assistant er ekki með kyn.“

Kyrrmynd úr þáttunum Black Mirror, vísindaskáldskap sem fæst meðal annars við mögulegar afleiðingar umfangsmikillar gagnaöflunar um líf og hagi fólks.
Ef þetta eru veggir eru þeir bólstraðir
Var þetta svar? Ég er ekki viss. Jú, líklega. Hvað var ég aftur að spyrja um? Þrjár tilraunir til gagnrýninna spurninga, lengra nær það ekki. Guðmundur nefndi, þegar ég náði upphaflega sambandi við hann, að hann þyrfti grænt ljós til að fara í viðtal, en það yrði áreiðanlega ekkert mál. Grænt ljós, það er samþykki frá fyrirtækinu. Auðvitað. Annað hvert meðalstórt embætti og fyrirtæki á Íslandi virðist í dag binda starfsfólk sitt einhvers konar þagnarskyldu, þannig að stjórnandi eða fjölmiðlafulltrúi hafi úrslitavald yfir því hvernig fyrirtækið mætir ákveðnum viðfangsefnum – það væri fráleitt að ætla annað en eldveggir standi utan um ákveðin viðfangsefni þegar kemur að hátt settum starfsmönnum stærstu fyrirtækja í Sílikondal. Og kannski þarf það ekki einu sinni til, kannski veit hver sem nær þetta langt í þeim geira, af eigin reynslu eða annarra, að sumt borgar sig að tala um og annað ekki. Fólk í stöðu – hvort sem það er opinbert embætti eða stjórnunarstaða hjá fyrirtæki – talar um suma hluti upp á eigin spýtur en aðra samkvæmt prótókóli.
Og kannski hefur það ekkert með málið að gera. Kannski var tæp klukkustund bara ekki nægur tími til að yfirstíga það að engar tvær manneskjur tala alveg sama tungumál. Kannski eru leikirnir sem ég kann að leika með íslenskum orðum aðrir en leikirnir sem Guðmundur kann: kannski var annar okkar að spila veiðimann en hinn Olsen Olsen. Á köflum. Mér fannst forvitnilegt að reka mig á eitthvað vélrænt í máli manns sem vinnur við að koma einhverju mennsku að í máli vélar – en kannski var það skynvilla. Kannski langaði mig nógu mikið að rekast á einmitt þess háttar veggi til að þeir spruttu upp í kringum mig. Ekki bara bólstraðir heldur blátt áfram skýjaðir, dúnmjúkir – er veggur rétt orð yfir passasöm ský?
Ég er ekki viss. Og aðdróttanir um óljós mörk veggja og skýja væru ósvífin lokaorð. Guðmundur var gjafmildur á tíma sinn og allt það sem honum er frjálst eða hann kærir sig um að ræða um við okkur. Við lifum forvitnilega tíma. Guðmundur Hafsteinsson á þegar nokkra hlutdeild í þeim og, ef fram heldur sem horfir, enn vænni skerf í framtíðinni.