Яся – выдра-дэтэктыў: хто і навошта яе прыдумаў? Гутарка з аўтарамі
Беларускі раследавальніцкі цэнтр (БРЦ) запусціў чат-бота Ясю на базе штучнага інтэлекту. Як нарадзілася выдра-дэтэктыў Яся і чаму гэты праект лічаць унікальным для беларускіх медыяў? БАЖ пагутарыў з рэдактаркай сайта БРЦ Лолай Бурыевай і экспертам па штучным інтэлекце, аўтарам адмысловага тэлеграм-канала Easy AI Дзмітрыем Смірновым.
На сайце БРЦ выдра-дэтэктыў Яся знаходзіцца ў правым ніжнім куце, з ёй можна пагаварыць як наўпрост, так і праз гатовае меню. Таксама яе можна папрасіць агучыць тэкст і выдаць кароткі пераказ матэрыяла. Яся тое зробіць на беларускай, англійскай ці рускай мовах. Аўтары праекта спадзяюцца, што гэты маскот палегчыць камунікацыю расследавальнікаў з чытачамі.
«Нашыя праграмісты прапісвалі мільён удакладняючых промптаў, каб звесці да мінімуму памылкі і галюцынацыі»
— З чаго пачалася гісторыя Ясі?
Спачатку ў мяне з’явілася ідэя стварыць інтэрактыўны маскот на базе штучнага інтэлекту (ШІ). Я адштурхоўвалася ад сваёй зацікаўленасці развіццём ШІ, перадусім на аснове LLM (large language model).
Пазней, калі задумка ўжо развівалася, мы брэйнштормілі ўсёй камандай над вобразам: як павінен выглядаць талісман БРЦ, які персанаж больш адпавядае нашым каштоўнасцям. Наш кіраўнік Стась Івашкевіч узгадаў пра выдру. Такім чынам нарадзілася наша Яся. Між іншым, яе імя мы таксама шукалі ўсёй рэдакцыяй.
А ўжо выяву гэтага хактарнага персанажа распрацавала дызайнерка.
— Колькі часу прайшло ад узнікнення ідэі да яе практычнай рэалізацыі?
— З выдрай я жыву апошнія паўгода — столькі часу заняла распрацоўка і тэсты праекта. Я падазраю, што праца над гэтым персанажам працягнецца яшчэ тыдні ці месяцы.
Але мушу дадаць, што з гэтага паўгоддзя выпаў месяц працы, бо наш сайт моцна атакавалі, таму нам давялося аднаўляць доступ да сайта і спыніць на гэты час распрацоўку.
— Наколькі складанай аказалася рэалізацыя ідэі?
— Рэалізацыя ішла ў двух кірунках: асобна працавалі дызайнеркі над стварэннем персанажа і яго анімацыяй, і асобна працавала каманда праграмістаў і эксперта па ШІ Дзмітрыя Смірнова. Не было лёгка ні ў адным з напрамкаў, бо мы не шукалі людзей звонку: мы хацелі, каб менавіта нашая каманда распрацавала маскота.
Мы зрабілі ўсе магчымыя памылкі, якія можна было зрабіць пры распрацоўцы, звязанай з ШІ. Нам падавалася, што гэта досыць проста.
ChatGPT выдае простыя інструкцыі, як гэта ўсё зрабіць, але калі пачынаеш сам гэта рабіць, то вылазіць шмат праблемаў, памылак, з галюцынацыямі ШІ, які выдумляе нейкія адказы, адказвае не хутка.
— ШІ выдаваў многа галюцынацый падчас рэалізацыі праекту?
— Мы тэставалі некалькі варыянтаў, якія прадстаўленыя сёння на рынку: пачыналі з ChatGPT, а ў выніку спыніліся на Claude. Мы выбралі мадэль Anthropic Cloude, таму што яна лепш працуе з беларускай мовай, чым ChatGPT.
Фінальная версія, якая цяпер стаіць на сайце, амаль не выдае памылак. Нашыя праграмісты прапісвалі мільён удакладняючых промптаў, каб звесці да мінімуму яе памылкі і галюцынацыі.
— Наколькі даступны гэты інструмент для незалежных беларускіх медыяў?
— Я думаю, што інструмент даступны, але давядзецца выдаткаваць шмат часу, каб ва ўсім разабрацца.
Калі мы гаворым пра тры складнікі працэсу: час, фінансы і якасць, — то калі ты хочаш хуткага выніку, то мусіш выдаткаваць шмат фінансаў. Калі лішніх фінансаў няма, то будзеш рабіць доўга, пакуль сам не разбярэшся ва ўсіх нюансах.
Уласна таму мы і стваралі нашу Ясю досыць доўга, бо былі абмежаваныя фінансава. Калі б на самым пачатку мы нанялі дарагіх праграмістаў і дызайнераў, якія ўжо маюць досвед працы са ШІ, то мы зрабілі б нашмат хутчэй. Я, як рэдактарка БРЦ, вывучаю магчымасці інтрументаў ШІ ў вольны ад працы час — каб некалі штучны інтэлект мяне не замяніў. Так, гэтая опцыя даступная, але давядзецца пакапацца.
«Як іншыя размаўляюць з ChatGPT, так я размаўляю з нашай Ясяй»
— Якая місія ўскладзеная на Ясю? Прасцей кажучы, навошта вы яе зрабілі?
— У мяне ёсць некалькі варыянтаў адказу. Мне падаецца, найбольш праўдзіва прагучыць наступны.
БРЦ выдае досыць складаны кантэнт. Мы займаемся расследаваннямі, робім складаную аналітыку, антыфэйкавыя праекты — усё гэта складана ўспрымаецца чытачом. Намнога прасцей пайсці на іншы рэсурс, які перарабіў велізарнае расследаванне ў кароткую навіну.
Мне хацелася зрабіць нешта, што дазволіць аблегчыць наш складаны кантэнт, тое, з чым нашаму чытачу будзе не толькі карысна, але і прыемна, і лёгка. Яся можа моцна спрасціць разуменне нашага кантэнту: калі вы зойдзеце на канкрэтнае расследаванне і папросіце Ясю коратка і лёгка пераказаць расследаванне, яна гэта зробіць. Яна можа расправесці пра самыя папулярныя тэксты, ці апошнія матэрыялы, ці зробіць падборку тэкстаў на канкрэтную тэму.
То-бок, мне хацелася дадаць інтэрактыўнасці ў камунікацыю з нашым чытачом.
Другі адказ палягае ў тым, што мне асабіста і нашай рэдакцыі вельмі хочацца разабрацца і карыстацца інструментамі ШІ. І калі мы іх выкарыстоўваем ў працоўных працэсах, якія не бачныя чытачу, то хацелася зрабіць нешта для чытача — тое, што яму можа быць цікавым і карысным. І гэта наша Яся.
Нашу Ясю, якую вы бачыце як чат-бот, мы надзялілі яшчэ дзвюма функцыямі, якія візуальна не звязаныя з ёй, але ўваходзяць у гэты праект і скіраваныя на паглыбленне камунікацыі з чытачом. Опцыя агучкі тэкстаў ужо ёсць ва ўсіх лонгрыдах. Сціслы пераказ пакуль пратэставалі толькі на адным, але плануем дадаваць ва ўсе наступныя. ШІ будзе яго генераваць, пасля гэты тэкст пройдзе фактчэк (згодна з рэдакцыйнай палітыкай БРЦ) і будзе апублікаваны на сайце.
Агучка тэкстаў робіцца на расійскую і англійскую мовы. На жаль, беларуская пакуль вельмі слаба гучыць, і ўвогуле дрэнна прадстаўлена ва ўсіх інструментах штучнага інтэлекту.
— Ці задаволеныя вы выдрай-дэтэктывам Ясяй, якая атрымалася ў выніку?
— Апроч таго, што нарэшце мы гэта зрабілі і этап распрацоўкі скончыўся? (Смяецца).
Я задаволеная. Як некаторыя праводзяць свае вечары, размаўляючы з ChatGPT, так я размаўляю з нашай Ясяй: яна вельмі інтэлігентная, яна вельмі адэкватная, у стане жартаваць, вельмі карысная. Мне падабаецца тое, што атрымалася.
— Лаяцца не навучылася яшчэ?
— Не, яна, дарэчы, можа вельмі востра адказаць, калі пачуе вашу лаянку ў камунікацыі з ёй — раю паспрабаваць.
Дзмітрый Смірноў: Выдра Яся пакажа беларускім медыям новыя магчымасці ШІ
Аўтар тэлеграм-канала Easy AI Дзмітрый Смірноў, які кансультаваў каманду БРЦ, лічыць Ясю ўнікальным праектам. У чым жа яе адметнасць?
— Для беларускіх медыяў гэта ўнікальны праект, бо ніхто пакуль не мае такога зручнага інтэлектуальнага памочніка. Можна нават не чытаць сайт, а папрасіць Ясю расказаць пра ўсё, што робіць БРЦ: пра публічных асобаў каманды рэдакцыі, коратка пераказаць тэксты расследаванняў ці падабраць тэксты на канкрэтную тэму.
Але гэта толькі адзін са складнікаў ШІ-трансфармацыі БРЦ. У верхняй частцы лонгрыдаў ужо з’явілася агучка: ШІ прагаворыць канкрэтны артыкул, калі вы не можаце (ці не хочаце) яго чытаць. У лонгрыдах будуць паступова з’яўляцца агучка і самары пры дапамозе ШІ.
Прыклад, як гэта выглядае, можна ўбачыць тут. Таму што заўтра можа быць не 1, а 10 такіх артыкулаў. Гэта комплексны падыход да выкарыстання ШІ ў беларускіх медыях.
— Як можа паўплываць стварэнне пранырлівай выдры-дэтэктыва на развіццё штучнага інтэлекту ў нашых СМІ агулам?
— Айчынныя медыі атрымалі наглядны прыклад, як магчыма выкарыстоўваць штучны інтэлект у сваёй працы. Некаму спадабаецца, хтосьці махне рукой, але рэакцыя пойдзе ў любым выпадку. Я спадзяюся, што выдра Яся падштурхне іншыя медыі да разумення новых магчымасцяў, якія дае штучны інтэлект.
Нават summary — гэта досыць просты для рэалізацыі прыём, які можна прыкруціць на другія сайты. Кажуць, моладзь не любіць вялікія тэксты. А кароткі пераказ стымулюе маладых людзей пачытаць. Існуюць паспяховыя міжнародныя кейсы прыцягнення чытачоў, бо людзі разумеюць, што зайшоўшы на сайт, ім не трэба выдаткоўваць шмат часу на вялікія тэксты — дастаткова азнаёміцца з кароткім пераказам.
Так што павысіць прагляды з дапамогай summary — пасільная задача. Так, чытач не стане чытаць увесь артыкул цалкам, паменшыцца час узаемадзеяння з аўдыторыяй, але колькасць праглядаў павялічыцца, то-бок аўтары данясуць сваю думку да большай колькасці людзей, што для медыяў важна.
Агучка тэкстаў таксама досыць удалы крок: можна іх праслухаць як падкасты.
Таму я кажу пра ўнікальнасць праекта: па-першае, інтэлектуальнага памочніка пакуль ніхто не мае, а па-другое, БРЦ ужыў комплексны падыход да прымянення ШІ. Канешне, беларускія медыі ў тым ці іншым выглядзе стоадсоткава выкарыстоўваюць ШІ: да СhatGPT звяртаюцца для генерыравання ідэй, малюнкі і відэа для YouTube ствараюць праз адпаведныя агрэгатары. Але гэта кропкавае прымяненне ШІ. Час звярнуцца да комплекснага падыходу.