Изкуствен интелект на ишлеме

Иновациите на българските технологични фирми се използват повече в чужбина, отколкото от бизнеса в страната
Gulliver Photos/Getty Images
HELLO: Роботът Пепър дава банкови консултации в България. Засега само на английски език

Ако в началото на годината сте посещавали офисите на Банка ДСК в най-големите столични молове, може да сте срещнали Пепър. Високият около 1,20 м симпатичен хуманоиден робот посрещаше клиентите в нейните офиси и чрез разположен на гърдите му таблет представяше услугите на банката, като водеше диалог на английски език. Произведеният в Япония Пепър, който е първият подобен проект за банка на Балканския полуостров, е изпълнен от българската ИТ компания „Мусала Софт“. В Страната на изгряващото слънце той се използва и като домашен асистент за възрастни хора, като ги подсеща за лекарствата и разговаря с тях.

Пепър няма способностите на андроидите от холивудските филми и вероятно ще минат години, преди да се появят трудно отличими от човека създания, но към момента лицето на приложенията с изкуствен интелект (ИИ) е такова. Лека-полека ИИ технологиите навлизат и в българския бизнес и общество, а някои местни компании разработват продукти и услуги, които намират пазар в цял свят. Даже повече по света, онколкото у нас.

Ако искате да купите блендер от интернет сайта на веригата „Технополис“, под избрания от вас модел излизат и други предложения за малка домакинска техника или кухненски аксесоари. Те се подреждат от изкуствения интелект на системата SAP Hybris, която „движи“ електронната търговия на веригата.

Т.нар. препоръки – извеждането на свързани продукти, услуги и статии, се използва от голяма част от интернет търговците и медиите в България, като при все повече от тях подборът им става на базата на изкуствен интелект, който вместо оператор подрежда контекстуално офертите.

Чатботовете – програми, с които търговците водят разговор със своите клиенти или им представят своите продукти, вече са част от интерфейса на интернет сайтовете на повечето големи банки. На тях те прехвърлят някои от рутинните задачи, за които не е нужна човешка намеса. И не само там. Дори къщата за гости „Макак B&B“ от великотърновското село Леденик е „назначила“ чатбот в своята фейсбук страница, който общува с англоезичните клиенти на хотела. Ботът е разработен от българския стартъп „Умни Солюшънс“, която предлага виртуалния асистент под бранда Umni.

Заедно с автоматизацията изкуственият интелект е сред най-дискутираните теми през последните години и генерира бизнес за много новопоявили се компании на пазара, които един ден могат да се превърнат в мултимилиардни гиганти.

Обобщени данни за българския ИИ бизнес липсват, защото в голяма част от случаите дейността се извършва от екипи или малки подразделения на компаниите майки – както софтуерни, така и технологични фирми.

Сред гордостите на телекома „Виваком“ е разработената от нея видеонаблюдателна система с изкуствен интелект, която използва община Враца. С помощта на специален софтуер камерите могат да разпознават номера на автомобили, хора с маски, както и паднали на улицата хора. В рамките на месец системата е засякла на територията на общината грабеж, палеж и няколко нарушения за нередности, свързани с акцизи и пътнотранспортни произшествия.

А някои български софтуерни фирми, макар и малки по размер, са сред водещите в света в техните области на разработка на ИИ приложения.

20 години практика
„Онтотекст“ е една от първите компании в България за развитие на изкуствен интелект, както и най-голямата в бранша. Тя има 60 служители и е част от публичната компания „Сирма Груп Холдинг“. Стартиралата през 2008 г. фирма е глобален разработчик на семантични технологии и базирани на тях решения. Те използват алгоритми на базата на изкуствения интелект, които се прилагат в управлението и използването на големи данни и текстов анализ.

„Компанията тръгва с основната идея за разпознаване на концепции и знания в огромни масиви от текст и моделирането им в език, с който след това машините да работят, и в момента е световен лидер на пазара на семантични технологии“, казва Милен Янкулов, маркетингов директор на Онтотекст.

Основната ѝ платформа е софтуерната база данни GraphDB, семантична графова база данни, с която компанията помага на големи фирми да свързват знания от различни неструктурирани източници, за да могат след това лесно да търсят в тях по концепции, препоръки, различни търсачки.

Другото нещо, по което работи компанията, е “текст майнинг“ – извличане на информация от огромни масиви от текст, като например новини, структурирането им в концепции и свързването им с публично знание, като „Уикипедия“ или „Дибипедия“ (структурирания формат на уикипедия). Така фирмите могат да правят връзка между огромните масиви публична информация и вътрешната си информация, натрупана на сървърите им.

„Опитваме се да създадем домейн експертиза в конкретна област– да учим машините да мислят, да разпознават концепции, да ги свързват с други концепции, да могат да правят връзки между тях, както хората го правят“, обяснява Янкулов.

Проектът „Еркюл“


Клиенти на компанията са едни от най-големите световни новинарски агенции като Би Би Си, „Файненшъл Таймс“, както и лидери в бранша на издаване на медицинска и технологична литература.

„Онтотекст“ влезе в международните новини и с участието си във финансирания от ЕС проект „Еркюл“ (Hercule) за разпознаване на фалшиви новини. Идеята зад него е да проследи историите зад конкретни новини в „Туитър“, като ги свърже с подобни в „Ютюб“ и след това „докаже“ в Google News, за да идентифицира доколко са верни или са слухове.

Спортната секция на Би Би Си работи с технология на „Онтотекст“. Например, когато има мач от Шампионската лига и се обяви гол, страницата сама изкарва факти, свързани с голмайстора, с различни статистики при подобни мачове между отборите и други. Всичко това става динамично и автоматизирано, като човешката намеса е в предоставянето на първоначалната, „сурова“ информация.

За „Файненшъл Таймс“ прави препоръки на съдържанието – когато някой чете дадена статия, която е свързана с Нюйоркската фондова борса например, интелигентни технологии дават информацията, която е контекстуално свързана с нея. Не просто по ключови думи, а семантично свързана с различни статии, които по някакъв начин имат еднакви концепции.

Друга дейност е да събира за клиенти от маркет интелиджънс бранша информация за различни компании – нови и утвърдени.

Виртуални мозъци
Дали заради мащабите на бизнесите, към които „Онтотекст“ се е насочила, но в България компанията няма активен клиент, въпреки че в миналото е работела по проекти за „Нетинфо“ и „Офнюз“. 60% от клиентите ѝ са във Великобритания, около 40% в САЩ, като има продажби в Белгия, Франция, Холандия.

„Това, върху което компанията набляга в момента, са т.нар. knowledge graphs – бази от знания, в които са заредени данни от публични регистри като „Уикипедия“ и „Уикидейта“, комбинираме знания за географски понятия, тренираме нашите машини с новини, извличайки информация, за да обогатяваме тези графики. Те са нещо като виртуален мозък – заредени с много знания, концепции, даващи възможността да се правят различни открития на база на вече съществуващи знания“, обяснява Милен Янкулов.

Автотагингът


Фотографията е сред областите, които получиха най-бурно развитие покрай бума на дигиталните технологии. Но за бизнеса с изображения сортирането на снимките и тяхното обозначаване с ключови думи е сериозен проблем.

„Имагга“ е сред първите фирми в света, която започна да предлага услуга за анализ на изображенията – потребителят изпраща някаква снимка и нейната система разпознава с изкуствен интелект какво има на нея. През 2016 г. „Имагга“ беше отличена от IDC като една от трите най-иновативни компании в света в анализа на изображения.

Преди появата на услуги като тази на „Имагга“ слагането на ключови думи се прави от хора – или от автора на снимките, или от екип разпръснати по цял свят „фрилансъри“, които „тагват“ изображенията така, че след това да ги откривате по-лесно сред милионите снимки. Това се използва изключително много от сайтовете за сток фотография, които предлагат срещу заплащане съхраняваните в тях изображения.

Проблемът е, че хората описват по различен начин една и съща снимка, като тяхното присъствие и капацитет невинаги са гарантирани. Докато услугата на „Имагга“ може да анализира неограничен брой снимки и да връща автоматично информация какво има на тях, т.нар. автогагинг.

„Разпознаваме около 4000 физически обекта автоматично, на базата на машинно самообучение. Развили сме т.нар. невронна мрежа, която сама прави извод от пикселите, които идват, дали става дума за куче, котка, компютър, диоптрични или слънчеви очила“, казва Георги Къдрев, изпълнителен директор и един от създателите на „Имагга“.

Допълнително към тези 4000 обекта системата предлага и концептуални ключови думи на базата на някаква връзка. Например, ако на една снимка има пясък, чадър и море, тя сама ще даде определение „лято“.

Основният продукт на компанията, който тя предлага от края на 2014 г., е услуга, при която ползвателят отива на сайта ѝ, регистрира се за програмен (API) достъп, след което изпраща снимки и в рамките на секунда получава обратно текст – списък в json формат с описание на кодовите думи.

Самообучаващата се система
Друг от продуктите ѝ определя основните цветове, които има на едно изображение. Или ако има някакъв обект на него, казва какви са цветовете му, независимо върху какъв фон се намира. Но нещата отиват и по-далече с възможността клиентът да обучи собствена система за разпознаване. По задание софтуерът на „Имагга“ не може да разпознава различни породи кучета, но ако потребител има интерес, той може да я обучи да прави това.

Един от най-големите практически случаи на компанията с машинно обучаване е с американска фирма, която в момента е собственик на едно от най-продаваните приложения в App Store за идентифициране на цветя и растения. Тя има база данни с 320 000 видове растения, като в момента в работна среда са пуснати около 200 000.

С лаборатория в Националния университет в Южна Корея компанията е извършила проект, свързан с разделното събиране на отпадъци. Целта е била да се провери дали в контейнерите се слагат такива отпадъци, за каквито са предназначени. Боклуците минават през конвейери и на база на визуален анализ се определят продуктите – хартия, пластмаса и т.н.

Уникалното при „Имагга“ е, че клиентите ѝ имат достъп до услугата не само в „облака“, а и могат да я инсталират на собствени машини. Това е особено важно покрай регулации като GDPR, които изискват всички лични данни за гражданите от ЕС да са разположени на сървъри в страни от Общността.

„Нашият модел е business to business (B2Bр), ние даваме на другите фирми инструмент, който те могат да използват и да вграждат в продуктите си“, казва Къдрев. Фирмата му има малък екип – от 11 души, но в иновативния бизнес понякога това също е предимство. В момента компанията има 250 клиенти от целия свят, като само 2 – 3 са от България.

Човешкият фактор
В глобален аспект „Имагга“ има за конкуренти гиганти като Google и Amazon, които предлагат подобни на нейните услуги. Както и много по-малки компании, които извършват анализ на графични изображения. Но предимството ѝ са… хората.

„Ако се тестват четирите технологии – на Google, Amazon, американския ни конкурент Clarifai и нашата, е факт, че те дават на практика много близки, сравними резултати. Много хора си казват – Google имат огромно количество данни. Но за да могат да се използват за машинно обучение, те трябва да бъдат класифицирани, трябва да бъде измислено как ще бъдат класифицирани, всичко това да бъде описано и анотирано. Това се свежда до човешки труд“, заключава Къдрев.

Какво бъдеще ни чака
Колко бързо ще напредне ИИ и ще измести ли роботът човека, това са въпросите, които всеки си задава. Според главния икономист на Институт „Отворено общество“ Георги Ангелов състоянието на българската икономика е такова, че има нужда от повече автоматизация, а към момента българският работник не е застрашен от машините. Родната икономика продължава да расте, а е стигнала почти максималното възможно ниво по отношение на заетост. „Стигнахме до този етап, в който имаме нужда от автоматизация, за да може да продължи икономическият растеж. Понеже няма повече хора, икономиката не може да расте интензивно. В България все още има малки наченки, но в Централна Европа вече все повече се инвестира в роботи и автоматизация на процеси, неща, които могат да се прехвърлят от хора на машини, за да може със същия брой работници да се произвежда повече“, казва Ангелов. Той смята, че в България все още цената на труда е ниска и хората са по-евтини от машините, но предупреждава, че в бъдеще еднообразни, повторяеми дейности много лесно могат да се заменят с машини. „ Ако този процес става постепенно, няма да има проблем. Проблемът ще е, ако това става шоково и машините изместят бързо хората в цели сектори“, допълва Георги Ангелов. Неговата прогноза е, че до 5 – 10 години едва ли може да се развие подобен сценарий особено в икономика с ниски заплати като българската.

Текстът е публикуван в брой 15/2018 г. на списание „Икономист“, който може да купите в разпространителската мрежа. Вижте какво още може да прочетете в броя.

Коментари