АИ оцењује веб странице опонашајући стварне људе и чак их надмашује. Како се то ради?

Данас је једна од компоненти уКит АИ-а, интелигентни систем редизајнирања веб страница, јавно доступан. То је прототип модул за процену лепоте веб страница. Комбинује неуронску мрежу и стабла одлука да имитира реакцију обичног посетиоца на дизајн веб локације веб локације.

У будућности ће такав модул проценити рад алгоритма генеративног дизајна, кључног елемента уКит АИ-а, који ће дизајнирати странице без људског учешћа ослањајући се на доступни садржај и „знање“ о разлици између неефикасне веб странице и онај који има за циљ повећање стопе конверзије.

Актуелна АИ верзија ВебСцоре одражава поглед просечног корисника интернета на изглед веб локације. Иако можемо да направимо друге опције, на пример, могуће је оценити употребљивост веб локација.

Веб странице које се користе за обуку система. Пре свега, сакупили смо 12.000 веб локација и онлајн продавница насталих током различитих година на различитим платформама и на различитим језицима. Главни задатак био је добити довољно примера визуелне градације, од прилично лоших веб локација до врло добрих. Овим путем смо показали систему шта све може наићи на савременом вебу.

Неколико веб локација из узорка тренинга.

Свака градација се мери скалом, а ову скали треба да разуме обична особа, чије мишљење покушавамо да моделирамо. Дакле, дошли смо до идеје о скали од 1 до 10, која се користи у нашој услузи.

Људи које имитира ВебСцоре АИ. Требале су нам две ствари да бисмо формирали скуп података (скуп података за модел тренинга) из различитих веб локација:

  • знакове помоћу којих ће систем одредити је ли веб локација атрактивна;
  • процене (оцене) направљене уз помоћ наше скале за одређену количину веб локација. Они ће постати модел за систем.

Неко би требао дати ове почетне оцјене. Такав „наставник“ или група „наставника“, тачније, у великој мери ће утицати на то како ће модел функционисати.

Интерфејс за процену веб локација: преузмите и ускоро користите наш ГитХуб.

Да бисмо окупили фокус групу, извршили смо прелиминарни избор кандидата на 1500 примера веб локација. Рутински посао, али одговоран и захтеван сјајан фокус. Прелиминарни избор помогао нам је да уклонимо непримјерене кандидате и да изузмемо „контроверзне“ (када неко оцијени као 1, а други као 10) веб странице из узорка.

У почетку смо експериментирали са методама евалуације.

На пример, понудили смо процену једне веб странице, затим две веб локације истовремено, или изабрали једну од две, најатрактивнију. Приступ где је испитаник видео једну јединствену веб страницу и оценио је да најбоље функционише. Користили смо га за процену 10.000 преосталих веб локација.

Особа је проценила да ли је веб локација леп или не. Како ће машина то урадити? Ти и ја требамо само један поглед да бисмо формирали мишљење о укупној љепоти нечега. Али знамо да је ђаво у детаљима.

Знакови визуелне привлачности веб странице који ће водити модел су кључни тренутак за цео пројекат. За помоћ смо питали дизајнерски тим за израду веб страница уКит, њихов рад се користи као основа за стотине хиљада веб локација, а милиони људи га виде. Заједно смо саставили проширену листу функција на које професионалци обраћају пажњу приликом развоја дизајна веб страница. А онда су је покушали смањити, остављајући само оне најважније.

уКит.цом дизајнерски тим.

Као резултат тога, добили смо списак од 125 сасвим различитих, али значајних критеријума груписаних у петнаест категорија. На пример, листа садржи: прилагођавање популарним екранима, различите величине фонта, чистоћу боја, дужину наслова, пропорцију слика на целој страници и тако даље. Преостало је да тренирамо модел користећи та правила.

Креирајте алгоритам. Шта је тачно „модел наставе“? То је конструкција алгоритма који је заснован на датом скупу карактеристика и може да процени одабрану веб локацију. Пожељно је да процена система и оцена просечног наставника деле минимални јаз у њиховим коначним оценама.

Одлучили смо да користимо методу повећања градијента над стаблима одлука, јер је то један од најпопуларнијих и најефикаснијих приступа. Користећи основне алгоритме, он конструише скуп чији укупни резултат прелази резултате било којег посебног алгоритма.

Штавише, додавањем сваког наредног основног алгоритма покушава се побољшати квалитет одговора целог скупа.

Да бисмо убрзали и олакшали процес, користили смо ЦатБоост библиотеку компаније Иандек која омогућава изградњу насипника на градијенту у такозваним „несвјесним стаблима одлука“ осигуравајући добре могућности тренинга модела од самог почетка и брзи пријелаз на пружање предвиђања (процјене ) за нове објекте.

Додавање неуронске мреже. Када је основни алгоритам био спреман, одлучили смо да спроведемо експеримент: да ли ће се резултати побољшати ако додамо неуронску мрежу? Заправо, већ смо знали како да „прегледамо“ веб страницу и њен дизајн, а сада смо одлучили да систему дамо неку врсту „лупе“ коју може да користи за откривање још више детаља.

Одабрали смо једну од најпопуларнијих мрежа, реснет50, познат је као добар алгоритам за вађење функција на високом нивоу. И научили смо како да добијемо 1000 додатних атрибута за процену веб локација. Као резултат, систем сада карактерише УРЛ по укупно 1125 функција и проналази веб локацију веб локације на скали од 10 тачака. Процес траје до неколико десетина секунди, због чега сматрамо да убрзавамо модел смањујући број знакова уз задржавање квалитета процене на истом нивоу.

Први резултати. Модел трениран на овај начин могао би да направи 3 пута тачније процене у односу на процене појединих 'учитеља'.

Можемо рећи да је модел надмашио своје прве наставнике јер се оцене фокусне групе знатно разликују од просечних од процена неуронске мреже. Сада смо алгоритам ставили у мрежу ради даљег обучавања. И ви можете постати њен учитељ.