Вероватно сте видели фантазијске филмове или ТВ емисије у којима главни лик тражи да увећа слику и побољша резултат – да покаже лице, или регистарску таблицу, или било који други кључни детаљ. Најновији Гуглови системи вештачке интелигенције (АИ), засновани на тзв дифузиони модели, су у стању да изведу овај трик.
То је тежак процес за савладавање јер у суштини додаје детаље слици коју камера првобитно није снимила, користећи супер-паметна нагађања заснована на другим, сличним сликама.
У Гоогле-у се ова техника назива природна синтеза слике, ау овом конкретном сценарију ултра-висока резолуција слике. Почињете са малом, пикселизованом фотографијом и завршавате са нечим оштрим, јасним и природним. Можда није баш оригинал, али је довољно близу да људском оку изгледа стварно.
Гугл је представио два нова АИ алата за овај посао. Први се зове СР3, или Супер-резолуција путем поновљеног пречишћавања, и функционише тако што додаје шум на слику, а затим га уклања. Кроз серију пробабилистичких прорачуна заснованих на великој бази података слика и неке магије машинског учења, СР3 може замислити како изгледа верзија слике пиксела ниске резолуције у супер-високој резолуцији.
Други алат је ЦДМ, или каскадни модели дифузије. Гугл их описује као „цевоводе“ дуж којих се дифузиони модели – укључујући СР3 – могу усмерити за висококвалитетно повећање слике. Узима моделе побољшања и претвара их у веће слике.
Коришћењем различитих модела побољшања у различитим резолуцијама, ЦДМ приступ је у стању да надмаши алтернативне методе повећања слике, према Гоогле-у. Нови АИ мотор је тестиран на ИмагеНет-у, џиновској бази података слика за обуку која се обично користи за истраживање визуелног препознавања објеката.
Крајњи резултати СР3 и ЦДМ су импресивни. У стандардном тесту са 50 људских добровољаца, слике људских лица које је генерисао СР3 су грешком у 50% случајева помешане са стварним фотографијама – а имајући у виду да би идеални алгоритам требало да постигне 50%, то је импресивно. Вреди поновити да ове побољшане слике нису потпуне поклапања са оригиналима, већ су пажљиво израчунате симулације засноване на математици вероватноће.
Гоогле обећава много више од својих нових АИ мотора и сродних технологија – не само у смислу повећања слика лица и других природних објеката, већ иу другим областима вероватног моделирања.
Прочитајте такође: