Root NationВестиИТ вестиMicrosoft представио мултимодални приступ који утире пут АИ на нивоу човека

Microsoft представио мултимодални приступ који утире пут АИ на нивоу човека

-

Почетком ове недеље истраживачи из Microsoft представио Космос-1, мултимодални модел вештачке интелигенције који може да анализира садржај слика, решава визуелне загонетке, врши визуелно препознавање текста, полаже визуелне тестове интелигенције и разуме упутства природног језика. Према истраживачима, такви модели АИ су први корак ка стварању вештачке опште интелигенције (АИ) која може да обавља заједничке задатке на нивоу човека. То јест, ова технологија ће моћи да замени особу у било ком интелектуалном задатку. И то је наведени циљ ОпенАИ, кључног пословног партнера Microsoft у области вештачке интелигенције.

Космос-1

У овом случају, Космос-1 је чисто лични развој компаније Microsoft. Истраживачи своју креацију називају „мултимодалним моделом широког језика“ (МЛЛМ) јер његови корени леже у обради природног језика само у тексту, као што је ЛЛМ, као што је ЦхатГПТ. Да би модел прихватио улазне слике, истраживачи морају прво да конвертују слике у посебну серију токена (углавном текст) које ЛЛМ може да разуме.

Космос-1

Космос-1 је обучен за базу података са Интернета, укључујући изводе из Тхе Пиле (800 ГБ текстуални ресурс на енглеском) и Цоммон Цравл. Модел је затим тестиран са неколико тестова за разумевање говора, генерисање говора, класификацију текста без оптичког препознавања карактера, титловање слика, визуелно одговарање на питања, одговарање на питања на веб страници и класификацију слика са локализацијом. Према Microsoft, Космос-1 је надмашио тренутне моделе у многим од ових тестова.

Космос-1

Посебно је интересантан био Равенов тест прогресивног расуђивања, који мери визуелни коефицијент интелигенције тако што представља низ облика и тражи од субјекта да заврши низ. Космос-1 је у 22% случајева успео да да тачан одговор.

Космос-1

Ови рани кораци, који би уз будућу оптимизацију, могли дати још значајније резултате, омогућавајући АИ моделима да перципирају и утичу на било који облик медија, увелико проширујући могућности вештачких асистената.

Прочитајте такође:

Пријави се
Обавести о
гост

0 Коментари
Ембеддед Ревиевс
Погледај све коментаре