Шта је Гемини: Све о новом АИ моделу од Гоогле-а

Гоогле је управо објавио свој најмоћнији АИ модел икада назван Близанци. Шта је она и шта може да уради? О свему у нашем чланку.

Гоогле већ годинама развија сопствене алате за вештачку интелигенцију. Са јавним објављивањем ЦхатГПТ-3 од ОпенАИ-а, компанија која води најпопуларнији светски претраживач такође је креирала сличан алат, Бард. Али овај алат је ипак изгубио од конкурената, што Гоогле није могао да дозволи. Стога не чуди што је свет недавно угледао Гемини, нови језички модел из Гугла, за који смо сазнали током презентације.

Дизајниран је не само да унапреди претходни ЛЛМ (Ларге Лангуаге Модел) гиганта, већ и да понуди потпуно нове могућности у области обраде текста, графике и звука.

Хајде да погледамо изблиза нови језички модел Гоогле Гемини.

Такође занимљиво: ОпенАИ пројекат П*: шта је то и зашто је пројекат забринут

САДРЖАЈ

1. Шта је Гоогле Гемини?

2. Ко је креирао модел?

3. Могућности

4. Постоје ли различите верзије?

5. Како приступити Близанцима?

6. Близанци у Гоогле Барду: Шта ће се променити?

7. Близанци у Гоогле Пикел паметним телефонима

8. По чему се Гемини разликује од других АИ модела, као што је ГПТ-4?

9. Забринутост за тачност и непристрасност

КСНУМКС. Будућност је са Близанцима

Шта је Гоогле Гемини?

Ово је нови и моћан модел вештачке интелигенције из Гугла, који може да разуме не само текст, већ и слике, видео и аудио. Овај мултимодални модел је описан као способан да обавља сложене задатке у математици, физици и другим доменима, као и да разуме и генерише висококвалитетан код на различитим програмским језицима.

Гемини је тренутно доступан кроз интеграцију са Гоогле Бардом и Гоогле Пикел 8 и постепено ће бити укључен у друге Гоогле услуге.

„Близанци су резултат огромног заједничког напора свих Гоогле тимова, укључујући наше колеге у Гоогле Ресеарцх-у“, — рекао је Деннис Хассабис, извршни директор и суоснивач Гоогле ДеепМинд-а. „Изграђен је од темеља да буде мултимодалан, што значи да може да генерализује и неприметно разуме, оперише и комбинује различите врсте информација, укључујући текст, код, аудио, слике и видео.

- Адвертисемент -

Такође занимљиво: Није све што називамо АИ заправо вештачка интелигенција. Ево шта треба да знате

Ко је креирао модел?

Као што сте вероватно већ претпоставили, Гемини су креирали Гоогле и Алпхабет, Гоогле-ова матична компанија, и представља најнапреднији АИ модел компаније до сада. Гуглово одељење ДеепМинд такође је дало значајан допринос његовом развоју. Још није познато колико је запослених учествовало у развоју и која су средства за то издвојена, али знајући Гуглове могућности, можемо бити сигурни да је реч о веома великом износу.

Такође занимљиво: Виндовс 12: Шта ће бити нови ОС

Могућности

Као што сам горе приметио, то је мултимодални модел, што значи да може да разуме, оперише и комбинује различите типове података, укључујући текст, код, аудио, слике и видео. Пружа боље разумевање, размишљање и вештине кодирања у поређењу са претходним системима вештачке интелигенције.

Главне могућности модела су:

Обрада природног језика за задатке као што су превођење, сумирање и дијалог
Математичко размишљање и решавање проблема
Способност генерисања кода и документације
Разумевање слика, аудио и видео записа
Мултитаскинг у различитим доменима

Као што видите, могућности су супериорније у односу на друге моделе.

У тестовима разумевања језика, математичког размишљања и кодирања, Гемини Ултра је надмашио моделе као што је ГПТ-4. Конкретно, то је први модел који је надмашио перформансе на нивоу човека на тесту разумевања језика великог броја задатака (ММЛУ), постигавши преко 90% тачности.

У 32 академска теста велике студије језика, Близанци су надмашили ГПТ-4. У 30 случајева, нови језички модел из Гугла био је бољи од конкурента. Ово показује способност модела да у потпуности разуме језик.

Прочитајте такође: Пројекат људског мозга: Покушај имитације људског мозга

Постоје ли различите верзије?

Гоогле описује ову вештачку интелигенцију као флексибилан модел који може да ради на било ком уређају: од Гоогле центара података до мобилних уређаја. Да би се постигла ова скалабилност, Гемини долази у три верзије: Нано, Про и Ултра.

Хајде да разговарамо о различитим верзијама Близанаца детаљније.

Гемини Нано: дизајниран за рад на паметним телефонима, посебно на Гоогле Пикел 8. Дизајниран је за обављање задатака који захтевају ефикасну обраду од стране вештачке интелигенције без повезивања на спољне сервере, као што је предлагање одговора у програмима за ћаскање или сумирање текста. Овај компактни модел уређаја има око 6 милијарди параметара.
Гемини Про: ради у Гоогле центрима података. Про је дизајниран да ради са најновијом верзијом Бард АИ цхат бота. У стању је да обезбеди брзо време одговора и разуме сложене упите. Модел средње величине има приближно 100 милијарди параметара и представља језгро Бардове конверзацијске АИ. Про ће бити доступан преко Гоогле Цлоуд-а.
Гемини Ултра: иако Ултра верзија још увек није широко доступна, Гугл је описује као свој модел са најбољим учинком, који премашује „тренутно стање технике за 30 од 32 широко коришћена академска теста који се користе у истраживању великог језичког модела (ЛЛМ). " Као највећа и најмоћнија верзија, Ултра ће добити више од трилиона параметара. Налазиће се у дата центрима. Ултра је прилагођен за корпоративну употребу. Верзија је дизајнирана за обављање веома сложених задатака. Гоогле планира да га објави након завршетка тренутне фазе тестирања. То јест, најмоћнија верзија још није доступна корисницима.

Такође занимљиво: Гоогле Бард АИ: Све што треба да знате

- Адвертисемент -

Како приступити Близанцима?

АИ у Нано и Про верзијама је сада доступан у Гоогле производима као што су Гоогле Пикел 8 паметни телефони и Бард цхатбот, респективно. Гоогле планира да га на крају интегрише у свој претраживач, оглашавање, Гмаил сервис е-поште, Цхроме претраживач и друге услуге.

Програмери и пословни корисници ће моћи да приступе Про преко Гемини АПИ-ја у Гоогле АИ Студију и Гоогле Цлоуд Вертек АИ од 13. децембра 2023. Девелоперс Android ће имати приступ моделу Нано верзије преко АИЦоре-а, који ће бити доступан у раном прегледу.

Прочитајте такође: Samsung Galaxy Флип5 вс Motorola Разр 40 Ултра: Битка два јокозуна

Близанци у Гоогле Барду: Шта ће се променити?

Према информацијама које су дате током презентације, модел ће омогућити Гоогле Барду да боље решава сложеније проблеме, као што је наведено:

„Дизајнирали смо Гемини тако да модел буде природно мултимодалан и претходно обучен за више модалитета од самог почетка. Затим смо га побољшали додавањем више мултимодалних података да бисмо побољшали перформансе. Као резултат тога, Гемини лако разуме и закључује много боље од претходних мултимодалних модела, и може се похвалити врхунским могућностима у скоро свим областима.

Геминијеве изванредне мултимодалне могућности помажу вам да разумете сложене текстуалне и визуелне информације. Они су посебно корисни када је у питању издвајање специфичних информација из огромних скупова података. Изванредна способност овог модела да читањем, филтрирањем и анализом извуче суштину информација из стотина хиљада докумената, несумњиво ће допринети новим, муњевитим открићима у различитим областима од науке до финансија“.

Током презентације демонстриран је пример сложене студије која садржи више од 200 хиљада записа, од којих су неки морали да се ажурирају према новим подацима. Као што сте можда претпоставили, ручни рад би одузео много времена, па су аутори студије користили Гемини да припреме код који је узео улаз и направио неопходна ажурирања. Други, више стварни пример је коришћење Гоогле-овог језичког модела за објашњење математичких или физичких проблема.

Улазни подаци овде су били фотографија/скен задатка са школског часа. Систем је био у могућности да обради графику и текст који су тамо ускладиштени, а затим да назначи који су делови домаћег задатка урађени исправно, а којима је потребно више пажње. Презентација је показала да корисник може више пута тражити од Близанаца да објасне задатак, а сваки наредни покушај мора бити објашњен једноставнијим језиком. Колико ће Близанци бити тачни и коректни, наравно, провериће заинтересовани, али импресивна је могућност читања и обраде текста директно са фотографија. Како је додато током презентације:

"Близанци су научени да препознају и разумеју текст, слике, звукове и још много тога у исто време. Захваљујући томе, он боље разуме нијансе информација и може одговорити на сложена питања. Посебно је ефикасан у објашњавању тема везаних за математику и физику, тако да може послужити као лични помоћник у домаћем задатку".

Близанци у Гоогле Пикел паметним телефонима

Гугл се такође хвалио да је Гемини „научио“ на новим ТПУв5 чипсетима, и планира да почетком 2024. године представи Гемини Ултра, који ће користити Бард Адванцед, нову верзију потрошачке верзије говорног модела гиганта. Гемини Ултра је тренутно у фази тестирања и већ је доступан одабраним стручњацима за безбедност.

Последња важна информација је увођење Гемини-а у паметне телефоне Гоогле Пикел 8. Ово ће, између осталог, омогућити креирање брзих одговора преко Гбоард апликације у месинџерима. Први је ВхатсАпп, али следеће године ће се таква решења појавити и у другим апликацијама које се односе на комуникацију. Међутим, ово је само почетак, јер је Гоогле најавио много нових АИ алата за Пикел 8 паметне телефоне, а они ће у будућности бити доступни и на неким другим уређајима. Android. Међутим, ово су даљи планови и за сада нису дати детаљи.

По чему се Гемини разликује од других АИ модела, као што је ГПТ-4?

Гуглов нови модел Гемини изгледа као један од највећих и најнапреднијих АИ модела до сада, иако ће издавање Ултра модела то сигурно одредити. У поређењу са другим популарним моделима који тренутно користе АИ цхат ботове, Гемини се истиче сопственом мултимодалном карактеристиком, док се други модели попут ГПТ-4 ослањају на додатке и интеграцију да би били заиста мултимодални.

Забринутост за тачност и непристрасност

Иако је Гемини велики корак напред у развоју способности вештачке интелигенције, има исте недостатке као и други главни језички модели. Пре свега, ово је могућност стварања лажних информација. Предрасуде су такође засноване на подацима о обуци доступним новом језичком моделу. Такође вреди поменути ограничено разумевање стварног света. Гугл признаје да нови модел Близанаца може да прави грешке, пружа чињенице које нису засноване на доказима и противрече здравом разуму.

Потребно је још тестова, посебно за Гемини Ултра, који има нове могућности које још нису у потпуности истражене. Гоогле је посвећен пажљивој процени Близанаца како би свео потенцијалну штету на минимум.

Такође занимљиво: Све о Microsoft Копилот: будућност или погрешан пут?

Будућност је са Близанцима

Гугл-ово лансирање Гемини-а отворило је нову еру развоја вештачке интелигенције. Са својим најбољим перформансама у поређењу са претходним моделима и људским основама, Гемини указује на будуће могућности вештачке интелигенције, али је и даље потребно више истраживања како би се решили одређени недостаци.

У будућности можете очекивати да ће Гемини пружити корисније и интелигентније функције у Гоогле производима. Убудуће, компанија планира да настави да шири Гемини изван енглеског и да гради на својој методологији основног модела.

Можемо само да гледамо и надамо се да Гугл зна шта ради.

Прочитајте такође:

Више од аутора

Пријави се

0 Коментари

Ембеддед Ревиевс

Погледај све коментаре

Остали чланци

Шта је Гемини: Све о Гоогле-овом новом АИ моделу