Root NationВестиИТ вестиМетин говор АИ препознаје преко 4 говорних језика

Метин говор АИ препознаје преко 4 говорних језика

-

мета креирао АИ језички модел који није ЦхатГПТ клон. Компанијски пројекат Массиве Мултилингуал Спеецх (ММС) може да препозна више од 4 говорних језика и репродукује говор (претварање текста у говор) на више од 000 језика. Као и већина својих јавно објављених АИ пројеката, Мета данас омогућава отворен приступ ММС-у како би помогао у очувању језичке разноликости и подстакао истраживаче да га развију. „Данас јавно делимо наше моделе и код како би други чланови истраживачке заједнице могли да надограђују наш рад“, написала је компанија. „Захваљујући овом раду, надамо се да ћемо дати мали допринос очувању невероватне језичке разноликости света.

мета

Модели за препознавање говора и претварање текста у говор обично захтевају обуку о хиљадама сати аудио снимака са пратећим налепницама за транскрипцију. Али за језике који се не говоре широко у индустријализованим земљама – од којих многима прети изумирање у наредним деценијама – „ови подаци једноставно не постоје“, каже Мета.

Мета је заузео неконвенционалан приступ прикупљању аудио података: слушао аудио снимке преведених верских текстова. „Окренули смо се ка религиозним текстовима, као што је Библија, који су преведени на многе различите језике и чији су преводи нашироко проучавани ради истраживања превођења заснованог на тексту“, саопштила је компанија. „Ови преводи имају јавно доступне аудио снимке људи који читају ове текстове на различитим језицима. Укључујући неозначене записе из Библије и сличних текстова, истраживачи Мета су повећали број језика доступних моделу на преко 4.

„Иако је садржај аудио записа религиозан, наша анализа показује да то не утиче на производњу религиознијег језика модела“, пише Мета. „Верујемо да је то зато што користимо приступ временске класификације (ЦТЦ), који је много ограниченији у поређењу са великим језичким моделима (ЛЛМ) или моделима секвенци за препознавање говора.“ Такође, упркос чињеници да су већину верских текстова читали мушкарци, то није довело до мушке пристрасности – систем је подједнако добро препознавао и женске и мушке гласове.

Након што је обучио модел усклађивања да би подаци били употребљивији, Мета је користио вав2вец 2.0, компанијски модел „самоконтролисаног учења представљања језика“ који може да учи на неозначеним подацима. Комбинација нетрадиционалних извора података и самоусмереног модела говора довела је до импресивних резултата. „Наши резултати показују да модели масовног вишејезичног емитовања имају добре резултате у поређењу са постојећим моделима и покривају 10 пута више језика. Конкретно, Мета је упоредио ММС са ОпенАИ-јевим Вхиспером, а резултати су премашили очекивања. „Открили смо да модели обучени за податке о масовном вишејезичном говору имају упола мањи проценат грешака у речима, али масовно вишејезични говор покрива 11 пута више језика.“

Мета упозорава да њени нови модели нису савршени. „На пример, постоји ризик да модел говора у текст може погрешно превести појединачне речи или фразе“, пише компанија. „У зависности од исхода, ово може довести до увредљивог и/или нетачног језика. И даље верујемо да је сарадња унутар заједнице вештачке интелигенције кључна за одговоран развој АИ технологија.”

мета

Сада када је Мета објавио ММС за истраживање отвореног кода, нада се да ће преокренути тренд смањења броја језика у свету на 100 или мање, од којих је већина подржана великим технологијама. Она види свет у коме помоћна технологија, ТТС, па чак и ВР / АР технологије омогућавају свима да говоре и уче на свом матерњем језику. Каже: „Ми замишљамо свет у коме технологија има супротан ефекат, подстичући људе да одржавају своје језике живим јер могу да приступе информацијама и користе технологију док говоре свој матерњи језик.

Прочитајте такође:

Пријави се
Обавести о
гост

0 Коментари
Ембеддед Ревиевс
Погледај све коментаре
Претплатите се на ажурирања