GPT проговори на български език

Институтът INSAIT към Софийския университет “Св. Климент Охридски“ създаде чат приложението BgGPT. Първият езиков модел от последно поколение на български език вече може да се ползва от всеки безплатно на адрес https://chat.bggpt.ai.

GPT-технологията е върхова точка в развитието на изкуствения интелект и подобрява начина, по който обществото взаимодейства с информацията. През януари тази година институтът INSAIT обяви създаването на първия езиков модел на български език, което предизвика сериозен интерес – само за няколко дни хиляди граждани и стотици български държавни и частни организации заявиха достъп до технологията и чата.

Преди две седмици INSAIT публикува езиковия модел зад BgGPT за свободно ползване. Технологията вече се внедрява от бизнеса като отзивите са, че тя може да се настрои от компаниите за специфични нужди в рамките на няколко часа и с минимален изчислителен и финансов ресурс. След такава стъпка (т. нар. fine-tuning) BgGPT работи на сходно ниво с най-мощните модели като GPT-4 за специфичната задача, въпреки че е стотици пъти по икономичен като хардуерни нужди. Тази функционалност позволява на българските компании и институции да внедряват изкуствен интелект почти безплатно в сравнение с огромните разходите, нужни за настройка и използване на затворени модели (напр. като тези на OpenAI). Това е само първа стъпка от развитието на революционната технология, която маркира началото на дълъг процес.

Imagem
pic

Друго предимство е, че BgGPT може да се използва изцяло в рамките на дадена организация, като по този начин поверителните данни не се споделят с трети страни. BgGPT надгражда над отворения модел Mistral-7B, като този процес включва не само обучение с множество данни на български (т.нар. continuous pre-training), но и редица иновации, които ще бъдат публикувани във водещи технологични и научни форуми.

Публичният достъп до чата на BgGPT и моделите зад него са част от мащабната стратегия на INSAIT за развитието и внедряването на изкуствения интелект в България. В този контекст INSAIT партнира с десетки български частни и държавни организации, които предоставят публични данни – например НАП, АПИС, „Просвета“, „Lex.BG“ и други. Партньорствата включват предоставяне на публични данни за подобрението на модела и реализиране на пилотни проекти. Очаква се моделите от серията на BgGPT да доведат до създаването на дигитални приложения, асистенти и услуги в редица сфери на нашия живот като образование, публична администрация, счетоводство и други.

Fonte
МОН
Fotografia
Public domain pictures, INSAIT