Енді дауыс қосымшалары қазақ тілін түсіне алады: НУ ғалымдары ана тілімізді цифрландырды

0
784

Бұл дауыс көмекшілеріне мемлекеттік тілімізді түсінуді үйретіп қана қоймай, қазақ тіліне басқа да жаңа технологияларды енгізуге мүмкіндік береді.


Енді дауыс қосымшалары қазақ тілін түсіне алады: НУ ғалымдары ана тілімізді цифрландырды

ERNUR.KZ. Назарбаев Университетінің ғалымдары 2000 адамның даусын жазып, оларды өңдеп, ана тілін автомат түрде тануға мүмкіндік алу үшін қазақ тіліндегі аудио деректердің ірі базасын жинады, деп жазады Tengrinews.kz.

Бұл дауыс көмекшілеріне мемлекеттік тілімізді түсінуді үйретіп қана қоймай, қазақ тіліне басқа да жаңа технологияларды енгізуге мүмкіндік береді.

Қазақ тілін дамыту үшін өз даусын жазуға келгендер бүкіл Қазақстан бойынша әлеуметтік желілер, блогерлер және медиа арқылы жиналды. Хабарландыру Tengrinews.kz сайтында да шыққан. Осының арқасында НУ Ақылды жүйелер және жасанды интеллект институтының (ISSAI) ғалымдары екі мың адамды жаза алды. Олар бірге қазақ тілінде 300 сағат 154 мың сөйлем айтқан.

Назарбаев Университетінің ғалымдары алынған ауқымды дауыс деректерінің базасында алғаш рет қазақ тілінің корпусын құрды, яғни жасанды интеллектіні тілді тануға, мағыналық байланыстарын, сөздердің айтылу ерекшеліктерін және әртүрлі мағынасын түсінуге үйретті. Технологияны мына жерден тексеруге болады. Сілтеме арқылы да дерекқорға кіре аласыз.

Қазақ тілін тану жүйесі Siri, Alexa, Алиса және Cortana сияқты виртуал көмекшілерді жасайтын адамдарға қызық болуы мүмкін, бұл әртүрлі ақылды үй технологиялары мен автомобильдерде қазақ тіліндегі командаларды түсінуге мүмкіндік береді.

Бұл технологияны қолдану аясы шексіз, себебі ғалымдар өз қосымшаларында қазақ тілін енгізгісі келетіндердің барлығына жаңалығын тегін бөліседі. Айтпақшы, әдетте мұндай жобаларды ірі компаниялар жүзеге асырады, ал кейін өз қызметін коммерцияландырады.

Алайда Назарбаев Университеті ғалымдарының арқасында бұл базаны KaspiBank, Beeline, BTS Digital, Yandex және Silero Speech сөзді тану жүйесі, сондай-ақ бірнеше университет, соның ішінде АҚШ-тағы Суортмор жеке гуманитарлық колледжі, Қазақстан-Британ техникалық университеті, Алматы энергетика және байланыс университеті, Алматыдағы Сәтпаев атындағы техникалық университет тегін алды.

Айта кетейік, 2018 жылы Yandex "Алисаны" қазақ тіліне үйретуді жоспарлап отырғанын хабарлаған болатын, бірақ компания әзірге өзінің дауыстық көмекшісінің жаңарған нұсқасын ұсынған жоқ. Мүмкін ғалымдардың жұмысы бұл процесті жылдамдататын шығар.

"Бұрын жеткілікті деңгейде үлкен деректер базасының болмауы қазақ тілін цифрлық әлемде қолдануға кедергі болатын, сондықтан біз осы жобаны қолға алдық. Қазір біз жиналған қазақша сөздердің деректер базасын еліміздің экономикасы мен қоғамын дамытуға барынша тарту үшін барлық зерттеуші мен кәсіпкерге ашық бастапқы кодын бөлісуге дайынбыз", - деп атап өтті ISSAI NU директоры профессор Атакан Варол.

Сондай-ақ, ғалымдар бұл өнертабыс даму мүмкіндігі шектеулі адамдарға, мысалы, көру қабілеті нашар және зағип адамдарға көмектеседі, сонымен қатар координациясы бұзылған адамдардың сөзін мәтінге айналдыруға мүмкіндік береді деп үміттенеді.