LLM, KazLLM, AlemLLM деген не және ол не үшін қажет: түсіндіреміз

Фото: Freepik.com
Халық арасында LLM, KazLLM жүйесі көп талқыланып жатыр. Көпшілік оның не екенін және қайда қолданылатынын біле бермейді. Nofake.kz аталған сұраққа жауап іздеп көрді.
LLM дегеніміз не және ол қайда қолданылады?
LLM ағылшын тілінен аударғанда «Large language modul» деп аударылады, яғни үлкен тілдік модель деген мағынаны білдіреді.
«Ол ЖИ-дің мәтінде келесі сөзді біліп тұратын моделі. LLM-нің әр түрлі түрі бар. Әр компания өз моделімен зерттеу жасайды. Олар өздері деректерді жинайды, тазартады, оның параметрлерін анықтайды. Мысалы OpenAI-да GPT, Meta-да Llama, Қытайда Qwen, GLM модельдері бар. Сол сияқты KIMI, Deepseek сияқты модельдер бар. Яғни әр компания деректерді жинап, архитектурасын құрайды және осы деректер негізінде аталған модельдерді оқытады», — дейді «ҰАТ» АҚ компаниясының жасанды интеллект жөніндегі басқарушы директоры Әлібек Сайланбаев.
Маман аталған тілдік модельдер жыл сайын жаңарып отыратынын айтады.
«Әр ай, жыл сайын жаңа модельдер шығып жатыр. Мысалы бұрын GPT 4 болса, қазір GPT 5 бар. Және әркез модельдер ұлғайып, ақылдырақ бола бастады, ол сұрақтарға толық әрі тұщымды жауап ұсынады. Сондықтан уақыт өткен сайын оларды жаңартып, жақсартып отыру керек», — дейді маман.
Ал, Назарбаев университеті жанындағы Ақылды жүйелер мен жасанды интеллект институты (ISSAI) LLM — іздеу жүйелерінде, білім беру платформаларында, корпоративтік бағдарламаларда, мемлекеттік қызметтерде, ұлттық қауіпсіздік жүйелерінде және келесі буындағы өнімділік құралдарында қолданылатынын айтады.
«Ұлттық модельдерді дамыту арқылы елдер тілдік және мәдени ерекшеліктерді сақтай алады, деректер қауіпсіздігін қамтамасыз етеді, экономикалық пайданы өз экожүйесінде ұстап қалады, геосаяси тәуелділікті азайтады және жергілікті ЖИ таланттарын қалыптастырады. Яғни, ұлттық немесе тәуелсіз LLM жасау — бұл цифрлық тәуелсіздік, экономикалық тұрақтылық және жаһандық бәсекеге қабілеттілікке қатысты стратегиялық шешім», — делінген хабарламада.
KazLLM қашан пайда болды және оны әзірлеген кімдер?
Назарбаев университет жанындағы Ақылды жүйелер мен жасанды интеллект институты (ISSAI) KazLLM-нің не екенін және қайда пайдаланатынын түсіндіріп берді.
«Оны қарапайым тілмен былай түсіндіруге болады. Мысалы, қозғалтқыш – ол дайын көлік емес, бірақ барлық функцияны іске қосатын негізгі механизм. Ол түрлі көліктерді қуаттай алады. Сол сияқты KazLLM де ЖИ ассистенттері мен чат-боттардың негізгі компоненті. Мемлекеттік ассистенттер, корпоративтік чат-боттар немесе білім беру платформалары оның негізінде жасалуы мүмкін. Модель тек қозғалтқыш, ал практикалық қызметтер жасап шығару үшін қосымша әзірлемелер, дерек қорлары, құралдар және ауқымды инфрақұрылым қажет», — деп түсіндірді мамандар.
KazLLM-ді кімдер жасады?
KazLLM-ді 2024 жылдың сәуір-желтоқсан айларында Назарбаев Университетінің Ақылды жүйелер мен жасанды интеллект институты (ISSAI) жасап шығарды. Ол — машиналық оқыту, деректерді талдау ғылымы және компьютерлік инженерия салаларындағы қазақстандық жас зерттеушілерден құралған командамен жүзеге асырылды. Жобаны әзірлеу жұмысына ҚР Жасанды интеллект және цифрлық даму министрлігі, Ғылым және жоғары білім министрлігі, «Ұлттық ақпараттық технологиялар» АҚ, «Тіл-Қазына» ұлттық ғылыми-практикалық орталығы, QazCode (Beeline), MIND Group (Maqsut Narikbayev University), сондай-ақ жетекші университеттер мен ғылыми-зерттеу институттары қатысты.
KazLLM-нің неше нұсқасы бар және ол елге не үшін қажет
ISSAI KazLLM-нің екі нұсқасын әзірледі. Оның біріншісі жұмыс станциясы деңгейінде қолдануға арналған 8 миллиард параметрлі модель болса, екіншісі деректер орталықтарында енгізуге бағытталған 70 миллиард параметрлі модель. Модель Llama 3.1 архитектурасына негізделген, себебі сол кезеңде ол әлемдегі ең мықты ашық бастапқы кодты архитектуралардың бірі болған.
Жалпы, әлемнің көптеген елінде генеративті ЖИ модельдерін әзірлеуде ірі технологиялық компаниялар көш бастап тұр. Олардың қатарында OpenAI ChatGPT, Alibaba Qwen, Meta LLaMA, Anthropic Claude, DeepSeekAI бар. Бірақ елімізде, мемлекеттік емес, жеке сектордың ғылыми-зерттеу жұмыстарына (R&D — Research and Development) жұмсайтын шығындардың ЖІӨ-дегі үлесі төмен, әрі мұндай қызмет түрлері әдетте жеке сектор тарапынан жүзеге асырылмайды. Сондықтан, Үкімет академиялық зерттеу институтын осы қызметке тартқан.
«KazLLM-ді әзірлеу барысында жеке телекоммуникациялық компания бізге оқыту процесін жүргізу үшін 8 NVIDIA DGX H100 тораптарына қолжетімділікті берді, ал жеке қор команда жұмысына қажетті операциялық шығындарды қаржыландырды. Халықаралық тәжірибеде мұндай модельдер бенчмарк көрсеткіштері арқылы бағаланады. ISSAI KazLLM моделі тілдік түсіну, есеп шығару қабілеті, нақты деректерге негізделген білім және жалпы пайымдау дағдыларын жан-жақты бағалайтын кеңінен қолданылатын стандартты бенчмарктар негізінде тексерілді. Бенчмарктардың бір бөлігі қазақ тіліне бейімделді», — деді университет мамандары.
Сондай-ақ ISSAI жарияланған KazLLM модельдері жиынтық көрсеткіш бойынша Llama моделінің сәйкес бастапқы нұсқаларынан жоғары нәтиже көрсеткенін атап өтті. Олар 2024 жылдың желтоқсанында 70B KazLLM моделі GPT-4o көрсеткіштеріне өте жақын нәтиже көрсеткенін айтады.
Одан бөлек, KazLLM-ге тапсырыс беруші ҚР Үкіметі екені белгілі болды. Үкімет бұл шешімге шетелдік шешімдерге стратегиялық тұрғыда тәуелді болмау үшін, отандық модельді дамыту арқылы осы технологияның негізін түсіну әрі бейімдеу үшін келген.
KazLLM-нің ChatGPT-ден қандай айырмашылығы бар?
ISSAI мамандары ChatGPT мен KazLLM-нің айырмашылығын баяндады. Айтуларынша, ChatGPT қызмет көрсету экожүйесі бар толыққанды өнім болып есептеледі.
«ChatGPT бірнеше нұсқалы үлкен тілдік модельдерді, ақылды маршрутизация жүйелерін, веб іздеу мүмкіндіктерін, дерекқор, қауіпсіздік және модерацияны біріктіреді, ол — жаһандық деректер орталықтарында орналастырылған. Модель пайдаланушылардың кері байланысы мен жасанды интеллект зерттеулері негізінде үздіксіз жаңартылып отырады. Ең маңыздысы, оны қолдау үшін қомақты қаржы бөлінеді. Мысалы, OpenAI-дың жылдық операциялық және инфрақұрылым шығындары шамамен 1,4 триллион долларға жетеді деп күтіліп отыр. Мұндай қаржыландыру модельді үнемі жетілдіруді және оны жаһандық деңгейде орналастыруды қамтамасыз етеді», — дейді зерттеу институты мамандары.
Мамандардың сөзінше, KazLLM фундаменталды модель болып саналады. Ол жасанды интеллекттің негізгі қозғалтқышы, бірақ дайын жаһандық өнім емес.
«ChatGPT-ге ұқсас жүйе болу үшін оған іздеу құралдары мен дерекқорларды интеграциялау, пайдаланушыға арналған платформа жасау, үздіксіз қайта оқыту, қауіпсіздік жүйелерін енгізу және ірі деректер орталықтарында орналастыру қажет болады. Осылайша, жоғарыда аталған барлық дамытулар қомақты және тұрақты қаржылық инвестицияны талап етеді. Қарапайым мысал: KazLLM — бұл қозғалтқыш болса, ChatGPT — толық жинақталған, жыл сайынғы жаңартулар мен техникалық қызмет көрсету арқылы әлемдік деңгейде жұмыс істейтін дайын көлік», — деді мамандар.
Ал министрліктің түсіндіруінше LLM — бұл ЖИ-қосымшаларын құруға негіз болатын база болып саналады.
«ChatGPT — бұл пайдаланушылармен чат арқылы байланысу үшін осындай модельді қолданатын дайын қосымша. Басқаша айтқанда, LLM — бұл негіз, ал ChatGPT — сол негізде құрылған өнім», — деді министрлік мамандары.
KazLLM қазір қайда және қалай қолданылып жатыр?
ҚР Жасанды интеллект және цифрлық даму министрлігі ұсынған мәліметтерге сай, 2024 жылғы желтоқсанда KazLLM ведомтсво қарамағындағы Astana Hub-қа өтіп, мұнда жаңа буындағы AlemLLM моделі жасалған.
«AlemLLM қазақ, орыс және аралас тілдерді өңдеуге қабілетті. Бұл оның жергілікті контекстке жоғары дәрежеде бейімделуін қамтамасыз етіп, түрлі салаларда практикалық қолданылуын кеңейтті. Жалпы сұраныстар саны 480 мыңнан асты. Оның ішінде жеке сектордан — 420 мыңнан амтам, ал мемлекеттік органдар мен квазимемлекеттік сектордан — 60 мыңнан астам cұраныс түсті. AlemLLM негізінде 42 қолданбалы ЖИ өнімі әзірленуде. Мысалы, qazaq law — құқықтық консультант, консулдықтардағы мемлекеттік қызметтер бойынша агент және шетелдегі ҚР азаматтарына көмекші, мемлекеттік сатып алулар мен салық салу ережелері бойынша кеңес беретін агент, AI eGov және басқа салалық шешімдер», — деп түсіндірді құзырлы ведомство.
Одан бөлек, министрлік мәліметінше, ЖИ-ді корпоративтік экожүйеге ықпалдастыру аясында «Самұрық-Қазына» АҚ AlemLLM негізінде үш ЖИ-агентін енгізген:
- SK AI — цифрлық директорлар кеңесінің мүшесі;
- Ішкі нормативтік құжаттар бойынша агент;
- Нормативтік-құқықтық актілер бойынша агент.
AlemLLM сонымен қатар мемлекеттік суперкомпьютерде орнатылып, интернеттің қосылуынсыз жұмыс істейді. Демек, деректер ешқайда кетпейді және ел ішінде жабық күйінде сақталады. Ал, ChatGPT қосымшасымен мұны жасау мүмкін емес — ол шетелдік серверлер арқылы жұмыс істейді және деректер шетелге кетеді.
KazLLM және AlemLLM модельдеріне сұраныс бар ма?
ҚР ЖИЦДМ дерегінше, KazLLM және AlemLLM модельдері халықаралық Hugging Face платформасында қолжетімді, бұл көптеген компанияларға өз есептеу инфрақұрылымында оларды орнатуға мүмкіндік берді.
«Қазіргі таңда AlemLLM моделін 13 елдегі 135 компания жүктеп алған, олардың арасында ірі корпорациялар, банктер, стартаптар және жеке зерттеушілер бар. Алдағы уақытта AlemLLM моделін дамыту жоспарланып отыр, бұл жоба доктор Кай-Фу Лимен бірлесіп жүзеге асырылатын болады. Басым бағыттарға дауыс модельдерін жасау, сондай-ақ автономды түрде, интернетке қосылмай-ақ жұмыс істей алатын салалық шағын тілдік модельдерді әзірлеу кіріп отыр. Мұндай шешімдер әсіресе өнеркәсіптік жағдайларда, мысалы, шахталарда және басқа да шалғай нысандарда өте маңызды», — дейді құзырлы ведомство өкілдері.
Сонымен, KazLLM және AlemLLM модельдерін әзірлеу және енгізу — Қазақстанның ЖИ саласында тәуелсіз ойыншы ретінде қалыптасу жолындағы стратегиялық қадам болмақ. Ол мемлекеттік қызметтер көрсетудің тиімділігін арттыруға, ұлттық цифрлық экономиканы дамытуға, технологиялар мен деректерді бақылауды қамтамасыз етуге, шетелдік платформаларға тәуелді болмай, өз инновациялық өнімдерімізді жасауға, қазақстандық мамандар арасында ЖИ саласындағы құзыреттілікті арттыруға мүмкіндік береді.


