Главная | ОБЩЕСТВО | Будущее цифровой Центральной Азии: как KazLLM меняет технологический ландшафт региона

Будущее цифровой Центральной Азии: как KazLLM меняет технологический ландшафт региона

QazCode – IT-компания из Казахстана, которая выросла из небольшого подразделения телеком-гиганта Beeline Казахстан в самостоятельного игрока на рынке технологий. Сегодня она известна своими инновациями в области искусственного интеллекта, цифровых платформ и автоматизации в телекоммуникационном секторе. Более того, QazCode стала победителем международной премии GSMA Foundry Excellence Award 2025 в категории «Искусственный интеллект». Премия была присуждена за выдающийся вклад компании в разработку KazLLM – казахстанской большой языковой модели.

Компания стремится создавать технологии, которые не просто впечатляют, а реально служат людям. О том, что отличает QazCode от других – рассказал Алексей Шаравар, СEO QazCode.

Основные направления деятельности QazCode

История QazCode началась с поддержки IT-инфраструктуры Beeline Казахстан, но амбиции компании быстро вышли за эти рамки. Сегодня QazCode обладает одной из крупнейших IT-команд в составе группы VEON, объединяющей телеком-операторов по всему миру. В 2023 году компания вышла на глобальный рынок, успешно завершив около девяти крупных проектов. Сейчас работа компании сосредоточена на трех ключевых направлениях:

  • разработка больших языковых моделей, таких как KazLLM;
  • создание цифровых сервисов – от игровых платформ до супераппов для бизнеса;
  • совершенствование биллинговых систем.

Благодаря опыту сотрудничества с мировыми компаниями, такими как Amdocs, в ближайшем будущем планируется выход на рынки финансов и электронной коммерции.

Стратегия QazCode для цифровизации государственного сектора Казахстана

Для сокращения языкового разрыва в развитии искусственного интеллекта и поддержки цифровой инклюзивности малоресурсных языков, QazCode в мае 2024 года объединилась с GSMA и Барселонским суперкомпьютерным центром (BSC). Это сотрудничество дало возможность обмениваться знаниями и ресурсами. Впоследствии в июне 2024 года началась работа с локальными партнерами и Министерством цифрового развития Казахстана.

«Собственные большие языковые модели есть далеко не в каждой стране. Компании вроде Google, Meta и OpenAI инвестируют в это сотни миллионов, а на локальном уровне многие думают, что это слишком сложно. Нам удалось выстроить сотрудничество с локальными партнерами и государством, чтобы вместе создать KazLLM – первую казахстанскую большую языковую модель. Наш совместный продукт сделал цифровые государственные услуги проще и удобнее для миллионов людей. Этот опыт бесценен для Узбекистана – местная языковая модель может стать мостом между сложными технологиями и обычными пользователями, ускорить цифровизацию страны и сделать ее услуги доступными даже в отдаленных регионах», – говорит Алексей.

Решения QazCode для госсектора, финансовых организаций и телеком-компаний

Компания разрабатывает системы оплаты и мобильные приложения для телекоммуникационного сектора, упрощая жизнь клиентам и операторам. Для правительства в партнерстве с Институтом умных систем и искусственного интеллекта Назарбаев Университета (ISSAI NU) и Astana Hub была разработана KazLLM – бесплатная модель с открытым кодом, которую можно адаптировать под любые задачи, от автоматизации документооборота до общения с гражданами. Для бизнеса доступны инструменты вроде программ лояльности и систем управления клиентами, способствующие росту компаний. В ритейле растёт интерес к геймификации, программам лояльности и CRM, и решения QazCode находят там применение.

Демонстрация KazLLM через языковую геймификацию на MWС.

Важность национальной KazLLM для стран с малыми языковыми группами

Глобальные модели, такие как GPT, отлично справляются с крупнейшими языками, например, с английским. Однако казахский язык, на котором говорят около 20 миллионов человек, не привлекает значительных инвестиций от крупных Big Tech корпораций из-за своей малочисленности. В мире насчитывается 7 тысяч подобных языков, и многие из них рискуют исчезнуть, не получив поддержки со стороны продвинутых ИИ-систем. 

«Локальная модель – это не просто переводчик, а полноценный помощник, который понимает язык, традиции и повседневные нужды людей. Узбекский и казахский языки имеют общие корни. Большая часть технической базы KazLLM уже готова и может быть адаптирована путём добавления данных на узбекском языке – текстов, записей, документов. Это ускоряет процесс и снижает затраты по сравнению с созданием модели с нуля. Опыт QazCode в сборе данных, обучении модели и её внедрении в реальную жизнь делает проект для Узбекистана вполне достижимым», – отмечает Алексей.

 Платформа KazLLM.

Стратегическая ценность локальной LLM для государственных учреждений, бизнеса и образовательных платформ

Локальная языковая модель обеспечивает государственным учреждениям, бизнесу и образовательным платформам независимость в обработке данных, сохраняя их внутри страны. Она адаптируется к местным языковым и культурным особенностям, что дает возможность создавать эффективные решения для поиска и анализа информации. Создание собственной модели требует разовых вложений, остаётся под полным контролем страны и не зависит от внешних факторов.

Организация работы консорциума для создания KazLLM

Организация консорциума с участием министерств, академических институтов, таких как ISSAI NU, и коммерческих партнёров, включая GSMA Foundry и BSC, стала ключом к успеху. QazCode предоставила вычислительные мощности, два миллиарда собранных токенов и профессиональную команду дата-сайентистов. GSMA и Барселонский суперкомпьютерный центр поделились руководствами и передовыми практиками по обучению языковых моделей. Министерство цифрового развития Казахстана помогло со сбором данных и другими вопросами, обеспечив принадлежность модели государству с самого начала. Большую роль сыграл ISSAI при Назарбаев Университете – они предоставили лингвистов и дополнительные датасеты. Это серьезное научное учреждение, где люди действительно глубоко понимают структуру языка.

Примеры успешной интеграции KazLLM в сервисы Beeline и другие

В Beeline Казахстан модель заменила GPT для более чем 3800 сотрудников, помогая с внутренними задачами и правилами. QazCode планирует запустить чат на базе KazLLM – локальный аналог решений от известных Big Tech компаний. Им смогут бесплатно пользоваться школы и университеты Казахстана, он будет работать на серверах QazCode.

«В супераппе Janymda, которым пользуются около 5 млн человек, мы запустили AI-Tutor – помощника для изучения казахского языка, где предложены разные сценарии: грамматика, словарь и так далее. Стандартные модели, вроде GPT, не дали бы нужного качества – ответы были бы упрощенными и далекими от школьной программы. Скоро она начнет обучать математике и истории – представьте, как похожий помощник мог бы поддерживать узбекистанских школьников или помогать местным компаниям с обучением сотрудников», – делится Алексей.

Премия за GSMA Foundry Excellence Award 2025 за KazLLM.

Более того, QazCode активно представляет свои разработки на международных выставках, таких как Mobile World Congress, и реализовала более десяти проектов в Узбекистане, Украине, Кыргызстане, Нидерландах, Бангладеше и ОАЭ. Это платформы для бизнеса, инструменты на основе ИИ и системы управления клиентами. В этом году компания планирует реализовать ещё десять проектов, расширяя влияние и доказывая, что казахстанский крафтовый код и технологии из Центральной Азии могут конкурировать на глобальном уровне.

Шаги для запуска национальной LLM в Узбекистане

При создании KazLLM огромную роль сыграло правильно выстроенное партнёрство. Для реализации проекта такого масштаба необходим консорциум, объединяющий бизнес в лице Beeline Uzbekistan, VEON и QazCode, университеты и лингвистов, у которых есть доступ к корпусу узбекского языка.

«Сегодня роль лингвистов как никогда важна – они знают, как устроен язык, как он меняется в зависимости от контекста и как правильно разметить тексты. Без лингвистов локальные LLM не построить. Наиболее важно участие государства – оно должно объединить партнёров, дать доступ к данным, вычислительные мощности и экспертов. Только совместно можно собрать базу, оцифровать, векторизовать и обучить качественную модель», – рассказывает Алексей.

Инфраструктурные, кадровые и нормативные условия для успешных AI-проектов

Запуск AI-проектов, подобных KazLLM, требует значительных ресурсов, включая минимум 8 DGX-серверов или 64 GPU для обработки свыше 150 миллиардов токенов. Команда из дата-сайентистов, разработчиков и лингвистов обеспечивает качество языка, токенизацию и точность данных. Открытость модели для некоммерческого использования и широкое вовлечение пользователей способствуют улучшению её точности и эффективности.

Роль QazCode в качестве технологического партнёра для узбекской LLM

В QazCode отмечают, что готовы выступить техническим партнёром, опираясь на опыт разработки KazLLM и взаимодействие с Барселонским суперкомпьютерным центром, специалисты которого участвовали в создании модели для каталонского языка. QazCode может присоединиться к узбекскому консорциуму с государством и университетами, дообучить модель на узбекском и, возможно, каракалпакском языках – последний близок к казахскому. Компания предлагает фреймворк партнёрства, распределение ролей, доступ к вычислительным мощностям по оптимальным ценам через VEON и большую команду с опытом.

Алексей Шаравар, СЕО QazCode.

«Моими источниками вдохновения при запуске KazLLM были две вещи. Первое – это то, как устроен язык внутри модели. Я раньше думал, что LLM – это просто «умный Т9», но когда мы начали строить KazLLM, открылся целый мир: токенайзер – как дерево с ветвями и листьями, каждая деталь – живая часть языка.

Второе и самое главное – мы смогли сделать KazLLM открытой моделью. Это был принципиальный момент. KazLLM доступна всем – и государству, и бизнесу, и обычным пользователям. Это то, что делает её по-настоящему значимой. Мы создали не просто технологию, а инструмент, который может приносить пользу всей стране», – рассказал Алексей.

Алексей также подчеркнул, что лидеры подобных проектов должны быть настойчивыми, рассказывая, что изначально к идее национальной LLM относились скептически, что потребовало многочисленных встреч с инстанциями и партнёрами для обоснования её ценности. По мнению CEO QazCode не менее важно в работе над проектами такого масштаба – терпение. В отличие от быстрых стартапов, идея KazLLM заняла почти три года на реализацию. Мало кто готов столько ждать, но благодаря упорству удалось добиться цели. Ян Лекун, вице-президент Meta, отметил высокое качество модели, что стало возможным благодаря несгибаемому стремлению.

Работа QazCode в Казахстане демонстрирует, как технологии могут служить людям, отражая их язык и культуру. KazLLM стала примером инноваций, решающих реальные задачи – от обучения детей до упрощения работы чиновников. Сегодня у Узбекистана есть возможность пойти по тому же пути, создав локальную языковую модель, учитывающую культурные и языковые особенности страны.

На правах рекламы.

Источник