Фото: Yandex Uzbekistan
Yandex Uzbekistan на презентации 29 июля представил обновлённый поиск Yandex Search с нейросетью, который обрабатывает запросы и даёт ответы на узбекском языке, передаёт корреспондент «Газеты».
Благодаря нейросети Yandex Search стал лучше понимать запросы на узбекском языке и может давать ёмкие ответы, агрегируя информацию со всего интернета с переводом на язык пользователя.
Пользователи теперь могут задавать вопросы Yandex Search в чате и получать на них ответы. Спрашивать можно по-узбекски или по-русски, и ответ будет на соответствующем языке. Можно также задать вопрос, на который может не быть готового ответа в интернете. К примеру, сервис порекомендует достопримечательности Бухары, которые можно успеть посетить за один день.
Реклама на Gazeta
Новая возможность доступна на главной странице сервиса — yandex.uz. Ответ на вопрос появляется в результатах поисковой выдачи над ссылками на сайты.
Иззат Шукуров. Фото: Yandex Uzbekistan
«Анализируя запросы, мы видим: люди задают вопросы на узбекском языке, а ответы получают на другом. Человеку постоянно приходится переключаться с одного языка на другой. Это и стало основным драйвером, почему мы считали, что такой проект действительно необходим. Мы хотим, чтобы пользователи Узбекистана, в первую очередь молодёжь, чувствовала себя свободно в интернете и имела доступ к нужной информации».
Иззат Шукуров отметил, что компания проделала огромную работу: для того, чтобы сделать доступным для узбекоязычной аудитории большое количество разноплановой информации, были переведены на узбекский язык 11,6 миллионов текстов. Среди них материалы Wikipedia и Stack Overflow — международной платформы с вопросами и ответами для IT-специалистов. «Это даёт людям доступ к знаниям», — сказал руководитель Yandex Uzbekistan.
СЕО международного Yandex Search Александр Поповский уточнил, что проект, созданный специально для Узбекистана, включая перевод текстов и обучение нейросети различным диалектам узбекского языка, несмотря на очевидную трудоёмкость и затраты, — социальный.
«В отличие от глобальных компаний, в основном американских, у которых стратегия иметь единый продукт на весь мир — как они говорят, „one size fits all“, „один размер для всех“, — мы, наоборот, работаем отдельно для тех стран, которые выбрали для развития. Мы хотим построить Yandex Uzbekistan как настоящую локальную компанию. Чтобы нас воспринимали не как филиал далёкой корпорации, а как компанию, где узбекистанцы делают продукты и сервисы для Узбекистана».
Как создавался поиск с нейросетью и узбекским языком?
Работа над продуктов шла больше восьми месяцев. Над проектом работала, по словам Иззата Шукурова, огромная локальная команда в Узбекистане.
«В первую очередь асессоры, которые помогают нам находить правильные ответы на запросы пользователей. Например, вы спрашиваете, как приготовить плов, — и человек вручную помогает нам определить, какой ответ будет самым релевантным. Это первая большая часть работы, которую выполняют асессоры», — отметил он.
Среди асессоров, привлечённых компанией, были журналисты, преподаватели и профессиональные лингвисты. За три месяца до запуска проекта Yandex Uzbekistan набрал более 300 человек, которые помогли построить диалоговую модель и обучали систему работе с диалектами.
Александр Поповский. Фото: Yandex Uzbekistan
По словам Александра Поповского, раньше работа асессора была довольно простой, нужно было выбрать из предложенного, какие результаты поиска лучше. Сейчас такие задачи выполняют нейросети. А асессоры, которые нужны теперь, — это более профессиональные сотрудники, редакторы. Их задача — определить, как правильно изменить обобщённый ответ, соответствует ли его смысл запросу. Именно такие специалисты сегодня тренируют нейросети.
Кроме того, над проектом работали более 170 инженеров в Узбекистане, которые помогали собирать продукт и адаптировать его к узбекскому языку.
Планы на будущее
Назвать предполагаемый охват аудитории новым продуктом разработчики затруднились, но мыслят глобально.
«В нашей экосистеме (подразумевается экосистема продуктов Yandex в Узбекистане — ред.) сейчас — более шести миллионов человек. Уверены, что сможем привлечь их в Yandex Search», — сказал Иззат Шукуров.
Сама страна как рынок — «в очень хорошем, здоровом состоянии», отметил он. «У нас ежегодно на рынок труда выходит около 700−800 тысяч человек. Столько же поступают в университеты. Мы с гигантской надеждой смотрим в сторону этих ребят — что они будут пользоваться нашими технологиями, нашими продуктами. Поэтому, когда я говорю „миллионы человек“, я не преувеличиваю», — подчеркнул он.
Фото: Yandex Uzbekistan
Разработчики отметили, что Yandex Uzbekistan активно взаимодействует с властями страны по множеству направлений. Как компания, уже реализовавшая продукт с нейросетью, она готова и к сотрудничеству по созданию узбекской национальной языковой модели, которую анонсировал недавно президент Узбекистана. Недавно сообщалось, что к сбору корпуса текстов для обучения языковой модели уже подключился финтех-бизнес, в том числе TBC Bank и Uzum.
«Мы открыты к такому партнёрству. Очень важно, что государство уделяет этому внимание. Потому что большие языковые модели — это следующий фронт борьбы за независимость, за суверенитет. Мы видим, как всё больше людей получают информацию через нейросети — будь то учёба, новости, политика. И если государство хочет выстраивать независимую национальную политику и защищаться от внешнего влияния, то в эту сферу нужно активно инвестировать. Мы как технологические эксперты и как технологическая компания готовы участвовать в этом процессе, делиться экспертизой», — заключил Александр Поповский.