Сбер определил список академических команд, которым будет предоставлена возможность для проведения экспериментов с дообучением и донастройкой нейросетевых моделей, на базе которых работает GigaChat. Команды вузов, отобранные экспертами Сбера, в число которых вошла объединенная команда студентов НИТУ МИСИС и МГУ имени М.В. Ломоносова, получат доступ к платформе ML Space и ресурсы, необходимые для экспериментов.
Основная задача, которую поставила перед собой сборная Университета МИСИС и МГУ имени М.В. Ломоносова, — научить языковую модель корректно цитировать заслуживающие доверия источники. При помощи платформы ML Space студенты планируют научить языковую модель подкреплять свои слова цитатами и ссылками так, как это принято делать в научных публикациях.
Цитирование в научных работах — это отдельное языковое явление, структура которого сложнее линейного текста. Цитирование — это взаимосвязь между текстами, оно бывает дословным, но чаще всего это парафраз, для которого в цитируемом документе, существует близкий фрагмент, но его местоположение неизвестно.
Источником текстовых данных для обучения навыку цитирования станут коллекции научных публикаций. В планах команды — дообучить большую языковую модель на англоязычной коллекции Semantic Scholar и русскоязычной коллекции научной электронной библиотеки eLibrary, научившись при этом моделировать цитирование в явном виде. То есть, места в тексте с добавлением дословного цитирования и цитирования со ссылкой будут отмечаться специальными токенами.
В дальнейшем студенты планируют получить модель, способную по контексту давать адекватную цитату и ссылку на научную публикацию на русском или английском языке.
В состав команды от Университета МИСИС вошли студенты Института компьютерных наук Данило Малбашич, Даниил Стрижаков и Егор Коновалов, также являющийся сотрудником Лаборатории компьютерного моделирования новых материалов. Научный руководитель команды профессор РАН, д.ф.-м.н., Константин Воронцов.
В список также вошли команды из представителей НИУ ВШЭ, РАНХиГС, Университета Иннополис, Петрозаводского государственного университета и гимназии № 63 Санкт-Петербурга.
Андрей Белевцев, старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка: «Вовлечение академического сообщества в совместные исследования и разработки является важнейшим элементом построения надёжного и этичного искусственного интеллекта. Поэтому я благодарю всех, кто подал заявки на участие в нашем отборе, и поздравляю победителей. Теперь вы станете частью команды, которая работает над совершенствованием одного из самых прорывных решений в области технологий искусственного интеллекта. Уверен, что вместе мы сможем расширить возможности GigaChat и сделать его одним из сильнейших сервисов в мире. Хочу подчеркнуть, что этот конкурс лишь начало такой работы. Мы планируем ещё больше вовлекать вузы в нашу работу».