Meta* представила открытую ИИ-модель LLaMA 2 совместно с Microsoft19.07.2023 11:31

Meta* и Microsoft объединили усилия, чтобы запустить большую языковую модель LLaMA 2. Она будет открытой и позволит разработчикам и организациям создавать генеративные инструменты на базе ИИ.

neowin.net

Microsoft объявила о запуске модели на мероприятии Inspire 2023. Компания отметила, что вместе с партнёром разделяет приверженность к демократизации ИИ и его преимуществ.

Генеральный директор Meta Марк Цукерберг раскрыл дополнительную информацию о LLaMA 2 и объяснил её отличия от предшественника LLaMA 1. По его словам, новая модель была предварительно обучена и использованием на 40% большего объёма данных, чем первая версия, а также получила улучшенную архитектуру. Для её обучения разработчики собрали более 1 млн человеческих аннотаций, а также применили контролируемую доводку и обучение с подкреплением с обратной связью (RLHF) для повышения безопасности и качества модели.

LLaMA 2 можно будет бесплатно использовать в исследовательских и коммерческих целях. Протестировать языковую модель можно на платформах Microsoft Azure, Amazon Web Services, Hugging Face и других.

Компании будут сотрудничать в сфере развития искусственного интеллекта, чтобы составить конкуренцию ChatGPT от OpenAI.

В феврале Цукерберг представил модель LLaMA. Он заявил, что новая «LLM показала многообещающие результаты в создании текста, диалоге, обобщении письменных материалов и выполнении более сложных задач, таких как доказательство теорем или предсказание структуры белка». LLaMA представляет собой не единую систему, а «квартет моделей» разного размера. Она доступна в четырёх версиях: LLaMA-7B, LLaMA-13B, LLaMA-33B и LLaMA-65B, где цифры означают количество параметров — 7, 13, 33 и 65 млрд.

* Meta Platforms, а также принадлежащие ей Facebook** и Instagram**:
*признана экстремистской организацией,
**её деятельность в России запрещена