ИИ без секретов: OLMo вступает в гонку открытых языковых моделей

17:00 / 5 февраля, 2024

Тотальная прозрачность обучающих данных как ключ к созданию компьютерного интеллекта нового поколения.

Институт искусственного интеллекта Аллена (AI2), некоммерческая исследовательская организация, основанная в 2014 году ныне покойным сооснователем Microsoft Полом Алленом, объявила о выпуске OLMo — «полностью открытой, соответствующей современным требованиям крупномасштабной языковой модели», предлагающей современную «альтернативу существующим закрытым и ограничительным моделям» и стимулирующей «критический перелом» в разработке ИИ.

В отличие от других моделей, которые предоставляют только код и весовые параметры модели, OLMo также предоставляет код обучения, данные для обучения, сопутствующие инструменты, а также инструменты оценки. Кроме того, OLMo распространяется под лицензией, одобренной Инициативой открытого исходного кода, а все сопутствующие элементы доступны под лицензией Apache 2.0.

В настоящий момент большие языковые модели на основе открытого исходного кода сильно отстают от закрытых моделей крупных корпораций, включая OpenAI и Anthropic. С появлением OLMo всё должно измениться в лучшую сторону, однако и остальные игроки рынка вроде Meta * с её открытой Code Llama тоже не сидят на месте.

В то же время, ИИ на основе открытого исходного кода продолжает подвергаться критике со стороны некоторых исследователей, регуляторов и политиков. Например, недавняя статья издания IEEE Spectrum озаглавлена как «Открытый ИИ однозначно опасен», в связи с тем, что незащищённый искусственный интеллект обладает якобы куда большим потенциалом для облегчения производства опасных материалов.

Несмотря на это, OLMo предлагает «полностью открытые» инструменты для разработки ИИ, доступные общественности. Исследователи из AI2 заявили о намерении продолжить работу над OLMo, варьируя размеры моделей, модальности, наборы данных и их возможности.

«Многие сегодняшние языковые модели публикуются с ограниченной прозрачностью», — сказала Ханна Хаджиширзи, руководитель проекта OLMo и старший директор по исследованиям в области NLP в AI2. «Однако без доступа к данным для обучения исследователи не смогут научно понять, как работает модель. Это равносильно открытию лекарств без клинических испытаний или изучению солнечной системы без телескопа», — считает она. «С нашей новой структурой исследователи наконец смогут изучать науку LLM, что критически важно для создания следующего поколения безопасного и надёжного ИИ».

Нейтан Ламберт, учёный в области машинного обучения из AI2, написал в LinkedIn, что «OLMo представляет новый тип LLM, позволяющий принимать новые подходы к исследованию и развёртыванию машинного обучения, поскольку по ключевому аспекту открытости OLMo представляет собой нечто совершенно иное.

OLMo создан для того, чтобы учёные могли разрабатывать исследовательские направления на каждом этапе процесса разработки и реализовывать их, что ранее было невозможно из-за неполной информации и инструментов».

Многие в сообществе ИИ на открытом исходном коде приветствовали новости о запуске OLMo. Так, Джонатан Франкл, главный исследователь в MosaicML и Databricks, назвал выпуск OLMo AI2 «огромным шагом для открытой науки». Технический директор Hugging Face также выразил мнение, что новая модель «продвигает границы открытого ИИ».

«Открытые основные модели были критически важны для стимулирования всплеска инноваций и разработок вокруг генеративного ИИ», — заявил Янн ЛеКун, директор подразделения искусственного интеллекта в Meta. «Живое сообщество, возникающее из открытого исходного кода, является самым быстрым и наиболее эффективным способом построения ИИ будущего».

* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.

0-day в деле

ИИ без секретов: OLMo вступает в гонку открытых языковых моделей

Старость — это просто ошибка кода

Подпишитесь на email рассылку