“메타는 오픈소스를 오염시키고 있다”

2024-10-18

오픈소스이니셔티브(OSI)의 책임자인 스테파노 마풀리 총괄이사가 메타를 비난했다. 대형언어모델(LLM) 라마를 발표하며 ‘오픈소스’란 용어를 사용해 사용자를 혼란스럽게 하고 오픈소스를 오염시켰다는 주장이다.

스테파노 마풀리 OSI 총괄이사는 17일(현지시간) 파이낸셜타임스와 인터뷰에서 “메타가 라마 패밀리를 설명하는데 오픈소스란 용어를 사용함으로써 사용자를 혼란스럽게 하고, 오염시키고 있다”고 말했다.

마풀리는 “유럽위원회 같은 기관이 특정 회사의 통제를 벗어난 진정한 오픈소스 기술을 지원하려는 시기에 이런 행동은 극도로 해롭다”고 강조했다.

1998년 설립된 OSI는 ‘오픈소스’란 용어를 만들고, 개념을 정의한 비영리단체다. 시중에서 오픈소스란 용어를 사용하는 소프트웨어와 개발 프로젝트는 OSI에서 만든 정의와 가이드라인을 따른다.

현재 OSI는 ‘오픈소스 AI’의 정의를 수립하고 있다. 이달 하순 ‘오픈소스 AI’ 정의를 공식 발표할 예정이다. 지난달 오픈소스 AI 정의 초안이 공개됐다.

메타는 라마(llama) 모델을 발표하면서 오픈소스로 공유한다고 발표했다. 라마는 현재까지 4억회 이상 다운로드됐다. 하지만 메타 라마는 오픈소스가 아니다.

라마의 라이선스는 상용 서비스 개발에 제한을 두고 별도 유상 라이선스를 구매해야 한다는 조항을 담았다. 또한 모델의 모든 정보를 공개하지 않고, 특정 프롬프트에 어떻게 반응하는지 편향을 담은 가중치(weight)만 공개돼 있다.

사용자는 라마 모델의 코드를 무료로 다운로드 받고 미세조정할 수 있지만, 코드 수정과 변경을 통한 새 모델 개발은 불가능하다. 모델 개발에 사용된 학습 알고리즘과 소프트웨어 요소도 비공개다.

메타뿐 아니라 다수의 기업이 각자의 언어모델을 발표했지만, 완전한 투명성을 가진 모델은 극히 드물다. 대부분 메타처럼 가중치만 공개하고 실제 개발에 필요한 데이터와 학습 체계 등의 정보를 비공개로 하고 있다.

마풀리에 의하면, 구글과 마이크로소프트는 OSI와 협의를 통해 앞으로 완전히 개방하지 않은 모델에 오픈소스란 용어를 사용하지 않기로 했다. 메타는 OSI와 합의에 실패한 것으로 전해졌다.

마풀리는 “메타 같은 회사가 오픈소스를 자신의 이익을 위해 정의할 수 있는 일반 용어로 바꾸는 데 성공한다면, 그들은 다른 기관이 진정으로 개방적이 되도록 추진하는 표준에 수익을 창출하는 특허를 삽입할 수 있을 것”이라고 경고했다.

미스트랄 같은 회사는 오픈소스란 용어를 사용하다가 점차 ‘오픈 웨이트’라고 부르기 시작했다.

그동안 공개된 AI 모델에 오픈소스란 용어를 쓸 수 있느냐를 두고 많은 논쟁이 있었다. 오픈AI와 구글의 GPT-4와 제미나이 독점 속에서 메타의 라마는 구원처럼 여겨졌었다. 그러나 라마는 기존 오픈소스 정의를 붕괴시켜 버렸다.

메타가 라마의 가중치만 공개한 것을 두고 과연 오픈소스라 불러도 되느냐는 비난이 있다. 유사 행보를 보이는 여러 기업에도 같은 비판이 제기됐다. 진정한 투명성을 제공하라는 비난이었다.

반면, 모델 개발회사들은 각종 규제 때문에 데이터를 공유하는 건 불가능하다는 입장이다. 자세한 정보를 공개하는 것도 AI 모델을 악의적으로 변형해 사용할 수 있다는 점에서 난색을 표한다.

OSI는 묵은 오픈소스 정의를 손봐 AI를 어떻게 수용할 지 논의해왔다.

지난달 쿠베콘과 오픈소스서밋아시아에서 OSI는 ‘오픈소스 AI 정의(Open Source AI Definition)’의 초안을 공개했다. 이 초안을 토대로 다음 주 공식 안이 발표될 예정이다.

다만, 공개된 초안도 비판을 받고 있다. 지나치게 타협적이기 때문이다.

OSI 초안에 의하면, 이 정의는 AI 모델의 개방성 여부를 평가하는 3단계 기준을 제시한다. 최고위인 1단계는 데이터, 사용된 모든 구성 요소, 모든 지침 등을 모두 개방하는 것이다. 2단계는 모든 걸 공개하지 않지만 하위 집합을 공개한다. 3단계는 데이터의 일부와 데이터세트를 설명하는 데이터만 공개한다.

이는 AI 모델의 투명성을 덜 갖추고 오픈소스라 부르려는 독점 모델 개발자에게 뒷문을 제공하는 것이란 비판을 받는다. 현재의 오픈소스의 의미를 희석하고 향후 더 많은 혼란을 불러일으킬 것이란 비판도 제기됐다. 사용자의 실행, 복사, 배포, 연구, 변경 및 개선 등에 대한 무제한 권리를 보장하지 않기 때문이다.

톰 캘러웨이 아마존웹서비스(AWS) 오픈소스기술전략가는 “OSI가 잘못된 정의를 선택한 결정에 깊이 실망했다”며 “그들이 야심찬 목표를 이루길 바랐지만, 대신 열린 프로세스의 외관에 쌓인 동일한 변명과 타협을 받았다”고 성명서를 냈다.

그는 “OSI는 이끌 기회를 가졌지만, 이끌지 않기로 선택했다”며 “이제 질문은 누가 그들을 대신 이끌기로 선택할 것인가다”라고 했다.

글. 바이라인네트워크

<김우용 기자>yong2@byline.network

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.