|
오픈 소스 분야의 큰 모델이 메가톤급 새로운 게이머를 맞이했다.
현지시간으로 수요일 (2월 21일), 과학기술거두인 구글은 신세대 오픈소스모델"Gemma"를 발표했는데 회사는 이를 경량급중"가장 선진적인"개방모델계렬로 원래 가장 강했던 Mistral 7B를 초월했다고 밝혔다.
구글 홈페이지에는 젬마가 라틴어로'보석'이라는 뜻으로 명명된 오픈 모델 시리즈인 젬마가 구글 딥마인드 등이 개발해 젬미 모델을 만드는 것과 같은 연구와 기술을 적용했다고 적혀 있다.
현재 Gemma 시리즈에는 개발자의 다양한 요구를 충족시키기 위해"Gemma 2B"와"Gemma 7B"라는 두 가지 가중치 규모의 모델이 있습니다.
성능 면에서 공식 페이지에 따르면 Gemma 7B는 MMLU (대규모 멀티태스킹 언어 이해) 에서 64.3% 의 점수를 받았다.같은 규모에서 원래 최강 미스트랄 7B의 득점률은 62.5%였고, 메타의 엘라마-2 7B와 13B도 모두 일정한 차이를 보였다.
Gemma도 HuggingFace와 HuggingChat을 가장 먼저 오픈하여 모든 사람들이 그 생성 능력을 시험해 볼 수 있습니다.
Hugging Face의 LLM leaderboard 중앙 집중식 차트에서도 Gemma의 2B와 7B 모델의 평균 점수는 각 매개변수 규모의 차트 상위권에 있습니다.
구글은 보도자료에서 젬마 2B와 7B가 다른 개방형 모델에 비해 동등한 매개변수 규모에서 가장 진보된 성능을 보여주며 심지어 일부 더 큰 모델을 앞질렀으며 이는 회사 최강의 AI 모델인 제미니와 기술과 인프라를 공유한 덕분이라고 썼다.
소프트웨어 엔지니어 제프 딘 (Jeff dean) 에 따르면 체량이 작지만 젬마 모델은 Llama-2 7B와 13B, 그리고 기세가 당당한 Mistral 7B를 비교하는 더 큰 모델을 주요 벤치마킹에서 분명히 추월했다.
Gemma는 개발자의 노트북이나 데스크탑에서 직접 실행할 수 있습니다.구글은 경량급 모델 외에도 협업을 장려하는 도구와 이를 책임감 있게 사용할 수 있는 지침을 내놓았다.
케라스 저자 Franois Chollet은 이에 대해 최강 오픈 소스 대형 모델의 위치가 이제 바뀌었다고 직접 말했다.
구글과 알파벳의 CEO 순다르 피차이 (Sundar Pichai) 는 젬마가 강력한 성능을 과시했으며 오늘부터 이 모델은 전 세계적으로 제공되며 노트북, 워크스테이션 또는 구글 클라우드에서 실행될 수 있다고 밝혔다.
Google DeepMind CEO Demis Hassabis는 경량 오픈 소스의 Gemma가 동급 크기 중 가장 성능이 좋은 모델이라고 밝혔다.
이제 구글은 OpenAI를 겨냥할 뿐만 아니라 모든 것을 차지할 계획이며, 새로운 모델은 저커버그의 Llama-2보다"크게 앞설 것"이라고 말했다.
구글은 앞으로 더 많은 젬마 변형을 출시하여 더 광범위한 응용 시나리오에 적응할 계획이다.현재 이들 모델을 사용하기 시작하려는 개발자는 데이터 과학 플랫폼인 카글(Kaggle), 구글의 코랩(Colab) 노트북이나 구글 클라우드를 통해 접근할 수 있다.
매일경제신문 종합 구글 홈페이지·공개 자료 |
|