구글 개방 경량급 대형 모델 젬마 전 국민 AI 시대가 온다?
茉莉707
发表于 2024-2-22 11:24:23
221
0
0
구글은 2월 21일 새로운 인공지능'오픈 모델'젬마를 발표했다. 큰 모델을 오픈소스로 여는 것은 외부 개발자가 자신의 모델로 만들 수 있다는 것을 의미한다.구글도 메타에 이어 오픈 소스 대형 모델의 경로를 밟으려는 또 하나의 주요 기술 회사가 되었고, 전 국민 AI 시대의 도래를 가속화했다.
구글은 젬마가 일련의'경량급'선진적인 개방형 모델로, 제미니 모델을 만드는 것과 같은 연구와 기술로 구축됐다고 밝혔다.개발자는 젬마'오픈 모델'시리즈를 이용해 인공지능 소프트웨어를 무료로 구축할 수 있다.이 회사는 소위"모델 가중치"와 같은 주요 기술 데이터를 공개하고 있다고 밝혔다.
선다르 피차이 (Sundar Pichai) 구글 CEO는"젬마는 강력한 성능을 보여주며 오늘부터 노트북이나 구글 클라우드에서 실행할 수 있는 전 세계적으로 제공될 것"이라고 말했다."
시장에서는 구글이 대형 모델을 오픈소스화하면 소프트웨어 엔지니어들이 구글의 기술을 바탕으로 개발하도록 유도하고 새로 수익을 내는 클라우드 부문의 사용을 장려할 수 있을 것으로 분석하고 있다.구글은 이들 모델이 구글 클라우드에도 최적화됐다고 밝혔다.
그러나 Gemma도 완전히"개원"된 것은 아니며, 이는 회사가 여전히 이 모델을 사용하는 조항 및 소유권 조항을 제정할 수 있다는 것을 의미한다.
소개에 따르면 Gemma 모델은 구글이 이전에 발표한 Gemini 모델에 비해 매개변수가 더 작을 수 있으며 20억 개 또는 70억 개의 매개변수 버전을 선택할 수 있다.구글은 아직 가장 큰 Gemini의 매개변수 크기를 밝히지 않았다.
구글은 "Gemini는 오늘날 우리가 널리 사용하는 가장 크고 강력한 AI 모델"이라며 "Gemma 모델은 개발자 노트북이나 데스크톱 컴퓨터에서 직접 실행할 수 있는 기술 및 인프라 구성 요소를 Gemini와 공유한다"고 밝혔다.
이 회사는 또 젬마가 핵심 기준에서 매개변수가 더 큰 모델을 넘어 안전하고 책임 있는 출력의 엄격한 기준을 준수하고 있다고 강조했다.
이전에 오픈 소스 Meta의 Llama 2 모델 매개변수는 최대 700 억 개에 달했습니다.이에 비해 OpenAI의 GPT-3 모델은 1750억 개의 매개변수를 보유하고 있다.
구글이 발표한 기술 보고서에서 이 회사는 젬마 70억 매개변수 모델을 Llama 2 70억 매개변수, Llama 2 130억 매개변수 및 Mistral 70억 매개변수 몇 개 모델과 서로 다른 차원으로 비교했다. 문답, 추리, 수학/과학, 코드 등 벤치마킹 방면에서 젬마의 점수는 모두 경쟁자를 이겼다.
엔비디아는 젬마 대형 모델을 발표할 때 이미 구글과 협력하여 젬마 모델이 자사의 칩에서 순조롭게 작동하도록 확보했다고 밝혔다.엔비디아는 또 젬마와 함께 사용할 챗봇 소프트웨어를 곧 개발할 것이라고 밝혔다.
작은 매개변수의 AI 모델을 개방하는 것도 구글의 비즈니스 전략이다.이전에 iFLYTEK 또한 더 작은 매개변수 크기 모델을 오픈 소스로 선택했습니다.
유경봉 iFLYTEK 회장은 제일재경 기자에게"범용 대형 모델은 누구의 성능이 좋은지를 보는 것이 관건이고, 대형 모델의 오픈 소스는 생태를 구축하기 위한 것이기 때문에 기술 수준으로 볼 때 일반 오픈 소스 대형 모델은 범용 대형 모델보다 약간 낮을 것"이라고 설명했다."
"우리는 또한 많은 기업들이 자신의 가장 큰 그 모형을 숨기고 있는 것 같다. 아마도 장벽을 세워 상업화를 할 수 있기를 바랄 것이다."라고 AI 대형 모형 연구개발에 종사하는 한 연구자는 제일재경 기자에게 말했다.
오픈 소스 대형 모델에 대해서도 현재 다른 견해가 있는데, 일부 전문가들은 오픈 소스 AI 대형 모델이 남용될 수 있다고 생각하지만, 다른 일부 전문가들은 오픈 소스 방법을 지지하며, 이는 기술 발전을 추진하고 수혜자를 확대할 수 있다고 생각한다.
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- OpenAI뿐만 아니라!애플, 여러 AI 회사와 손잡고'AI 대형 모델 스토어'조성 전망
- 애플 AI 대형 모델'손잡기'구글 TPU 엔비디아, 위협 느꼈나?
- 경동기술책임자: 큰 모형은 하면 할수록 작아지고 심지어 장면까지 세분화할수 있다
- 경동 조붕: 큰 모형으로 수실 융합 촉진 조준 단순, 개방, 안전 세 가지 발력점
- 문심일언 App 명칭 변경 문소언, 9월 문심 4.0 대모델 비용 면제
- 알리 CEO 오영명: 다음 단계 선진모델 투입 문턱은 수십억, 수백억 달러 급
- 대화 바이두 리도: 자동차 지능화와 대형 모델의 물결이 겹치는 것은 역사의 필연이다
- 하소붕: 소붕차단대모형 래년 목표 100킬로메터 1회 인수 실현
- 리언굉은 다음과 같이 말했다. 큰 모형의 환각은 기본적으로 실측문심일언을 제거했는데 도대체 어떠한가?
- AI 주간지 양식린은 kimi의 월 생활이 3600만 명을 넘어섰다고 밝혔습니다.리언굉: 큰 모형의 환각은 기본적으로 제거되였다
-
상해증권보 중국증권넷소식 (기자 손소정): 11월 20일, 문원지행 WeRide는 산하의 자동운전환경위생차 S6 (이하"문원환경위생차 S6"라 략칭함.) 와 무인도로청소기 S1이 이미 각각 싱가포르 빈해만해안대로 (Marina ...
- 蜜桃成熟时
- 그저께 20:18
- Up
- Down
- Reply
- Favorite
-
11월 19일, 애플 중국공식사이트는 보기 드물게 App상점과 국내 App개발자의 수익상황을 발표했는데 한 국내 대학교수의 연구보고를 인용하여 풍랑에 떠오른"애플세"논란에 측면적으로 대답했다. 얼마 전 # 애플 위 ...
- 世雨8
- 그저께 19:05
- Up
- Down
- Reply
- Favorite
-
AI 서버 제조사 초미세 컴퓨터,'숨통'기회 얻다! 미국 주식의 야간 거래에서 초마이크로컴퓨터의 주가는 한때 50% 가까이 급등했다.증권사 중국 기자가 원고를 발송할 때까지 이 회사의 주가 상승폭은 여전히 40% ...
- 蜜桃成熟时
- 3 일전
- Up
- Down
- Reply
- Favorite
-
11월 19일, 한 존슨앤드존슨 내부인사는 21세기 경제보도에 존슨앤드존슨 중국은 이미 새로운 감원조정을 시작했는데 주로 외과부문이라고 알려주었다. "현재 외과 업무가 받는 시장 충격은 비교적 크다. 사실 기업 ...
- 明绍宗朱聿键鼻
- 3 일전
- Up
- Down
- Reply
- Favorite