"오픈 소스"가 아닌 Gemma를 개방하는 구글은 왜 큰 모델 경쟁 전략을 전환합니까?
明绍宗朱聿键鼻
发表于 2024-2-22 16:19:09
242
0
0
미국의 거대 기술 기업인 구글은 대언어 모델 분야에서 OpenAI와 Meta를 지속적으로 공격하고 있다.
2월 21일 저녁, 구글은 차세대 무료 상업용 대언어 모델인 젬마를 전 세계에서 개방하여 사용한다고 발표했다.이 모델은 구글이 자체'최첨단 개방형 모델'로 보고 있다.
이것은 이 회사가 AI 대형 모델을 개방하는 분야에서 한 큰 움직임이다.Tris Warkentin 구글 DeepMind 제품 관리 디렉터는"오픈 모델은 구글에 새로운 기회"라며"커뮤니티와 구글 이외의 사람들과 협력해 AI 개발에 새로운 기회를 만들 수 있다"고 말했다.
라틴어'보석'에서 이름을 얻은 젬마는 텍스트 정보만 처리하는 데 사용되며, 구글의 최강 AI 모델인 젬니와 일치하는 인프라 아키텍처를 가지고 있지만, 20억 매개변수와 70억 매개변수 두 가지 규모의 버전만 있는 작은 매개변수 규모이며, 두 가지 매개변수 규모의 젬마 모델은 모두 사전 훈련과 명령 미세 조정 버전이 있을 것이다.
작은 매개 변수 크기는 Gemma를 보다 광범위하게 배포하는 데 도움이 됩니다.젬마는 메인스트림 AI 프레임워크를 지원하며 노트북, 데스크탑, 사물인터넷, 모바일 기기, 클라우드 등에서도 작동한다고 구글은 설명했다.
이 회사가 발표 한 평가 결과에 따르면 Gemma는 수학, 코딩, 추론 정통성 및 지식 테스트 등 많은 외부 벤치마크 테스트에서 Llama 2 모델보다 우수합니다.Llama 2는 메타가 발표한 최신 오픈 소스 모델로, 70억, 130억, 700억 매개변수의 모델을 포함하고 있다.
특히 구글은 젬마를'오픈 소스'가 아니라 오픈 소스'라고 강조하는데, 이는 젬마의 소스 코드, 훈련 데이터 등 젬마의 다양한 기술 세부 사항을 공유하지 않는다는 것을 의미한다.앱에서 구글은 사용 약관이 모든 조직이 책임감 있게 상용화하고 배포할 수 있도록 허용한다고 밝혔다.
Gemma를 개방하거나 오픈 소스 대형 모델 분야에서 비판받는 부분에 대한 대응.앞서 구글과 오픈AI는 기술 폐쇄를 고수해 외부의 비난을 받았는데, 둘 다 최신, 최첨단 모델에서 모두 폐쇄원을 선택해 기술 진보에 불리한 것으로 여겨졌다.
이에 대해 시나웨이보 신기술 연구개발 책임자 장준림은 젬마는 구글의 대형 모델 전략의 전환을 대표한다-오픈 소스와 오픈 소스를 모두 고려하고, 오픈 소스는 성능이 가장 강력한 소규모 모델을 주력하며, 메타와 미스트랄 (유럽 AI 회사, 미스트랄 7B 오픈 소스 AI 모델 출시) 을 이기기를 희망한다;폐원은 규모가 큰 효과가 가장 좋은 큰 모델을 주력해 가능한 한 빨리 OpenAI를 따라잡으려 한다.
AI 커뮤니티에서 현재 메타의 Llama 2는 가장 강력한 오픈 소스 모델 중 하나였으며, 이 모델 정보와 소스 코드는 무료 상용화를 지원하기 때문에 많은 AI 개발자들의 지원을 받고 있다.
Google은 Gemma를 통해 더 많은 개발자를 Google 클라우드 생태계에 끌어들이기를 희망하는 것이 분명합니다.한편, 젬마는 구글이 자체 개발한 클라우드 AI 칩 TPU를 최적화해 더 나은 효능을 발휘할 수 있다고 주장했다.이와 동시에 구글 클라우드 신규 사용자는 또 300딸라의 클라우드 포인트를 획득하여 젬마를 연구하게 된다.
또한 젬마는 엔비디아 칩에서 실행될 수 있으며, 클라우드 데이터 센터, PC 측면에서 이 모델의 추론 성능을 가속화하기 위해 양측이 협력하여 최적화할 수 있을 것이다.예를 들어 젬마를 엔비디아 GPU를 탑재한 AI PC에 사용하여 로컬 챗봇 소프트웨어를 구동하고 엔비디아의 여러 AI 도구와 통합한다.
OpenAI, 구글, 메타 등 대형 기술 회사들의 대형 모델 전쟁은 갈수록 치열해지고 있다.
구글은 2023년 3월 AI 대화로봇 배드를 출시하고 지난해 5월 최신 폐원 대언어 모델인 PaLM2를 선보였다.지난주, 이 회사는"차세대 AI 대형 모델"인 Gemini 1.5를 관선하면서 여러 면에서 OpenAI의 GPT-4 터보를 추월했다고 밝혔다.메타는 모델 오픈 소스에 열중하며 Llama 2가 가장 유명하다.
최근 OpenAI가 발표한 문생 동영상 모델 Sora는 다시 AI 서클을 폭발시켜 다른 대형 모델 회사와의 거리를 더욱 벌렸다.구글이 최종적으로 OpenAI를 따라잡으려면 여전히 많은 불확실성으로 가득 찰 것이다.
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- DeepMind 오픈 소스 생체 분자 예측 모델 노상 성과는 AI 제약 물결을 일으킬 것인가?
- 바이두 리언굉: 지난 24개월간 AI 업종의 가장 큰 변화는 큰 모형이 기본적으로 환각을 제거한것이다
- "AI 신세대"대모형제조업체 일제히"권"지능체, 리언굉은"생각으로 돈을 벌수 있는 시대"를 맞이하게 된다고 말했다.
- 알리 통의 천문 코드 모델 Qwen2.5-Coder 전 시리즈 정식 오픈 소스
- 극크립톤, 전계차종과 함께 광주모터쇼 첫 광대한 지운전 2.0 종단간 Plus 구조 선보여
- 문심일언 사용자 수 4억 돌파, 바이두 오단: 큰 모형이 산업 스마트 엔진을 재창조하고 있다
- 올해 10월 테슬라 모델 Y가 일선, 신일선 도시 모델 판매 1위를 차지했다
- 알리바바 CEO 오영명: AI 발전은 부동한 규모, 부동한 령역의 개원대모형이 필요하다
- 바이두 Q3 핵심 순이익 17% 증가 예상 초과 문심대 모델 하루 조정량 15억
-
상해증권보 중국증권넷소식 (기자 손소정): 11월 20일, 문원지행 WeRide는 산하의 자동운전환경위생차 S6 (이하"문원환경위생차 S6"라 략칭함.) 와 무인도로청소기 S1이 이미 각각 싱가포르 빈해만해안대로 (Marina ...
- 蜜桃成熟时
- 그저께 20:18
- Up
- Down
- Reply
- Favorite
-
중증넷소식 (기자 고개방): 11월 19일, 금융과학기술그룹 신도과학기술 (NYSE: FINV) 은 2024년 3분기 회계감사를 거치지 않은 재무보고를 발표했다.회사의 3분기 매출은 32억 7600만 위안 (인민폐, 이하 같음) 으 ...
- Cherry95
- 3 일전
- Up
- Down
- Reply
- Favorite
-
11월 19일, 애플 중국공식사이트는 보기 드물게 App상점과 국내 App개발자의 수익상황을 발표했는데 한 국내 대학교수의 연구보고를 인용하여 풍랑에 떠오른"애플세"논란에 측면적으로 대답했다. 얼마 전 # 애플 위 ...
- 世雨8
- 그저께 19:05
- Up
- Down
- Reply
- Favorite
-
AI 서버 제조사 초미세 컴퓨터,'숨통'기회 얻다! 미국 주식의 야간 거래에서 초마이크로컴퓨터의 주가는 한때 50% 가까이 급등했다.증권사 중국 기자가 원고를 발송할 때까지 이 회사의 주가 상승폭은 여전히 40% ...
- 蜜桃成熟时
- 3 일전
- Up
- Down
- Reply
- Favorite