메타, 최신 오픈 소스 대형 모델 Llama 3 발표, OpenAI 지속 추격
panqinlai
发表于 2024-4-19 11:13:57
5441
0
0
4월 18일 (현지 시각) 메타는 8B와 70B의 사전 훈련 및 명령 미세 조정 버전을 제공하는 최신 오픈 소스 모델인 Llama 3를 발표했다.이는 지금까지 가장 선진적인 오픈 소스 모델로 OpenAI를 포함한 대형 모델 회사에 강력한 경쟁을 형성할 것이며, 오픈 소스 모델에 의존하는 많은 인공지능 회사에도 혜택을 줄 수 있다.
큰 시세가 소폭 하락한 가운데 메타 주가는 1.54% 상승했다.
메타의 공식 소개에 따르면 Llama 3는 두 개의 맞춤형 24K GPU 클러스터에서 15T 이상의 데이터를 기반으로 훈련했다. 이는 Llama 2가 사용하는 데이터 세트보다 7배, 4배 많은 코드이며 Llama 3는 8K 컨텍스트 길이를 지원하며 Llama 2 용량의 두 배이다.
메타 공식
또한 메타는 엘라마 3 두 버전과 구글 젬마, 구글 제미니, 미스트랄, 앤트로픽의 클라우드 3 등 경쟁사의 매개변수를 비교했다.
사용자들에게도 메타 자체 출시한 메타 AI를 통해 엘라마3를 느낄 수 있다.저커버그 메타 CEO는 메타 AI가 메타 산하 주요 제품인 왓츠앱, 인스타그램, 페이스북, 메신저 상단의 검색창에 통합되고 웹사이트 메타.ai를 만들어 쉽게 사용할 수 있도록 했다고 설명했다.
메타의 수석 과학자 Yann LeCun에 따르면 앞으로 몇 달 동안 Llama는 더 많은 버전을 계속 출시 할 것이며 Llama 3의 연구 논문도 곧 출시 될 것입니다.엔비디아의 수석 과학자 짐 팬은 나중에 발표 될 수있는 Llama 3-400B 이상의 버전이 GPT-4 수준의 모델을 사용할 수있는 일종의"분수령"이 될 것이라고 생각합니다.
주목할 만한 것은 Llama 3의 출시가 이전 버전처럼 오픈 소스 커뮤니티의 센세이션을 불러일으켰지만, 이번 주 초 바이두의 창업자 리옌훙은 오픈 소스 모델이 점점 더 뒤처질 것이라고 공개적으로 밝혔다.
리옌훙에 따르면 개발자가 바이두의 문심 4.0 다운그레이드를 통해 재단한 더 작은 사이즈 모델은 소스 모델을 직접 꺼내 조정한 모델보다 동등한 사이즈에서 효과가 훨씬 좋다;동등한 효과에서 원가가 현저히 낮다."모두들 이전에 오픈 소스로 오픈 소스가 싸다고 생각했는데, 사실 큰 모델 장면에서 오픈 소스가 가장 비싸다.그래서 오픈 소스 모델은 점점 더 뒤처질 것"이라고 말했다.
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- 월마트는 샘의"전치 창고"모델을 복제하여 작은 가게를 열 수도 있다
- DeepMind 오픈 소스 생체 분자 예측 모델 노상 성과는 AI 제약 물결을 일으킬 것인가?
- 바이두 리언굉: 지난 24개월간 AI 업종의 가장 큰 변화는 큰 모형이 기본적으로 환각을 제거한것이다
- "AI 신세대"대모형제조업체 일제히"권"지능체, 리언굉은"생각으로 돈을 벌수 있는 시대"를 맞이하게 된다고 말했다.
- 극크립톤, 전계차종과 함께 광주모터쇼 첫 광대한 지운전 2.0 종단간 Plus 구조 선보여
- 문심일언 사용자 수 4억 돌파, 바이두 오단: 큰 모형이 산업 스마트 엔진을 재창조하고 있다
- 올해 10월 테슬라 모델 Y가 일선, 신일선 도시 모델 판매 1위를 차지했다
- 알리바바 CEO 오영명: AI 발전은 부동한 규모, 부동한 령역의 개원대모형이 필요하다
- 바이두 Q3 핵심 순이익 17% 증가 예상 초과 문심대 모델 하루 조정량 15억
-
AI 소프트웨어 회사 스노플레이크 (Snowflake) 는 실적 발표 후 32.71% 상승해 상장 이후 가장 상승폭이 높아 시장 예상을 훨씬 웃돌았고 같은 실적을 발표한 엔비디아의 기세까지 압도했다. 스노플레이크의 주가 ...
- Cherry95
- 그저께 13:14
- Up
- Down
- Reply
- Favorite
-
간밤 주식시장 전 세계 주요 지수는 금요일에 대부분 상승했고, 미국 주식 3대 지수는 집단적으로 상승했으며, 지수는 1% 가까이 상승하여 사상 최고치를 기록했다. 비트코인은 10만 달러 선에 계속 바짝 다가서며 ...
- 清风吹袭断
- 어제 11:41
- Up
- Down
- Reply
- Favorite
-
Trendforce의 최신 보고서에 따르면 AI 응용으로 객제화 칩 및 패키지 면적에 대한 수요가 날로 높아지고 있으며 2025년 CoWoS 수요를 동시에 끌어올리고 있다.내년 CoWoS 시장의 중요한 발전 추세를 관찰한다: 1, ...
- 魏群1
- 그저께 10:46
- Up
- Down
- Reply
- Favorite
-
스타벅스가 현지시간으로 11월 20일 미국증감회에 제출한 문건에 따르면 올해 9월 29일까지 미국시장에서 회사의 종업원총수는 21만 1000명으로 전년의 22만 8000명보다 낮았다.이 중 20만1천명은 2023년 21만9천명 ...
- 真不是我干的的
- 3 일전
- Up
- Down
- Reply
- Favorite