|
실리콘밸리 거물들의 AI 경쟁은 더욱 치열해지고 있다. 이리저리 오가며 전속력으로 출격한다.
북경시간으로 10월 4일, OpenAI와 Meta는 동시에 자신의 새로운 무기를 내놓았다.
메타는 Movie Gen이라는 새로운 AI 모델을 공개했습니다.비디오 생성(Movie Gen Video) 및 오디오 생성(Movie Gen Audio) 두 모델로 구성되어 완전한 멀티미디어 콘텐츠를 원활하게 생산하여 이미지, 시각, 청각에 이르는 모든 범위를 커버할 수 있습니다.메타는"지금까지 가장 진보된 미디어 기반 모델"이라고 말했다.
OpenAI는 인터렉션 인터페이스 canvas를 대대적으로 출시하면서"ChatGPT를 사용하여 글을 쓰고 프로그래밍하는 새로운 방식"이자 ChatGPT가 출시된 이래 중대한 시각 인터페이스 업그레이드라고 말했다.사용자는 ChatGPT와 함께 공동 작업하여 쓰기 및 코딩 프로젝트를 완료할 수 있으며 단순한 채팅에 국한되지 않고 전체 과정을 시험하고 볼 수 있습니다.
예견할수 있는것은 앞으로 한동안 과학기술거두들이 끊임없이 낡은 것을 밀어내고 새로운 것을 창조하게 되는데 여기에는 혁명적인 의의가 있는 신제품, 신기술도 포함되며 끊임없이 작은 고조를 일으키는 지속성상신도 포함된다.
이 AI 경쟁이 언제 판가름날지 확실하지 않지만, 확실한 것은 거물들이 탑 꼭대기에 높이 사는 계산력 자원과 끊임없이 확장되는 업무 경계가 AI 창업기업의 생존 공간을 점점 더 좁게 만들 수 있다는 것이다.
'마태 효과'는 신흥 AI 분야에서 점차 뚜렷해지고 있다.
Meta 버전 Sora 온라인
메타의 Movie Gen을"Sora"라고 부르는 것은 사실 정확하지 않다."청출어람이 청보다 낫다"고 말해야 한다. Sora가 갖춘 동영상 생성 기능 외에도 Movie Gen은 동영상을 위한 배경음악과 음향 효과를 함께 생성하고 지령에 따라 동영상을 편집하여 직접 한 걸음 한 걸음 나아갈 수 있다.
구체적으로 Movie Gen Video는 30B 매개 변수의 Transformer 모델로, 단일 텍스트 프롬프트에서 16초, 초당 16프레임의 고화질 비디오를 생성할 수 있다.동시에 게시된 Movie Gen Audio는 비디오 입력과 옵션 텍스트 힌트를 받아 비디오와 동기화된 HD 오디오를 생성합니다.
방금'지표면 최강'홀로그램 AR 안경으로 실시간 검색어에 오른 저커버그는 소셜네트워크서비스 (SNS) 에서 Movie Gen 플랫폼을 위해 자신의 정적 사진을 다양한 형식의 동적 헬스 동영상으로 전환했다. 장면에는 유머와 공상과학이 적지 않다.
Movie Gen이 물체의 운동 궤적을 생성하고 주체의 물리적 운동 법칙을 유지하며 배경을 통일하고 생동감 넘치는 효과를 보여주는 메타가 내놓은 다른 예제 동영상.
통합 AI 미디어 도구인 Movie Gen은 또한 요소 추가, 삭제 또는 대체, 배경 교체, 스타일 변경 등의 전반적인 수정을 수행할 수 있는 비디오 편집 기능을 갖추고 있습니다.
한 해외 네티즌은 "많은 창작자가 AI 동영상 편집 도구를 사용할 줄 알게 되면서 몇 년 뒤 틱톡(짧은 동영상 대표)과 유튜브(긴 동영상 대표)가 어떻게 될지 상상하기 어렵다"고 개탄했다.
Sora의 출시 리듬과 비슷하게 Movie Gen도 대중에게 공개되기까지 시간이 좀 더 걸리지만 OpenAI가 자주 조롱하는'close'와 달리 Meta는 아키텍처, 훈련 방법, 데이터 관리, 평가, 훈련 및 추론 최적화 및 오디오 모델에 대한 정보를 소개하는 92페이지 분량의 논문을 흔쾌히 발표했다.
메타에 따르면 동영상 생성 모델은 1억 개의 동영상과 10억 장의 이미지에서 사전 훈련을 했고, 오디오 생성 모델은 약 100만 시간의 오디오 데이터를 사용했다.
또한 Meta는 Movie Gen Video Bench, Movie Gen Edit Bench 및 Movie Gen Audio Bench를 포함한 여러 벤치마크 데이터 세트를 오픈 소스화하여 후속 연구자에게 권위있는 평가 도구를 제공합니다.
무비젠은 오픈AI가 지난 2월 선보인 문생영상소라에 더해 AI 영상 편집 방향으로 성큼 다가섰다.한 발 앞선 Sora는 아직 공식적으로 공개되지 않았지만 Sora는 1 분 분량의 비디오를 생성 할 수 있으며 Movie Gen은 현재 16 초에 불과합니다.
조 OpenAI의 새로운 동작이 끊이지 않다
메타는 OpenAI를 향해 총을 쏘았지만 후자는 가만히 있지 않았다.
앞서 9월 13일, OpenAI는 새로운 범용 언어 대형 모델 o1을 공식 발표했다. 느린 사고를 바탕으로 추리력에서 인간 박사를 완파하고 수학, 물리, 화학, 생물학 등 분야에서 매우 우수한 성적을 거뒀다.
텍스트 편집 시스템도 진화하고 있다.Movie Gen이 출시된 10월 4일, OpenAI는 사실상 새로운 휴먼 컴퓨터 인터렉션 인터페이스인 canvas라는 비주얼 제품을 출시한다고 발표했다.
canvas는 ChatGPT에 내장된 문서 및 코드 편집기입니다.사용자는 더 이상 ChatGPT와 문서 편집기 사이를 왔다갔다할 필요가 없다. 문서를 쓸 때 자동으로 튀어나온다. ChatGPT에서 문서나 코드를 직접 편집할 수 있다. 하나의 인터페이스에서 구상에서 성문까지의 전 과정을 완성할 수 있다. AI와의 원활한 협업을 실현함으로써 업무 효율을 크게 향상시킬 수 있다.
업계 관계자는 OpenAI가 canvas를 빌려 ChatGPT가 단순한 챗봇이 아니라 AI 시대의 운영체제를 만들겠다는 것을 암시했다고 논평했다.이는 CEO 샘 알트만 (Sam Altman) 의 비범한 야심을 드러냈다.그러나 canvas는 다음 주에야 Enterprise 및 Edu 사용자에게 제공되며 Plus 사용자는 직접 호출할 수 있습니다.
전날, 현지시간으로 10월 2일, OpenAI는 새로운 66억딸라의 융자를 완성한다고 선포했는데 투자후 평가액은 1570억딸라 (약 인민페 1조 1000억원) 에 달했다.이는 OpenAI가'스타 유니콘'회사에서 영락없는 인공지능 거물로 이행했음을 의미한다.
이번 융자는 벤처캐피털의 거물인 Thrive Capital이 13억 달러, 마이크로소프트가 7억 5000만 달러, 소프트뱅크그룹, 엔비디아가 각각 5억 달러와 1억 달러를 투자했고 애플은 막판에 탈퇴를 결정했다.또한 OpenAI는 40억 달러의 새로운 순환 신용 한도를 확보했다.소개에 따르면 ChatGPT는 매주 사용자수가 이미 2억 5000만명을 초과했으며 올해 수입은 37억딸라에 달할것으로 예상된다.
OpenAI의 이번 융자 자금은 전환 가능한 어음 형식으로 제공되지만, 만약 그것이 2년 내에 회사 구조의 재편 (즉, 회사 구조가 비영리형 회사에서 영리형 회사로 전환) 을 완료하지 못한다면, 이번 융자의 투자자는 투자 반환을 요구할 권리가 있을 것이라고 한다.
특히 OpenAI는 OpenAI 전 직원들이 설립한 AI 스타트업 Anthropic, 엘론 머스크(Elon Musk)가 설립한 xAI, OpenAI 공동 창업자이자 전 수석 과학자인 일야 수츠크비(Ilya Sutskever)가 설립한 신생 SSI, 슈퍼 세이프(Supersafe) 등 자금 조달에 참여한 투자자들에게'양자택일'을 요구한 것으로 드러났다.머스크는 소셜네트워크서비스 (SNS) 에서 오트만에게 다시 한 번 증오했다는 소식이 전해졌다.
OpenAI 회사의 성격 전환과 발전 방향의 불일치와 함께 회사 임원들의 지속적인 큰 불안이다.
일주일 전인 9월 26일 OpenAI CTO (최고기술책임자) 미라 무라티 (Mira Murati), 밥 맥그리우 (BobMcGrew), 바렛 조프 (Barret Zoph) 연구 부사장이 동시에 이직을 선언했다.며칠 후인 10 월 2 일, OpenAI 공동 설립자 인 Diederik Kingma는 Anthropic에 합류했다고 발표했습니다.그리고 회사의 회장 그레고리 브록먼 (Greg Brockman) 은 여전히 장기 휴가 중이다.OpenAI의 최초 11명의 창립 멤버 중 궁투가 복귀한 오트만을 제외하면 언어와 코드 생성 팀 책임자인 보이체흐 자렘바 (Wojciech Zaremba) 만 남았다.
'다사다난한 가을'은 OpenAI의 불안 정도를 요약할 수 없는 것 같다.'불붙으면서'매우 빠르게 전진하는 것이야말로 OpenAI의 일상적인 상태이다. |
|