11월 네번째 주 AI 뉴스
November 21, 2023
이번주 AI 뉴스 📰
CEO 해임 사태: OpenAI의 CEO 샘 알트만이 해임되어 기술계에 충격을 주고, 이에 따른 실리콘밸리의 기업 드라마 발생.
OpenAI의 변화와 미래: 알트만의 해임 후, OpenAI의 투자자들과 직원들이 그의 복귀를 요구하며, Microsoft는 OpenAI의 전임 경영진을 새로운 AI 연구부서로 영입.
AI 개발의 영향: OpenAI의 혼란에도 불구하고, Microsoft가 AI 개발을 계속 이어갈 것으로 보이며, AI 분야의 빠른 발전과 새로운 경쟁자들의 등장 예상.
OpenAI 이사회, 경쟁사 Anthropic CEO에게 최고경영자 자리 및 합병 제안?
경영진 변화 움직임: OpenAI 이사회가 샘 알트만 대신할 인물로 경쟁사 Anthropic의 CEO에게 접근하고, 두 AI 스타트업의 합병 가능성을 타진.
임시 CEO 임명 및 직원 반응: 이사회가 전 Twitch CEO인 Emmett Shear를 임시 CEO로 임명한 가운데, OpenAI의 주요 인물들이 Microsoft로 이동하며, 700명 이상의 직원들이 퇴사 위협.
Anthropic의 성장 및 투자: Google과 Amazon.com으로부터 투자를 받은 Anthropic은 그들의 Claude AI 모델로 OpenAI의 GPT 시리즈와 경쟁하고 있음.
OpenAI 투자자들, 샘 알트만 복귀 추진과 이에 따른 이사회 변화 가능성
투자자들의 알트만 복귀 지지: OpenAI의 CEO 샘 알트만 해임에 놀란 투자자들, 그를 복귀시키려 하며, 이사회 교체 및 새 이사 후보 검토 중.
OpenAI와 Microsoft의 관계: OpenAI의 가장 큰 투자자인 Microsoft는 OpenAI에 대해 상당한 영향력을 가지고 있으며, OpenAI는 Microsoft의 지원 없이는 운영이 어려울 수 있음.
경영진과 이사회의 불일치: 알트만은 복귀시 새로운 이사회 및 거버넌스 구조를 원하고 있으며, OpenAI의 상업화 속도 및 공공 안전에 대한 불일치가 해임의 배경 중 하나로 보임.
이번주 AI 논문 📝
Pixel Dance : 생동감 있는 비디오 생성 기술
동적 비디오 생성의 도전: AI 분야에서 움직임이 풍부한 동작과 복잡한 시각 효과를 포함한 고동적 비디오 생성은 중요한 도전 과제.
'PixelDance'의 접근: 기존의 텍스트 기반 비디오 생성 방식의 한계를 넘어서, 첫 프레임과 마지막 프레임에 대한 이미지 지시를 포함하는 새로운 확산 모델 기반 방식
복잡한 장면 및 움직임에 대한 향상된 성능: 공개 데이터로 훈련된 PixelDance는 복잡한 장면과 정교한 움직임을 가진 비디오를 합성하는데 있어 뛰어난 능력을 보여주며 비디오 생성 분야의 새로운 기준을 제시.
AutoStory: 최소한의 인간 노력으로 다양한 스토리텔링 이미지 생성
스토리 시각화의 새로운 접근: 텍스트에 기술된 스토리에 부합하는 일련의 이미지를 생성하는 스토리 시각화는 높은 품질, 텍스트 설명과의 일치, 캐릭터 신원의 일관성을 요구함.
'AutoStory'의 기술: 기존 방식의 한계를 극복하여, 최소한의 인간 상호작용으로 다양하고 고품질, 일관된 스토리 이미지 세트를 자동으로 생성하는 시스템 제안.
효율적인 레이아웃 계획과 이미지 생성: 대규모 언어 모델을 활용한 레이아웃 계획 및 텍스트-이미지 모델을 이용한 고급 스토리 이미지 생성으로, 간단한 바운딩 박스 레이아웃을 스케치나 키포인트 제어 조건으로 변환하여 최종 이미지 품질 향상 및 사용자 상호작용을 간소화.
Orca 1과 Orca 2의 발전: Orca 1은 설명 추적과 같은 풍부한 신호로부터 학습하여, 기존의 지시 학습 모델들을 BigBench Hard와 AGIEval 벤치마크에서 능가함. Orca 2는 소형 LMs의 추론 능력 향상을 위한 개선된 훈련 신호 연구를 지속함.
소형 모델의 잠재력 활용: 기존에는 소형 LMs의 훈련이 대형 모델의 출력을 모방하는 것에 초점을 맞추었으나, Orca 2는 다양한 해결 전략을 가르치고, 모델이 각 작업에 가장 효과적인 전략을 스스로 결정하도록 돕는 접근 방식을 채택함.
다양한 벤치마크를 통한 평가: Orca 2는 약 100개의 작업과 36,000개 이상의 고유 프롬프트를 포함하는 15가지 다양한 벤치마크를 사용하여 평가되었으며, 비슷한 크기의 모델을 능가하고 5-10배 큰 모델들과 유사하거나 더 높은 성능을 달성함.
이번주 AI 프로덕트 📦
GPT-4V(ision) 로봇공학: 인간 시연에서 멀티모달 작업 계획
GPT-4V(ision) 통합 파이프라인: 인간의 행동 관찰을 통합하여 로봇 조작을 용이하게 하는 일반 목적의 비전 언어 모델, GPT-4V(ision)을 소개.
비디오 분석 및 실행 가능한 프로그램 생성: 인간이 수행하는 작업의 비디오를 분석하고, 이를 텍스트로 전환한 다음 GPT-4 기반 작업 계획기를 통해 실행 가능한 로봇 프로그램을 생성함.
제로샷 방식의 로봇 작업 성공: 다양한 시나리오에서 이 방법의 효과를 입증하며, 인간 시연에서 실제 로봇 작업을 제로샷 방식으로 달성함.
Adapters 라이브러리: 간편하고 추가 학습을 위한 새로운 도구
통합된 전이 학습 라이브러리: Adapters는 대규모 언어 모델에서 효율적이고 추가 학습을 위한 통합 오픈소스 라이브러리를 제공함.
다양한 어댑터 방법 통합: 10가지 다양한 어댑터 방법을 하나의 인터페이스로 통합하여 사용의 용이성과 유연한 구성을 제공함.
연구 및 실무자를 위한 도구: Adapters는 연구자와 실무자가 복잡한 어댑터 설정을 설계할 수 있도록 구성 블록을 통한 어댑터 모듈성을 활용할 수 있게 함.
By BetaAI
© 2023