11월 네번째 주 AI 뉴스

November 21, 2023

이번주 AI 뉴스 📰

OpenAI의 경영진 교체 사태와 그 파급효과

  • CEO 해임 사태: OpenAI의 CEO 샘 알트만이 해임되어 기술계에 충격을 주고, 이에 따른 실리콘밸리의 기업 드라마 발생.

  • OpenAI의 변화와 미래: 알트만의 해임 후, OpenAI의 투자자들과 직원들이 그의 복귀를 요구하며, Microsoft는 OpenAI의 전임 경영진을 새로운 AI 연구부서로 영입.

  • AI 개발의 영향: OpenAI의 혼란에도 불구하고, Microsoft가 AI 개발을 계속 이어갈 것으로 보이며, AI 분야의 빠른 발전과 새로운 경쟁자들의 등장 예상.

OpenAI 이사회, 경쟁사 Anthropic CEO에게 최고경영자 자리 및 합병 제안?

  • 경영진 변화 움직임: OpenAI 이사회가 샘 알트만 대신할 인물로 경쟁사 Anthropic의 CEO에게 접근하고, 두 AI 스타트업의 합병 가능성을 타진.

  • 임시 CEO 임명 및 직원 반응: 이사회가 전 Twitch CEO인 Emmett Shear를 임시 CEO로 임명한 가운데, OpenAI의 주요 인물들이 Microsoft로 이동하며, 700명 이상의 직원들이 퇴사 위협.

  • Anthropic의 성장 및 투자: Google과 Amazon.com으로부터 투자를 받은 Anthropic은 그들의 Claude AI 모델로 OpenAI의 GPT 시리즈와 경쟁하고 있음.

OpenAI 투자자들, 샘 알트만 복귀 추진과 이에 따른 이사회 변화 가능성

  • 투자자들의 알트만 복귀 지지: OpenAI의 CEO 샘 알트만 해임에 놀란 투자자들, 그를 복귀시키려 하며, 이사회 교체 및 새 이사 후보 검토 중.

  • OpenAI와 Microsoft의 관계: OpenAI의 가장 큰 투자자인 Microsoft는 OpenAI에 대해 상당한 영향력을 가지고 있으며, OpenAI는 Microsoft의 지원 없이는 운영이 어려울 수 있음.

  • 경영진과 이사회의 불일치: 알트만은 복귀시 새로운 이사회 및 거버넌스 구조를 원하고 있으며, OpenAI의 상업화 속도 및 공공 안전에 대한 불일치가 해임의 배경 중 하나로 보임.


이번주 AI 논문 📝

Pixel Dance : 생동감 있는 비디오 생성 기술

  • 동적 비디오 생성의 도전: AI 분야에서 움직임이 풍부한 동작과 복잡한 시각 효과를 포함한 고동적 비디오 생성은 중요한 도전 과제.

  • 'PixelDance'의 접근: 기존의 텍스트 기반 비디오 생성 방식의 한계를 넘어서, 첫 프레임과 마지막 프레임에 대한 이미지 지시를 포함하는 새로운 확산 모델 기반 방식

  • 복잡한 장면 및 움직임에 대한 향상된 성능: 공개 데이터로 훈련된 PixelDance는 복잡한 장면과 정교한 움직임을 가진 비디오를 합성하는데 있어 뛰어난 능력을 보여주며 비디오 생성 분야의 새로운 기준을 제시.

AutoStory: 최소한의 인간 노력으로 다양한 스토리텔링 이미지 생성

  • 스토리 시각화의 새로운 접근: 텍스트에 기술된 스토리에 부합하는 일련의 이미지를 생성하는 스토리 시각화는 높은 품질, 텍스트 설명과의 일치, 캐릭터 신원의 일관성을 요구함.

  • 'AutoStory'의 기술: 기존 방식의 한계를 극복하여, 최소한의 인간 상호작용으로 다양하고 고품질, 일관된 스토리 이미지 세트를 자동으로 생성하는 시스템 제안.

  • 효율적인 레이아웃 계획과 이미지 생성: 대규모 언어 모델을 활용한 레이아웃 계획 및 텍스트-이미지 모델을 이용한 고급 스토리 이미지 생성으로, 간단한 바운딩 박스 레이아웃을 스케치나 키포인트 제어 조건으로 변환하여 최종 이미지 품질 향상 및 사용자 상호작용을 간소화.

Orca 2: 소형 언어 모델에 추론 방법 가르치기

  • Orca 1과 Orca 2의 발전: Orca 1은 설명 추적과 같은 풍부한 신호로부터 학습하여, 기존의 지시 학습 모델들을 BigBench Hard와 AGIEval 벤치마크에서 능가함. Orca 2는 소형 LMs의 추론 능력 향상을 위한 개선된 훈련 신호 연구를 지속함.

  • 소형 모델의 잠재력 활용: 기존에는 소형 LMs의 훈련이 대형 모델의 출력을 모방하는 것에 초점을 맞추었으나, Orca 2는 다양한 해결 전략을 가르치고, 모델이 각 작업에 가장 효과적인 전략을 스스로 결정하도록 돕는 접근 방식을 채택함.

  • 다양한 벤치마크를 통한 평가: Orca 2는 약 100개의 작업과 36,000개 이상의 고유 프롬프트를 포함하는 15가지 다양한 벤치마크를 사용하여 평가되었으며, 비슷한 크기의 모델을 능가하고 5-10배 큰 모델들과 유사하거나 더 높은 성능을 달성함.


이번주 AI 프로덕트 📦

GPT-4V(ision) 로봇공학: 인간 시연에서 멀티모달 작업 계획

  • GPT-4V(ision) 통합 파이프라인: 인간의 행동 관찰을 통합하여 로봇 조작을 용이하게 하는 일반 목적의 비전 언어 모델, GPT-4V(ision)을 소개.

  • 비디오 분석 및 실행 가능한 프로그램 생성: 인간이 수행하는 작업의 비디오를 분석하고, 이를 텍스트로 전환한 다음 GPT-4 기반 작업 계획기를 통해 실행 가능한 로봇 프로그램을 생성함.

  • 제로샷 방식의 로봇 작업 성공: 다양한 시나리오에서 이 방법의 효과를 입증하며, 인간 시연에서 실제 로봇 작업을 제로샷 방식으로 달성함.

Adapters 라이브러리: 간편하고 추가 학습을 위한 새로운 도구

  • 통합된 전이 학습 라이브러리: Adapters는 대규모 언어 모델에서 효율적이고 추가 학습을 위한 통합 오픈소스 라이브러리를 제공함.

  • 다양한 어댑터 방법 통합: 10가지 다양한 어댑터 방법을 하나의 인터페이스로 통합하여 사용의 용이성과 유연한 구성을 제공함.

  • 연구 및 실무자를 위한 도구: Adapters는 연구자와 실무자가 복잡한 어댑터 설정을 설계할 수 있도록 구성 블록을 통한 어댑터 모듈성을 활용할 수 있게 함.

By BetaAI

© 2023