AI news for the fourth week of October
October 25, 2023
이번주 AI 뉴스 📰
Nvidia, 한국 생성 AI 스타트업 Twelve Labs에 투자
Nvidia, 첫 한국 생성 AI 스타트업 투자: Nvidia가 미래 성장을 위한 기술 경쟁력을 지닌 Twelve Labs라는 한국 생성 AI 스타트업에 투자함.
비디오 콘텐츠 이해 AI 모델: Twelve Labs는 비디오 콘텐츠를 이해하는 초대규모 AI 모델을 개발하고 있으며, 이는 네이버와 KT 같은 주요 IT기업이 집중하는 텍스트 기반 LLMs와 차별화됨.
Big Tech 경쟁 치열: Microsoft, Amazon, Nvidia 등은 생성 AI 산업에서의 우위를 차지하기 위해 적극적인 투자를 하고 있으며, 이 시장은 10년 내에 1.3조 원으로 성장할 것으로 예상.
Google DeepMind 최고경영자, “AI 위험은 기후 위기만큼 심각하게 대해야”
AI 위험의 신속한 대응 필요: Google DeepMind의 Demis Hassabis 최고경영자는 AI의 위험성을 기후 위기만큼 심각하게 다루어야 하며 지체할 시간이 없다고 경고.
규제 체계 구축의 중요성: Hassabis는 IPCC와 유사한 국제 기구를 통한 AI 안전 감독이 시작되어야 한다고 제안.
AGI의 존재 위험성: 인공 일반 지능(AGI)이 인간을 넘어선 지능을 가질 위험이 있으며, 이러한 시스템이 인간의 통제를 벗어날 수 있다는 우려가 제기되고 있음.
AI의 대부, “AI 기술 개발자들이 AI로 나온 손해에 대한 책임 지워야”
고급 AI 시스템의 위험성: AI 기술의 ‘대부’인 Geoffrey Hinton 와 Yoshua Bengio는 강력한 AI 시스템이 사회 안정을 위협하며, 이로 인한 피해에 대해 회사들이 책임져야 한다고 경고.
안전과 윤리에 집중한 정책 필요: 정부와 회사는 AI 연구 및 개발 자금의 1/3을 시스템의 안전하고 윤리적인 사용에 할애해야 하며, 독립 감사를 허용해야 한다고 제안.
미래 위험성과 규제: 현재의 AI 시스템은 이미 불안정한 능력을 보이고 있으며, 이러한 시스템이 자율적으로 바람직하지 않은 목표를 추구할 위험이 있다고 경고.
이번주 AI 논문 📝
Habitat 3.0: 인간, 아바타, 로봇이 공존하는 새로운 플랫폼
고도의 시뮬레이션 기능: Habitat 3.0은 복잡한 유연한 몸체와 다양한 외형 및 움직임을 빠르게 시뮬레이션을 진행
인간 참여 인프라: 마우스/키보드 또는 VR 인터페이스를 통해 인간과 시뮬레이션 로봇 간의 실시간 상호작용이 가능함.
협업 작업 연구: '사회적 네비게이션'과 '사회적 재배열' 두 가지 협업 작업을 통해 인간과 로봇 간의 협업을 심도 있게 연구함.
TexFusion: 텍스트 가이드 이미지 확산 모델을 이용한 3D 텍스처 합성
새로운 3D 텍스처 합성 방법: 대규모 텍스트 가이드 이미지 디퓨전 모델을 사용하여 주어진 3D 모델에 텍스처를 합성하는 새로운 방법을 제시함.
3D 일관성 생성 기술: 기존의 느리고 취약한 최적화 과정 대신, TexFusion은 2D 렌더링 뷰에서 정규 확산 모델 샘플링을 적용하는 3D 일관성 생성 기술을 도입함.
다양하고 고품질 텍스처 생성: TexFusion을 통해 다양하고 고품질, 전체적으로 일관된 텍스처를 효율적으로 생성할 수 있으며, 가상 현실, 게임 디자인, 시뮬레이션 등 다양한 분야에 적용될 것으로 기대됨.
텍스트-이미지 생성 모델에서 지식의 지역화와 편집에 대한 연구
지식의 분산과 위치: 텍스트-이미지 생성 모델에서 시각적 속성에 대한 지식은 단일 구성 요소에 집중되지 않고 조건부 UNet의 여러 구성 요소에 분산되어 있음.
CLIP 텍스트-인코더의 특이성: Stable-Diffusion과 같은 모델에서의 CLIP 텍스트-인코더는 다양한 시각적 속성에 걸쳐 단 하나의 인과 상태만을 포함함.
Diff-QuickFix의 효율성: 이를 바탕으로, Diff-QuickFix라는 빠르고 데이터 없이 모델을 편집할 수 있는 방법을 소개한다. 이 방법은 닫힌 형태의 업데이트로 1000배 빠른 속도와 유사한 편집 성능을 제공함.
이번주 AI 프로덕트 📦
OpenAgents: 일상생활을 도울 언어 에이전트 오픈 플랫폼
다기능 언어 에이전트: OpenAgents는 데이터 분석, API 도구, 웹 브라우징 등 다양한 일상 업무를 수행할 수 있는 세 가지 에이전트를 제공함.
사용자와 개발자 모두를 위한 설계: 일반 사용자는 웹 인터페이스를 통해 빠르고 효율적으로 에이전트를 활용할 수 있으며, 개발자는 지역 설정에서 쉽게 배포할 수 있음.
실세계 적용과 연구 기회: OpenAgents는 실세계에서의 언어 에이전트 사용과 연구를 촉진하기 위한 기반을 제공함.
Eureka: 대규모 언어 모델로 인간 수준의 피드백 설계 가능
인간 수준 보상 알고리즘: Eureka는 복잡한 물리적 작업을 위한 인간 수준의 피드백 설계 알고리즘을 제공함.
성능 우수: Eureka는 전문가가 설계한 피드백 설계보다 뛰어난 성능을 보이며, 29개의 RL (Reinforcement Learning) 환경 에서 83%의 작업에서 인간 전문가를 능가함.
새로운 학습 접근법: Eureka는 인간의 피드백을 즉시 적용하여 모델 업데이트 없이도 보상의 품질과 안전성을 향상시킴.
By BetaAI
© 2023