12월 두번째 주 AI 뉴스

December 12, 2023

이번주 AI 뉴스 📰

구글의 Gemini AI 데모, 사실 연출된 영상?

  • 구글의 새 AI 'Gemini' 발표: 구글이 새로운 AI 모델 'Gemini'를 발표했으나, 그 성능에 대한 과장이 의심받고 있음.

  • 데모 비디오의 문제: 발표된 데모 비디오는 실시간 반응이 아닌 편집된 이미지와 텍스트 프롬프트를 사용한 것으로 의심됨.

  • 공정한 성능 평가의 필요성: 전문가들은 실제 사용자 경험을 통한 AI의 성능 평가를 강조하며, 구글에 보다 투명한 시연을 요구함.

인간 뇌세포로 만든 AI, 음성 인식 수행 성공

  • 뇌세포 AI의 혁신적 발전: 인간 뇌세포로 구성된 '브레인 오거노이드'가 컴퓨터와 연결되어 기본적인 음성 인식 작업을 수행함.

  • 에너지 효율성과 학습 과정: 이 시스템은 실리콘 칩보다 훨씬 적은 에너지를 사용하며, 무감독 학습을 통해 정확도를 향상시킴.

  • 생체 컴퓨팅의 가능성과 한계: 브레인 오거노이드의 유지 기간과 향상된 성능의 필요성에도 불구하고, 생체 컴퓨팅의 가능성을 탐색하는 연구가 진행 중임.

MIT, AI 거버넌스에 관한 백서 발표

  • AI 거버넌스에 대한 새로운 틀: MIT 교수진들이 AI 거버넌스를 위한 정책 개요를 제공하며, 기존 규제 및 책임 체계 확장을 포함하는 접근 방식을 제시함.

  • 기술 발전과 사회적 영향: 이 백서들은 미국의 AI 분야 리더십 강화와 새로운 기술로 인한 해로움 제한, 사회에 대한 AI 배치의 긍정적 탐색을 목표로 함.

  • AI 툴의 목적과 책임: AI 툴의 목적과 의도를 명확히 정의하고, 오용 방지를 위한 가이드라인 제공이 중요함을 강조함.


이번주 AI 논문 📝

LLM360: 투명한 오픈소스 대규모 언어 모델을 향하여

  • 오픈소스 LLM의 새로운 움직임: 최근 LLaMA, Falcon, Mistral과 같은 오픈소스 대규모 언어 모델(LLM)이 다양한 옵션을 제공하고 있지만, 대부분은 모델 무게나 추론 코드 같은 일부 아티팩트만 공개함.

  • LLM360의 투명한 접근: LLM360은 훈련 코드와 데이터, 모델 체크포인트, 중간 결과까지 전부 공개하는 완전한 오픈소스 LLM을 목표로 함.

  • 투명하고 재현 가능한 연구 지원: 이 프로젝트의 첫 단계로 7B 파라미터 LLM인 Amber와 CrystalCoder를 포함한 훈련 코드, 데이터, 중간 체크포인트 및 분석을 공개함으로써 연구의 투명성과 재현 가능성을 지원함.

텍스트에서 동작으로: 인간형 로봇 "Alter3"에 GPT-4 구현

  • GPT-4와 로봇의 통합: Alter3라는 인간형 로봇이 GPT-4를 통합하여, 프로그래밍 없이도 다양한 동작을 스스로 생성할 수 있게 됨.

  • 언어 표현과 동작의 매핑: 일반적인 로봇 제어가 하드웨어 의존적인데 반해, Alter3는 인간의 행동을 로봇의 몸에 매핑하여 직접 제어가 가능함.

  • 영상으로 증명된 능력: Alter3는 '셀피 자세'나 '유령 흉내' 등 다양한 포즈를 취하고 시간에 따라 연속적인 동작을 생성함으로써 제로샷 학습 능력을 입증함.

영상 편집의 해부: AI 보조 영상 편집을 위한 데이터셋

  • 이전의 문제점: 이전의 AI 보조 비디오 편집 연구에서는 정형화된 작업 및 데이터셋의 부족으로 인한 도전이 있었음.

  • 현재의 제시안: 이 연구는 비디오 편집 과정을 이해하고 자동화하기 위한 대규모, 주석이 달린 'Anatomy of Video Editing (AVE)' 데이터셋과 벤치마크 제품군을 제공함.

  • 미래의 가능성: 제공된 데이터셋과 벤치마크는 컴퓨터 비전, 기계 청취, 언어 이해, 그래픽스 분야의 연구를 촉진하고, AI 보조 편집의 새로운 관련 작업 개발에 기여할 잠재력을 가집니다.


이번주 AI 프로덕트 📦

DemoFusion: 고해상도 이미지 생성의 대중화

  • "DemoFusion" 연구: 고가의 자본 투자 없이도 고해상도 이미지 생성을 가능하게 하는 GenAI 기술 발전에 집중.

  • 기술적 혁신: 기존 잠재 확산 모델(LDMs)을 활용하여, 점진적 업스케일링, 스킵 잔류 메커니즘, 확장 샘플링을 통해 고해상도 생성을 실현.

  • 대중적 접근성 제공: 더 많은 처리 과정을 필요로 하지만, 중간 단계를 미리보기로 활용하여 사용자가 빠르게 프롬프트를 반복할 수 있게 함으로써 넓은 대중에게 접근 가능.

ControlNet-XS: 이미지 생성 제어를 위한 신규 시스템

  • "ControlNet-XS" 연구: 이미지 합성 분야에서 최근 인기 있는 방법으로, 기존의 이미지 생성 모델(예: Stable Diffusion)과 조절 네트워크(ControlNet)의 결합을 개선한 새로운 제어 시스템.

  • 문제 해결 방식: ControlNet-XS는 이미지 생성과 조절 사이의 정보 전달 속도 문제를 해결하여, 더 정확하게 이미지를 조절할 수 있게 함.

  • 성능 및 속도 향상: 기존 시스템보다 적은 계산량으로 빠르게 작동하며, 결과 이미지의 품질도 더 높아짐. 사용자가 더 쉽게 접근하고 사용할 수 있도록 설계됨.

By BetaAI

© 2023