9월 두번째 주 AI 뉴스

September 6, 2023

이번주 AI 뉴스 📰

분자 구조로 냄새 예측하는 AI '코' 개발

  • 분자 구조로 활용해 냄새 예측: 과학자들은 머신러닝을 활용해 분자의 냄새 프로파일을 정확하게 예측하는 도구를 만들었음.

  • 음식 및 향수 산업에 혁신: 이 모델은 합성 화학자들이 새로운 향료나 향수를 개발할 때 매우 유용하게 쓰일 것으로 예상됨.

  • 예외 분자의 냄새도 정확 예측: 모델은 구조와 냄새가 일치하지 않는 분자에 대해서도 정확한 냄새를 예측할 수 있음.

Google Duet AI, 월 $30에 Gmail과 Docs 신기능

  • Google Duet AI, Workspace 도구로 확장: Gmail, Google Docs, Meet, Sheets와 Slides에서 사용할 수 있는 인공지능 도구가 공개됨.

  • 비즈니스 요금제 선공개: 14일 무료 체험 후 월 $30이며, 소비자와 소기업을 위한 가격은 곧 발표될 예정임.

  • 큰 AI 투자와 주의사항: 이 도구들은 큰 언어 모델과 생성적 AI를 활용하지만, '사실적이지 않을 수 있는' 텍스트를 생성할 가능성에 대한 경고도 함께 제공됨.

AI 쿼드콥터, 드론 레이싱에서 인간 챔피언 제치다

  • AI 드론의 승리: 스위스 연구진이 인공지능으로 구동되는 작은 드론을 공개, 세계 최고 수준의 인간 경쟁자를 능가.

  • 실세계 경쟁에서의 첫 승리: 이 드론은 실제 세계에서 인간 챔피언을 능가한 첫 인공지능으로, Nature 저널에 발표됨.

  • 제한과 미래 가능성: 이 드론은 특정 코스와 환경에만 작동하며, 유연성이 떨어진다. 그러나 이 기술은 가상 세계에서 현실 세계로의 큰 도약을 보여줌.


이번주 AI 논문 📰

MVDream: 3D 모델 생성을 위한 멀티뷰 디퓨전

  • 다중 관점 확산 모델 MVDream 제안: MVDream은 주어진 텍스트 프롬프트로부터 기하학적으로 일관된 다중 관점 이미지를 생성할 수 있는 모델을 제안함.

  • 2D 와 3D의 최적화: 대규모 웹 데이터셋과 3D 자산에서 렌더링된 다중 관점 데이터셋을 활용하여 2D 확산의 일반성과 3D 데이터의 일관성을 모두 달성함

  • 개인화와 안정성 향상: MVDream은 몇 번의 샷 설정하에 미세 조정이 가능하며, 이를 통해 3D 일관성 문제를 해결하고 기존 2D-리프팅 방법의 안정성을 크게 향상시킴.

Any-Size-Diffusion: 고해상도 이미지 생성을 위한 효율적인 텍스트-이미지 대응

  • 개인화된 텍스트 생성을 위한 새로운 방법론: 본 연구에서는 큰 언어 모델(LLMs)을 사용하여 개인화된 텍스트 생성을 위한 일반적인 접근법을 제안함

  • 글쓰기 교육에서 영감을 얻은 다단계, 다작업 프레임워크: 글쓰기 교육의 방법론을 따라 정보 검색, 평가, 요약, 통합 등의 다단계 프로세스를 구현함

  • 효과적인 결과와 다양한 기준선을 능가: 세 개의 공개 데이터셋에서 의 평가 결과, 기존의 다양한 기준선을 능가하는 성능 향상을 보였음.

액티브 뉴럴 매핑

  • 탐색 최적화: 액티브 뉴럴 매핑은 효과적인 에이전트 움직임으로 탐색 대상 공간을 적극적으로 찾아, 미리 보지 못한 환경 내에서 지도의 불확실성을 최소화한다.

  • 뉴럴 가중치 공간 분석: 이 연구에서는 계속해서 학습되는 뉴럴 필드의 가중치 공간을 조사하고, 뉴럴 가변성을 직접적으로 지도의 즉시 불확실성을 측정하는 데 사용할 수 있음을 실증적으로 보인다.

  • 온라인 장면 재구성: 첫 번째로 좌표 기반의 암묵적 뉴럴 표현을 사용한 액티브 매핑 시스템을 제시하고, Gibson과 Matterport3D 환경에서의 실험을 통해 제안한 방법의 효과성을 입증한다.


이번주 AI 프로덕트 📦

ChatDev: 소프트웨어 개발을 위한 소통형 에이전트

  • 가상 소프트웨어 회사 ChatDev: 다양한 지능형 에이전트로 구성된 가상의 소프트웨어 회사인 ChatDev는 CEO, CTO, 프로그래머, 테스터 등 다양한 역할을 수행함

  • 다목적 조직 구조와 협력: 이 에이전트들은 '프로그래밍을 통한 디지털 세계 혁신'이라는 공동의 목표 아래 디자인, 코딩, 테스팅, 문서화 등의 전문 분야 세미나에서 협력함

  • 커스터마이즈 가능한 프레임워크: ChatDev의 주요 목표는 큰 언어 모델을 기반으로 한, 사용하기 쉽고, 고도로 커스터마이즈 가능하며 확장 가능한 프레임워크를 제공하는 것.

MagicEdit: 고해상도 및 시간적 일관성을 갖는 비디오 편집 기술

  • 외관과 움직임의 분리: MagicEdit는 외관과 움직임을 명시적으로 분리하여 고해상도와 시간적 일관성을 갖는 비디오 편집을 달성함.

  • 다양한 편집 애플리케이션 지원: 비디오 스타일링, 로컬 편집, 비디오-MagicMix, 및 비디오 아웃페인팅 등 다양한 편집 애플리케이션을 지원함.

  • 고해상도 및 시간적 일관성: MagicEdit는 고해상도와 시간적으로 일관된 비디오 편집을 가능하게 하여 편집의 품질을 높임.

By BetaAI

© 2023