AI news for the first week of October

October 4, 2023

이번주 AI 뉴스 📰

ChatGPT, 이제 보고 듣고 말할 수 있다

  • 음성 대화와 이미지 인식: ChatGPT가 새로운 음성과 이미지 기능을 출시하여 사용자와 더 다양한 방법으로 소통 가능.

  • 기술의 안전성과 활용성: 새 기능은 창의적이고 접근성 중심의 응용 프로그램을 가능하게 하면서도 부정 행위 및 사기의 위험을 내포.

  • 서비스 확장 계획: 이 기능은 초기에 Plus와 Enterprise 사용자에게 제공되며, 개발자를 포함한 다른 사용자 그룹에게도 곧 확장될 예정.

메타, 디지털 어시스턴트와 스마트 글래스로 메타버스 추진

  • 메타버스의 새로운 기회: 메타 CEO 마크 주커버그는 인공지능 도구와 유명인 도입 디지털 어시스턴트를 활용해 메타버스를 더욱 활성화하려 함.

  • 다양한 AI 기능 탑재: 메타의 새로운 AI 도구와 스마트 글래스는 사진 편집부터 디지털 스티커 생성까지 다양한 서비스를 제공함.

  • 향후 계획과 메타버스: 이러한 AI 기술은 미래의 메타버스에서도 활용될 예정이며, 메타는 이를 위해 수십억 달러를 투자하고 있음.

Jasper AI, 내부 기업 가치 20% 하락

  • 내부 가치 하락: 제스퍼 AI가 성장 둔화로 내부 기업 가치를 20% 하락함

  • 사업 전환과 경쟁: OpenAI의 ChatGPT 출시 후 제스퍼는 중소기업과 대기업의 마케팅 팀에 집중하기 시작함.

  • 투자자와 경영진에게의 교훈: 제스퍼의 상황은 AI 투자에 있어 기술 뿐만 아니라 비즈니스 모델의 중요성을 강조


이번주 AI 논문 📝

비전 트랜스포머에는 레지스터가 필요하다

  • 특성 맵의 결함: 비전 트랜스포머에서는 이미지의 일부분에 정보가 적은 토큰이 나타나는 문제가 있음.

  • 효율적인 해결책: 입력 시퀀스에 추가 토큰을 제공하여 이 문제를 완전히 해결.

  • 성능 향상과 적용: 이 해결책은 객체 인식과 다운스트림 시각 처리에 있어 새로운 수준의 성능을 달성함.

DreamGaussian: 효율적인 3D 콘텐츠 생성을 위한 생성적 가우시안 스플래팅

  • 효율과 품질의 균형: DreamGaussian은 효율성과 품질을 동시에 달성하는 새로운 3D 콘텐츠 생성 프레임워크를 제안.

  • 가우시안 스플래팅 모델: 3D 가우시안 스플래팅과 UV 공간에서의 텍스쳐 정제를 포함한 모델을 설계.

  • 시간 효율성: 단 2분 만에 고품질의 텍스처 메쉬를 생성, 기존 방법 대비 약 10배 빠름.

AutoCLIP: 시각-언어 모델을 위한 자동 조정 제로샷 분류기

  • 제로샷 분류의 한계 극복: AutoCLIP은 기존 제로샷 분류기의 부정확성을 개선하기 위한 방법을 제시.

  • 동적 가중치 할당: 각 프롬프트 템플릿에 이미지별 가중치를 할당하여 더 정확한 이미지 분류를 가능하게 함.

  • 성능 향상: AutoCLIP은 다양한 데이터셋과 모델에서 기존 방법보다 최대 3% 포인트의 정확도 향상을 보임.


이번주 AI 프로덕트 📦

ProPainter: 비디오 인페인팅을 위한 향상된 전파 및 트랜스포머 개선

  • 한계 극복: ProPainter는 비디오 인페인팅의 한계를 극복하기 위한 새로운 프레임워크를 제시.

  • 이중 도메인 전파: 이미지와 특징 도메인에서의 전파를 결합해 더욱 신뢰성 있는 전역 매핑을 달성.

  • 효율성과 성능: 메모리 및 연산 효율성을 높이면서도 PSNR에서 1.46 dB의 큰 마진으로 선행 연구를 능가함

EasyPhoto: 당신의 스마트한 AI 포토 제너레이터

  • 증명사진 생성: EasyPhoto는 디지털 이중생명체를 훈련시키기 위한 AI 포트레이트를 생성하는 웹 UI 플러그인

  • 사용자 친화적: 5~20장의 상반신 사진으로 훈련을 추천하며, 결과는 Inference 섹션에서 생성할 수 있음.

  • 새로운 기능: 고해상도 템플릿 생성, 배경과 유사도 조정, 다양한 기반 모델 지원 등 다양한 최신 기능이 추가됨.

By BetaAI

© 2023