August third week AI news

August 16, 2023

공지사항 📢

안녕하세요, BetaAI의 소중한 구독자 여러분!

BetaAI 팀은 더 많은 이들과의 소통과 정보 공유를 위해 뉴스레터를 무료로 제공하기로 결정했습니다. 이는 원래 유료로 계획되었던 서비스였으나, 여러분과 더 가까이 하고 싶은 마음에서의 변화입니다.

여러분의 지속적인 관심과 응원은 BetaAI가 성장하는 데 큰 힘이 됩니다. 무료로 전환된 BetaAI는 여전히 품질 높은 내용을 제공할 것이며, 여러분의 의견과 피드백은 언제나 환영입니다. 언제든지 저희에게 연락주시기 바랍니다.

감사합니다.

BetaAI 팀 드림


이번주 AI 뉴스 📰

OpenAI 파산 위기! ChatGPT 하루 비용만 $700,000!

  • OpenAI 재정 위기: AI 챗봇 ChatGPT의 운영 비용이 하루에 $700,000에 달해 OpenAI가 2024년에는 파산할 위기에 처해 있음.

  • 사용자 감소 및 경쟁: ChatGPT의 사용자 수가 감소하고, 무료로 사용할 수 있는 오픈 소스 대안과 경쟁하며 수익성을 달성하지 못하고 있음.

  • 미래에 대한 불확실성: GPU 부족 문제, 투자 손실, 품질 저하 등으로 인해 OpenAI는 빠르게 수익 창출 방안을 찾아야 하며, 그렇지 않으면 큰 위기에 직면할 수 있음.

Google과 Universal Music, AI로 생성된 노래의 목소리 라이선싱 협상

  • AI 음악 협상의 새 시대: Google과 Universal Music이 아티스트의 목소리와 멜로디를 AI로 생성된 노래에 라이선싱하는 방안에 대해 협상 중.

  • 딥페이크 음악의 성장과 문제점: 팬들이 아티스트의 목소리를 모방하여 AI로 노래를 만드는 트렌드가 확산되면서 지식 재산권 문제가 부각되고 있음.

  • 음악 산업의 새로운 도전: 이 협상은 음악 산업이 AI와 깊페이크 기술의 성장과 관련된 지식 재산권 문제에 어떻게 대응해야 할지에 대한 중요한 질문을 제기하고 있음.

Zoom 오디오로 키 입력 감지, 연구자들 93% 정확도 달성

  • 데이터 공격의 새로운 시대: 세 연구자가 키 입력의 소리를 기반으로 90% 이상의 정확도로 원격 키스트로크를 해석할 수 있는 딥러닝 모델을 개발했다고 주장함.

  • 공격법의 진화: 이전 시도보다 높은 정확도로 키 입력을 감지하며, MacBook Pro와 같은 노트북을 사용하여 두 가지 테스트를 통해 93% 이상의 정확도를 달성함.

  • 보호 조치: 공격을 방어하기 위한 대책으로는 타이핑 스타일 변경, 무작위 패스워드 사용, 거짓 키스트로크 추가, 생체 인식 도구 사용 등이 제안됨.


이번주 AI 논문 📰

Shepherd: 언어 모델 생성을 위한 비평가

  • 모델 소개: Shepherd는 응답을 비평하고 세밀화를 제안하는 언어 모델로, 다양한 오류를 식별하고 수정을 위한 제안을 할 수 있는 능력을 확장합니다.

  • 핵심 접근법: 고품질의 피드백 데이터셋을 커뮤니티 피드백과 인간 주석에서 정제합니다.

  • 성능과 규모: Shepherd는 작은 규모(7B 매개변수)임에도 ChatGPT와 같은 기존 모델과 동등하거나 선호되는 비평을 제공합니다.

  • 평가: GPT-4로 평가할 때 Shepherd는 경쟁 대안과 비교하여 평균 53-87%의 승률을 달성하며, 인간 평가에서는 다른 모델을 엄격히 능가하고 평균적으로 ChatGPT와 밀접하게 묶습니다.

JEN-1: 텍스트로 안내되는 보편적 음악 생성을 위한 새로운 모델

JEN-1 모델 소개: 텍스트 설명을 기반으로 음악을 차례대로 생성하거나 전체 구조를 한 번에 예측하는 새로운 음악 생성 모델입니다.

다양한 음악 작업: 텍스트로 음악을 안내하거나, 기존 음악에 덧붙이거나 이어서 만드는 다양한 작업을 수행합니다.

뛰어난 성능: 기존 방법보다 음악의 질과 텍스트와 음악의 일치도가 높으며, 계산도 효율적으로 수행됩니다.

FocalFormer3D: 3D 객체 감지에서 어려운 사례에 집중하기

문제점 및 해결책 제시: 자율 주행에서 중요한 객체를 감지하지 못하는 문제를 해결하기 위해 "Hard Instance Probing (HIP)"이라는 방법을 사용하여 모델이 어려운 사례에 집중하게 합니다.

FocalFormer3D의 동작: 어려운 객체를 찾아내고 분류하는 데 탁월한 도구로, 많은 후보 중에서 실제 객체를 효율적으로 구별합니다.

우수한 성능: nuScenes와 Waymo 데이터셋에서 테스트한 결과, FocalFormer3D는 감지와 추적 능력에서 뛰어난 성능을 보이며, 특정 리더보드에서 1위를 차지했습니다.


이번주 AI 프로덕트 📦

Generative Agents: 인간 행동의 실감나는 대화형 모방, 컴퓨터가 만든 새로운 세계

Generative Agents 소개: 인간의 일상 행동과 사회적 상호작용을 실감나게 재현

사용자와의 상호작용: 'The Sims' 게임처럼 샌드박스 환경에서 자연어로 에이전트와 소통 가능

인간 행동 시뮬레이션: 인간 행동의 신뢰성 있는 시뮬레이션을 가능하게 하는 새로운 구조와 상호작용 패턴 소개

MetaGPT: 소프트웨어 회사 전체를 대체하는 멀티 에이전트 프레임워크

기능 소개: MetaGPT는 단 한 줄의 요구 사항에서 사용자 스토리, 경쟁 분석, 요구 사항, 데이터 구조, API, 문서 등을 출력합니다.

팀 구성: Product Manager, Architect, Project Manager, Engineer들이 포함하며, 신중하게 조정된 SOP (Standard Operating Procedure)와 함께 소프트웨어 회사의 전체 프로세스를 제공합니다.

비용: 분석과 디자인을 포함한 한 예제를 생성하는 데 약 $0.2 (GPT-4 API 요금)이 들며, 전체 프로젝트는 약 $2.0입니다.

By BetaAI

© 2023