2월 첫번째 주 AI 뉴스

February 7, 2024

이번주 AI 뉴스 📰

애플, 올해 말 GenAI 공개 예정

  • 애플의 GenAI 진출: 애플 CEO 팀 쿡은 올해 말에 인공지능 분야에서 애플이 진행 중인 작업에 대한 세부 사항을 공유할 것이라고 밝힘.

  • 기술 혁신 투자 지속: 애플은 AI를 포함한 기술 혁신에 지속적으로 투자, 특히 Vision Pro VR/AR 헤드셋과 같은 기술에 중점.

  • GenAI에 대한 기대: 애플은 내부적으로 많은 GenAI 관련 작업을 진행 중이며, 올해 말에 흥미로운 것들을 공개할 예정임을 시사.

딥페이크 기술로 CFO 사칭한 2500만 달러 사기극

  • 딥페이크 활용 사기: 홍콩 경찰에 따르면, 한 다국적 기업의 재무 담당자가 딥페이크 기술을 이용해 회사 최고재무책임자(CFO)로 가장한 사기꾼에게 2500만 달러를 송금하는 사건 발생.

  • 사기 수법 고도화: 사기꾼들은 다수의 직원으로 가장해 재무 담당자를 비디오 통화로 속여 모든 참여자가 실제로는 딥페이크로 생성된 가짜임을 밝힘.

  • 국제적 우려 증가: 이 사건을 포함해 딥페이크 기술을 이용한 사기 사례가 늘어나면서 전 세계적으로 딥페이크 기술의 악용 가능성에 대한 우려가 커지고 있음.

로블록스, 실시간 AI 채팅 번역기 출시

  • AI 통역의 진화 : 로블록스는 사용자 경험 향상을 위해 생성 AI 모델을 활용, 실시간으로 텍스트 채팅을 번역하는 AI 모델을 구축.

  • 언어 장벽 해소 : 이 번역기는 16개 언어를 지원하며, 사용자들이 서로의 말을 이해할 수 있게 하여 상호작용을 증진시킴.

  • 기술 확장 가능성 : 로블록스는 향후 비준수어를 준수어로 번역하거나 실시간 음성 번역을 위해 AI를 활용할 가능성을 모색 중임.



이번주 AI 논문 📝

OLMo (Open Language Model) 출시로 언어 모델 과학 발전 가속화

  • 언어 모델의 중요성 : NLP 연구와 상업적 제품에 필수적인 언어 모델이 중요해짐에 따라, 가장 강력한 모델들은 종종 비공개 인터페이스 뒤에 숨겨져 있으며, 그들의 훈련 데이터와 아키텍처는 공개되지 않음.

  • 진정한 오픈 LMs의 필요성 : 연구 커뮤니티가 언어 모델링의 과학을 연구하고, 이 모델들의 편향성과 잠재적 위험을 과학적으로 분석할 수 있도록, 강력하면서도 진정으로 오픈된 LMs에 대한 접근이 필수적임.

  • OLMo의 공개 : OLMo와 그 프레임워크는 훈련 데이터, 훈련 및 평가 코드를 포함하여 완전히 공개됨으로써, 오픈 리서치 커뮤니티를 강화하고 새로운 혁신의 물결을 영감을 줄 것으로 기대됨.

ReplaceAnything3D: 텍스트 가이드를 사용한 3D 장면 편집

  • 3D 장면의 객체 교체 : ReplaceAnything3D 모델(RAM3D)은 장면 내 특정 객체를 대체할 수 있는 새로운 텍스트 가이드 3D 장면 편집 방법을 도입함.

  • Erase-and-Replace 접근법 : 여러 관점에서 3D 일관성을 유지하면서 장면의 객체를 새로 생성된 콘텐츠로 효과적으로 교체할 수 있음.

  • 다양한 3D 장면 적용 : ReplaceAnything3D의 다양성을 실제 3D 장면에 적용하여 전체 장면의 무결성을 해치지 않으면서 나머지 장면과 잘 통합된 수정된 전경 객체의 결과를 보여줌.

POKÉLLMON: 포켓몬 배틀에서 인간 수준 성능을 달성한 대형 언어 모델 기반 에이전트

  • 전략적 인공 지능의 등장 : PokéLLMon은 전술 배틀 게임에서 인간과 동등한 성능을 달성한 첫 LLM 기반 에이전트.

  • 지식 증강 생성 및 자기 일관성 : 외부 지식을 활용하여 환상 현상을 방지하고, 강력한 상대에 직면했을 때 패닉 스위칭 현상을 완화하기 위한 자기 일관성 있는 행동 생성 전략을 도입함.

  • 인간 수준의 전략과 성능 : 온라인 배틀에서 인간 플레이어와의 대결을 통해 PokéLLMon의 인간 수준 전투 성능과 전략을 입증함, 래더 경쟁에서 49%의 승률과 초청전에서 56%의 승률을 달성함.



이번주 AI 프로덕트 📦

Pkl: 코드로 표현되는 구성 언어

  • 구성 전문 언어의 도입 : Pkl은 구성을 코드로 표현하는 특수 목적의 언어로, 정적 구성 형식과 일반 프로그래밍 언어 사이의 조화를 목표로 함.

  • 다양한 활용 가능성 : 커맨드 라인 도구, 소프트웨어 라이브러리, 빌드 플러그인으로 사용할 수 있으며, 소규모에서 대규모, 단순에서 복잡한, 일시적에서 반복적인 구성 작업에 이르기까지 다양하게 확장 가능.

  • 강력한 검증 및 도구 지원 : 풍부한 검증 기능과 도구를 제공하여, 구성 작업의 효율성과 정확성을 높임.

NeMo: NVIDIA의 대규모 언어 모델링 및 대화형 AI 툴킷

  • 대규모 언어 모델링과 대화형 AI 개발 지원 : NeMo와 NeMo Megatron을 통해 연구자들은 자동 음성 인식, 자연어 처리, 텍스트-음성 변환 등 대화형 AI 모델을 효율적으로 개발, 훈련, 배포할 수 있음.

  • 효율적인 모델 확장과 개방형 생태계 : 데이터 큐레이션, 대규모 모델 훈련, 병렬 처리 기술을 포함한 종단 간 플랫폼 제공과 PyTorch 기반으로 유연한 개발 환경을 지원함.

  • NVIDIA AI를 통한 실제 환경 배포 : NeMo 모델을 NVIDIA Riva와 호환되는 형식으로 내보내고, 실시간으로 실행할 수 있는 최적화된 애플리케이션을 생성하여 실제 환경에 배포할 수 있음.

Subscribe now

By BetaAI

© 2023