트웰브랩스, 영상 AI '페가수스 1.5' 공개

AI 기술 기업 트웰브랩스가 영상의 맥락을 깊이 이해하고 스스로 구조화된 데이터를 생성하는 차세대 영상 추론 AI 모델 '페가수스 1.5'를 선보였다. 이 모델은 '시간 기반 메타데이터 추출' 방식을 활용하여, AI가 단순히 영상을 시청하는 수준을 넘어 사용자가 정의한 기준에 따라 영상을 정밀하게 구간 분할하고 각 구간의 시작·종료 시점 및 상세 내용을 구조화된 데이터로 추출하는 기술을 구현했다.

이 AI 모델은 기존 영상 편집 및 아카이빙 작업에서 숙련 인력이 수천 시간의 영상을 직접 확인해야 했던 과정을 언어로 자동화하며, 개발자는 복잡한 코딩 대신 자연어 명령만으로 영상 구조를 설계할 수 있도록 돕는다.

페가수스 1.5는 텍스트 변환을 넘어 시각·청각·맥락 신호를 동시에 읽는 멀티모달 기술을 통해 화면 전환, 오디오 변화, 주제 흐름 등 미세한 변화까지 감지해 구간 경계를 찾아낸다. 또한, 최대 2시간 분량 영상도 단 한 번의 API 호출로 정밀하게 구조화한다. 구간 분할 정확도 평가에서 페가수스 1.5는 구글 제미나이 3.1 Pro 대비 13.1% 높은 성능을 보였으며, 인덱싱이나 전처리 없이 원본 영상 파일만으로 결과를 도출해 기업의 운영 효율을 높일 수 있다.

트웰브랩스 대표는 사용자가 원하는 기준만 정의하면 AI가 영상 구조를 자동 설계하고 필요한 장면을 추출하는 방식이 보편화될 것이라고 전망했다. 이는 영상 콘텐츠가 단순 소비 대상을 넘어 기업이 자유롭게 가공·활용하는 데이터 자산으로 확장되는 동향을 반영한다.

본 기사는 AI가 생성하였으며, 사람이 검수한 기사입니다.

쿠팡 파트너스 활동의 일환으로 일정 수수료를 제공받습니다