#에세

AI 벤치마크, 새로운 기준이 필요하다

기존 AI 벤치마크는 명확한 정답이 있는 고립된 문제에 대한 성능만 비교했으나, 실제 AI는 복잡한 환경에서 인간과 상호작용합니다. 미국 캘리포니아와 영국 런던 병원의 방사선 AI 사례처럼, 벤치마크에서 빠르던 AI가 실제 현장에서는 해석 시간으로 인해 오히려 업무 지연을 초래했습니다. 이에 따라, 2022년부터 영국, 미국, 아시아 등에서 연구된 실제 AI 배포 사례를 기반으로 인간과 AI의 협업을 맥락에 맞게 평가하는 HAIC 벤치마크가 대안으로 제시되었습니다.

AI가 쓴 '모던 러브' 에세이, 독자들의 믿음 흔들다

뉴욕타임스 '모던 러브' 칼럼의 한 에세이에 대해 베키 투치가 AI 작성 의혹을 제기했으나, 현재까지 명확한 증거는 없습니다. AI 감지 도구의 신뢰성 한계 속에서 뉴욕타임스는 인간 중심 저널리즘과 AI 활용 시 감독 및 표시 방침을 고수하고 있습니다.