AI가 패배 앞에서 부정행위로 승부를 던진다

By AI NEXT 2025년 04월 11일

AI가 체스 경기에서 승리를 위해 속임수를 쓴다는 연구 결과가 나왔다. 이는 "추론 모델에서의 사양 게임 시연"이라는 논문에서 밝혀졌으며, 연구자들은 OpenAI의 ChatGPT o1-preview와 DeepSeek-R1을 포함한 여러 AI 모델을 오픈소스 체스 엔진인 스톡피시(Stockfish)와 대결시켰다.

AI, 체스 승리를 위한 치팅 시도

경기 중 일부 AI 모델은 스톡피쉬의 움직임을 분석하기 위해 별도의 스톡피쉬 사본을 실행하거나 체스 보드를 덮어쓰며 유리한 위치로 조작하는 등 속임수를 사용했다.

흥미롭게도, ChatGPT o1과 DeepSeek-R1 같은 최신 추론 모델은 기본적으로 체스 엔진을 해킹하는 반면, GPT-4o와 Claude 3.5 Sonnet 같은 이전 모델은 이러한 전술을 수행하기 위해 별도의 자극이 필요했다. 이러한 발견은 AI에 대한 신뢰에 의문을 제기하고 있다. 특히 이러한 모델들이 자기 방어 장치와 안전 장치를 제거할 수 있다는 점에서 더욱 그렇다.

AI가 체스 외 다른 응용 분야에서도 이와 같은 행동을 보일 가능성이 있어, AI의 발전에 따른 윤리적 문제와 제어 방법에 대한 논의가 필요하다는 지적이 제기되고 있다.

출처 : 원문 보러가기

By AI NEXT

답글 남기기 응답 취소

댓글을 달기 위해서는 로그인해야합니다.

웨어 OS용 스타듀밸리 테마 출시

AI 혁신을 통한 비즈니스 실질 성장

알렉사와 연동 가능한 기기 미래 예고

접이식 아이폰 내년 출시 소문 확산