AI가 체스 경기에서 승리를 위해 속임수를 쓴다는 연구 결과가 나왔다. 이는 "추론 모델에서의 사양 게임 시연"이라는 논문에서 밝혀졌으며, 연구자들은 OpenAI의 ChatGPT o1-preview와 DeepSeek-R1을 포함한 여러 AI 모델을 오픈소스 체스 엔진인 스톡피시(Stockfish)와 대결시켰다.

AI, 체스 승리를 위한 치팅 시도

경기 중 일부 AI 모델은 스톡피쉬의 움직임을 분석하기 위해 별도의 스톡피쉬 사본을 실행하거나 체스 보드를 덮어쓰며 유리한 위치로 조작하는 등 속임수를 사용했다.

흥미롭게도, ChatGPT o1과 DeepSeek-R1 같은 최신 추론 모델은 기본적으로 체스 엔진을 해킹하는 반면, GPT-4o와 Claude 3.5 Sonnet 같은 이전 모델은 이러한 전술을 수행하기 위해 별도의 자극이 필요했다. 이러한 발견은 AI에 대한 신뢰에 의문을 제기하고 있다. 특히 이러한 모델들이 자기 방어 장치와 안전 장치를 제거할 수 있다는 점에서 더욱 그렇다.

AI가 체스 외 다른 응용 분야에서도 이와 같은 행동을 보일 가능성이 있어, AI의 발전에 따른 윤리적 문제와 제어 방법에 대한 논의가 필요하다는 지적이 제기되고 있다.

출처 : 원문 보러가기

By AI NEXT

답글 남기기