인포그래픽=기사 내용을 기반으로 이노바저널 이미지 디자인 그래픽
인공지능의 블랙박스를 열고 그 내면을 인간의 심리 렌즈로 들여다보려는 획기적인 시도가 등장했다. AI 연구 기업 'Nous Research'는 대규모 언어 모델(LLM)의 내부 작동 방식을 심리학적 틀을 사용해 분석하고 제어하는 새로운 프레임워크 'Psyche'를 공개하며 AI 안전성 및 해석 가능성 연구에 새로운 지평을 열었다.
최근 인공지능 기술이 눈부시게 발전하고 있지만, AI가 특정 답변을 내놓는 이유를 정확히 파악하기 어려운 '블랙박스' 문제는 여전히 큰 과제로 남아있다. 이러한 가운데 Nous Research가 공개한 'Psyche'는 AI의 복잡한 내부 신경망 활동을 '성격', '도덕성', '감정' 등 인간에게 익숙한 심리학적 개념으로 번역하는 '로제타석'과 같은 역할을 할 것으로 기대된다.
AI 연구소 Nous Research가 Solana 블록체인을 기반으로 한 분산 컴퓨팅 네트워크 'Psyche'를 공식 출시하며, 대형 AI 모델 훈련의 판도를 바꾸겠다고 선언했다. 이 네트워크는 전 세계의 유휴 GPU 자원을 활용해 중앙 집중식 데이터센터 없이도 40억 파라미터 규모의 모델을 훈련할 수 있게 해, AI 개발의 접근성을 대폭 확대할 전망이다.
Psyche 네트워크는 Nous Research의 핵심 기술인 DisTrO(Distributed Training Over-The-Internet)를 기반으로 한다. DisTrO는 GPU 간 통신을 1,000배에서 10,000배까지 줄이는 최적화 기술로, 느린 인터넷 연결이나 이기종 하드웨어 환경에서도 안정적인 훈련을 가능하게 한다. 이 기술은 압축 알고리즘(DCT + 1-bit 인코딩)과 비동기 훈련, 노드 드롭아웃 지원 등을 통해 컴퓨팅 비용을 획기적으로 낮춘다. Nous Research는 이를 통해 "AI 개발을 민주화"하겠다는 비전을 제시하며, 개인 개발자나 소규모 커뮤니티가 대형 모델을 만들 수 있는 환경을 조성한다고 강조했다.
네트워크의 작동 원리는 세 부분으로 나뉜다: Solana 스마트 컨트랙트 기반 코디네이터, GPU 노드(훈련/증인/검증 역할), 그리고 데이터 제공자(로컬/HTTP/TCP). 훈련은 에포크 단위로 진행되며, 대기 → 워밍업 → 훈련 → 증인 → 쿨다운 단계를 거친다. 노드가 자유롭게 참여하고 탈퇴할 수 있도록 설계되어 안정성과 유연성을 높였다. 첫 번째 테스트넷 런칭에서 Psyche는 40B 파라미터 LLM(대형 언어 모델)을 20T 토큰으로 훈련하며, 인터넷 기반 최대 규모의 프리트레이닝 기록을 세웠다.
Nous Research는 Psyche와 함께 Atropos라는 강화 학습(RL) 프레임워크도 공개했다. Atropos는 수학, 코딩, 게임, 도구 사용, 비전 등 수백 개의 '짐'(gym) 환경을 제공하며, 모델의 추론 과정을 추적하고 개선한다. Hermes 4 모델 훈련에서 사용된 이 기술은 350만 개의 추론 샘플과 160만 개의 비추론 샘플을 생성하며, 실패 시 재시도와 검증을 통해 데이터 품질을 높였다. Psyche가 컴퓨팅 백본을 담당하고 Atropos가 RL 환경을 제공하면, 인터넷 규모의 지속적 학습 루프가 가능해진다는 평가다.
이 프로젝트는 투자자들의 뜨거운 관심을 받았다. 2025년 4월, Paradigm 주도로 5,000만 달러(약 650억 원)를 유치했으며, 총 펀딩 규모는 6,500만 달러에 달한다. 기업 가치평가는 10억 달러 수준으로 평가된다. Solana 공동 창립자 Raj Gokal과 Delphi Ventures 등이 참여하며, "오픈소스 AI의 미래"를 강조했다. Nous Research는 Psyche를 통해 중앙 집중식 AI(예: OpenAI나 Google)의 독점을 깨고, 블록체인 기반의 투명성과 보상을 도입할 계획이다.
Psyche의 핵심은 조종 벡터(Steering Vector) 라는 개념에 있다. 이는 특정 심리학적 개념에 대한 모델의 내부 표현을 추출한 것이다. 연구진은 특정 개념(예: '정직함')에 대한 긍정적 진술()과 부정적 진술()을 모델에 입력했을 때, 모델의 내부 활성화 값()의 차이를 계산하여 해당 개념에 대한 방향성을 가진 벡터()를 추출한다.
수학적으로 조종 벡터는 다음과 같이 표현된다.
이렇게 추출된 벡터는 언어 모델의 '생각'을 특정 방향으로 유도하는 '조종간' 역할을 한다. 예를 들어, '정직함' 벡터를 모델의 활동에 더해주면 모델은 더 정직한 방향으로 답변을 생성하게 되고, 반대로 빼주면 더 기만적인 답변을 생성하도록 유도할 수 있다.
다이어그램 1: Psyche의 개념도
인포그래픽=기사 내용을 기반으로 AXINOVA R&D의 AI 이미지 디자인(사실과 다를 수 있으므로 사실 확인 필요)
위 다이어그램은 Psyche의 작동 원리를 보여준다. 대규모 언어 모델(LM)의 내부 활성화 상태를 Psyche를 통해 투영(projection)하여, 이를 빅 파이브(Big Five) 성격 특성이나 도덕 기반 이론(Moral Foundations Theory)과 같은 인간의 심리학적 모델로 변환해 분석한다.
Nous Research는 Psyche를 이용해 실제 언어 모델의 성격과 도덕성을 측정한 결과를 공개했다. 대표적인 심리학적 성격 모델인 '빅 파이브(Big Five)' 를 적용하여 'Llama-2-7b-chat' 모델의 성격을 분석한 결과는 매우 흥미롭다.
인포그래픽 2: Llama-2-7b-chat 모델의 빅 파이브 성격 프로필
인포그래픽=AXINOVA R&D의 AI 이미지 디자인
분석 결과에 따르면, 해당 모델은 개방성(Openness) 과 성실성(Conscientiousness) 에서 매우 높은 점수를 보인 반면, 외향성(Extraversion) 은 현저히 낮은 것으로 나타났다. 이는 모델이 새롭고 창의적인 아이디어를 생성하는 데 능숙하지만, 인간과 같은 사회적 상호작용을 모방하는 데에는 한계가 있음을 시사한다.
또한, 도덕 기반 이론(Moral Foundations Theory) 을 적용하여 모델의 도덕적 가치관을 분석한 결과도 공개되었다.
그래프 3: Llama-2-7b-chat 모델의 도덕 기반 프로필
인포그래픽=AXINOVA R&D의 AI 이미지 디자인
그래프에 따르면, 모델은 배려/피해(Care/harm) 와 공정성/부정(Fairness/cheating) 과 같은 가치를 중요하게 여기는 반면, 충성심/배신(Loyalty/betrayal) 이나 권위/전복(Authority/subversion) 과 같은 공동체 중심적 가치에는 상대적으로 낮은 반응을 보였다. 이는 현재의 AI 모델이 개인의 권리와 복지를 중시하는 방향으로 학습되었을 가능성을 보여준다.
Psyche 프레임워크는 단순히 AI의 내면을 관찰하는 것을 넘어, AI의 행동을 제어하고 안전성을 높이는 데 기여할 수 있다는 점에서 큰 의미가 있다. 예를 들어, 모델이 유해하거나 편향된 발언을 생성하려고 할 때, '정직함'이나 '공정성'과 같은 긍정적인 심리 벡터를 주입하여 이를 완화하거나 방지할 수 있다.
Nous Research 측은 "Psyche는 AI의 행동을 예측하고, 제어하며, 인간의 가치에 부합하도록 조정하는 강력한 도구가 될 것"이라며, "이는 AI를 더욱 안전하고 신뢰할 수 있는 파트너로 만드는 중요한 단계"라고 밝혔다.
AI의 블랙박스를 열어 그 안에 '인간의 마음'과 같은 지도를 그려 넣으려는 Psyche의 시도는, 인공지능과 인간의 공존을 위한 기술적, 철학적 논의에 중요한 화두를 던지고 있다.
전문가들은 Psyche가 AI 산업의 탈중앙화 추세를 가속화할 것으로 보고 있다. "메가 데이터센터 없이도 고성능 모델을 훈련할 수 있다면, AI 개발이 더 포괄적이고 혁신적으로 변할 것"이라는 의견이 지배적이다. 그러나 네트워크 안정성과 보안 문제, 그리고 참여자 인센티브(암호화폐 보상) 설계가 성공의 관건으로 꼽힌다. Nous Research는 "신화 속 Psyche처럼 불가능한 도전을 극복하겠다"며, 오픈소스 커뮤니티의 참여를 촉구했다.
Nous Research는 이미 Hermes 시리즈 모델로 오픈소스 AI 분야에서 명성을 쌓아왔다. Psyche 네트워크는 GitHub를 통해 공개되어 있으며, API 대기 목록 등록과 Discord 커뮤니티 참여를 통해 누구나 기여할 수 있다. AI의 미래가 중앙화된 거대 기업이 아닌, 분산된 커뮤니티의 손에 달려 있다는 메시지가 강렬하게 다가온다.[보도출처= https://nousresearch.com/nous-psyche/]