기호주의(Symbolism) 인공지능: 블랙박스를 여는 열쇠
by Justin Kim
요즘 AI 이야기는 대부분 딥러닝, 그중에서도 LLM 쪽으로 쏠려 있습니다. 그런데 AI의 역사를 조금만 거슬러 올라가 보면, 지금의 주류와는 상당히 다른 철학에서 출발한 흐름이 하나 있습니다. 기호주의(Symbolism), 혹은 흔히 GOFAI(Good Old-Fashioned AI)라고 부르는 계열입니다.
개인적으로는 LLM이 강해질수록 오히려 이쪽을 다시 들여다볼 이유가 늘어난다고 느끼고 있어서, 한 번쯤 정리해두고 싶었습니다.
기호주의란 무엇인가
기호주의 AI는 지능을 “기호(symbol)를 조작하는 과정”으로 봅니다. 여기서 기호는 숫자나 단어에 국한되지 않고, 현실의 사물이나 개념을 추상화한 모든 표현을 뜻합니다.
뿌리에는 뉴웰과 사이먼이 제안한 물리적 기호 시스템(physical symbol system) 가설이 있습니다. 요약하면, 명시적인 규칙과 논리를 충분히 주입할 수 있다면 기계도 추론과 문제 해결을 할 수 있다는 입장입니다.
오늘날 주류인 딥러닝은 이 반대편, 연결주의(connectionism)에 해당합니다. 뇌 신경망을 본떠 뉴런 간 연결 강도를 조정하며 학습합니다. 둘을 대비해 보면 이렇습니다.
- 기호주의: $A \rightarrow B$ 같은 규칙을 사람이 먼저 써주고, 기계가 그것을 적용합니다. 방향은 top-down입니다.
- 연결주의: 고양이 사진 수만 장을 보여주면 스스로 패턴을 뽑아냅니다. 방향은 bottom-up입니다.
기호주의 황금기와 핵심 기술
초기 AI 연구자들은 기호주의를 바탕으로 체스 프로그램이나 정리 증명기를 만들었습니다. 이때 쓰인 도구들은 지금 봐도 친숙합니다.
- 지식 표현: 세상의 지식을 기계가 다룰 수 있는 형태로 구조화합니다. 온톨로지와 지식 그래프가 대표적입니다.
- 추론 엔진: 저장된 지식과 규칙을 조합해 새로운 사실을 끌어냅니다. “소크라테스는 사람이다”와 “사람은 죽는다”에서 “소크라테스는 죽는다”를 유도하는 식입니다.
- 전문가 시스템: 의사나 법률가의 판단을
IF-THEN규칙으로 옮겨 담습니다.
이 계열의 강점은 분명합니다. 결론이 논리적 단계의 누적으로 만들어지기 때문에, “왜 그런 판단을 했는가”를 그대로 추적할 수 있습니다. 요즘 이야기하는 설명 가능성(XAI)이 여기서는 부록이 아니라 기본값이었던 셈입니다.
기호주의의 한계와 AI의 겨울
하지만 기호주의는 곧 벽에 부딪혔습니다. 세상은 IF-THEN으로 정리하기에는 너무 복잡했기 때문입니다. 보통 세 가지 문제가 거론됩니다.
- 취약성(brittleness): 미리 정의해두지 않은 예외나 잡음이 들어오면 시스템이 쉽게 무너집니다.
- 지식 획득의 병목: 세상의 모든 지식을 사람이 손으로 집어넣는 건 애초에 불가능에 가깝습니다.
- 기호 접지 문제(symbol grounding): ‘사과’라는 기호를 아무리 잘 다뤄도, 기계는 실제 사과가 어떤 맛인지, 어떻게 생겼는지와는 연결되지 않습니다.
결국 데이터만 부어주면 알아서 학습하는 신경망 쪽이 득세하면서, 기호주의는 한동안 한물간 접근으로 취급받았습니다. 흔히 말하는 ‘AI의 겨울’입니다.
왜 다시 기호주의인가
요즘 이 계열이 다시 언급되는 이유는, 단순히 복고가 아니라 딥러닝 혼자서는 어색하게 남는 영역이 분명히 있기 때문입니다.
우선 블랙박스 문제가 있습니다. 딥러닝 모델은 답은 잘 맞추지만, 왜 그런 답이 나왔는지는 좀처럼 설명하지 못합니다. 의료나 금융처럼 “이유를 말할 수 없으면 쓸 수 없는” 영역에서는 이게 치명적입니다. 기호주의의 추론 과정은 그 자체로 설명이 됩니다.
환각(hallucination)도 비슷한 결입니다. LLM은 언어의 확률적 패턴을 학습했을 뿐, 참과 거짓을 가르는 장치를 따로 갖고 있지 않습니다. 지식 그래프 같은 외부 사실 표현을 붙여두면, 최소한 생성된 문장이 팩트 위에 서 있는지 확인해볼 여지가 생깁니다.
그래서 요즘 꾸준히 언급되는 키워드가 뉴로-심볼릭(neuro-symbolic) AI입니다. 대니얼 카너먼의 이분법을 빌리자면, 딥러닝이 빠른 패턴 인식을 담당하는 System 1, 기호주의가 느리지만 명시적인 추론을 담당하는 System 2에 해당합니다. 둘을 한 시스템 안에 두려는 시도라고 보면 됩니다.
재미있는 점은, 이 결합이 과거에 기호주의를 주저앉혔던 세 가지 약점을 그대로 건드린다는 것입니다. 예외 상황은 딥러닝의 유연한 직관이 흡수하고, 명시적 논리가 필요한 구간만 기호 쪽이 맡으면 취약성이 줄어듭니다. 이미지나 소리 같은 원시 데이터를 딥러닝이 기호로 변환해 주면, 기호 접지도 더 이상 철학적 난제로만 머물지 않습니다. 지식 획득도 마찬가지입니다. 대규모 모델이 텍스트에서 관계를 뽑아 지식 그래프를 채우는 작업이 이제는 실제로 동작하는 수준에 와 있습니다.
마치며
기호주의와 연결주의는 경쟁자라기보다 서로의 빈칸을 메우는 관계에 가깝습니다. 데이터로부터 배우는 쪽과, 배운 것을 가지고 따지는 쪽이 한 시스템 안에서 맞물릴 때 얻을 수 있는 것들이 있습니다. 한때 구시대의 유물처럼 취급받던 접근이 다시 최신 논문 제목에 올라오는 걸 보고 있으면, 이 분야를 오래 지켜본 입장에서는 꽤 반가운 장면입니다.
관련 글
Subscribe via RSS
Comments