못하는게 거의없는 AI는 왜 시를 쓰는데에서 약할까? - San Jose - 1

AI가 다 잘하는데 시는 못 쓴다고? 

나는 산호세에서 살고있다. 회사 이름은 비밀로 하자. 다만 이 동네 개발자라면 다 아는 그런 테크회사 중 하나다.

요즘 회사 내부 슬랙은 온통 LLM, RAG, 에이전트, 벤치마크 얘기다.

점심 줄 서면서도 누가 GPT-5가 어쩌고, Claude Opus 5가 어쩌고 떠든다.

솔직히 각자 좀 남보다 더 아는 이야기로 논쟁이 벌어지니까 정보 필터링 하느라고 피곤하다.

그런데 이 와중에 아주 흥미로운 한 가지 사실을 알개된것이 있다.

AI는 코드도 잘 쓰고, 논문도 요약하고, 합성 사진도 잘만들고, 의료 진단도 하고, 변호사 시험도 통과한다.

그런데 시(詩)만 쓰면 어딘가 어색하다고 한다.

일단 AI한테 시켜봤다.

"가을 새벽에 대한 짧은 시를 써줘"라고 했다. 결과는 이랬다.

가을 새벽
푸른 어둠이 가시지 않은 창가에
여름내 달궈진 숨소리는 간데없고
서늘한 공기 한 조각이
콧등 위를 먼저 스쳐 갑니다.
간밤에 풀벌레가 두고 간 적막이
발치에 낮게 깔리는 시간,
발끝을 파고드는 이불의 온기가
유난히도 애틋해지는 것은
계절이 제 몸을 낮추어
우리의 마음으로 들어오기 때문일까요.

어떤가. 못 썼다고 하긴 어렵다. 운율도 맞고, 단어 선택도 무난하고, 가을 새벽이라는 주제도 충실히 따랐다.

그런데 읽고 나서 아무것도 안 남는다. 짭짤한데 맛이 없는 라면 같다. 다 들어갔는데 뭔가 빠진. 이게 핵심이다.

반면에 김소월의 "엄마야 누나야 강변 살자"는 어떤가. 단어 일곱 개뿐이다.

그런데 그 짧은 줄 안에 어머니, 누나, 강변, 그리고 이걸 노래하는 화자의 어떤 막연한 그리움이 다 들어 있다.

AI는 단어를 채우고, 시인은 단어를 비운다. 이 차이가 결정적이다.

왜 AI는 시에서 약할까?

여기서부터 개발자 모드 켜고 가보자. LLM이 작동하는 원리를 말하면 다음에 올 가장 그럴듯한 단어를 확률적으로 예측한다.

"가을 새벽"이 나오면 "안개", "이슬", "바람" 같은 단어들이 통계적으로 자주 따라붙는다는 걸 학습한 모델은 그쪽으로 흐른다.

문제는 시는 정확히 그 반대 방향으로 작동한다는 거다. 좋은 시는 "그럴듯한 단어"의 다음에 "전혀 그럴듯하지 않은 단어"를 놓는다.

이게 시가 주는 충격의 본질이다.

"가난한 내가 아름다운 나타샤를 사랑해서 오늘밤은 푹푹 눈이 나린다"라고 썼을 때, "사랑해서"와 "눈이 나린다" 사이의 그 비논리적 연결, 그게 시다.

AI는 통계적으로 가장 자연스러운 다음 토큰을 고르도록 훈련됐다.

시인은 통계적으로 가장 부자연스러운 다음 토큰을 고를 줄 아는 사람이다.

이게 내가 생각할때 진짜 예술의 반전인 로직이다.

여기서 한 단계 더 들어가 보자. 코드는 정답이 있다. 의료 진단도 있다. 법 조문도 있다.

그래서 AI가 잘한다. 인간이 만들어 놓은 정답 데이터를 학습하면 되니까.

그런데 시는 정답이 없다. 더 정확히는, "이 시인이 지금 이 새벽에 강변에서 느낀 막막함"이라는 단 한 번의 경험이 정답이다.

그건 데이터셋에 없다. 아니, 있을 수가 없다. 아무도 옆에서 그 사람 머릿속을 캡처해두지 않았으니까.

나는 AI 회의론자가 아니다. 회사에서 매일 LLM을 쓴다. 코드 리뷰도, 회의록 정리도, 사양서 초안도 다 AI한테 시킨다. 효율은 어마어마하다.

AI 시도 마찬가지다. 완성된 예술 작품으로 보면 약하지만, 도구로 보면 쓸 만하다.

시 쓰는 게 막막한 사람이 AI한테 초안 받아서 자기 식으로 다시 쓰는 건 좋은 워크플로다.

운율 연습용으로도 좋고, 글감을 떠올리는 데도 도움이 된다.

다만 AI가 뽑아준 시를 그대로 SNS에 올리고 "내 작품"이라고 부르는 건 좀 곤란하다.

그건 시가 아니라 자동 완성 결과물이다.

그래서 내 결론은 AI가 다 가져가도 시는 인간의 것으로 남을 거다.

그리고 어쩌면 그게, AI 시대를 살아가는 우리에게 가장 큰 위로일지도 모른다.