2025년 7월, 미국과 독일의 공동 연구진이 2010년부터 2024년까지 1,510만 건이 넘는 생물의학 논문 초록을 분석한 결과, 2024년에 발표된 논문 중 최소 13.5%가 생성형 인공지능(AI), 특히 대형언어모델(LLM)의 영향을 받았다는 사실이 밝혀졌다. 이 연구는 ChatGPT가 공개된 2022년 11월을 기준으로, 그 전후의 글쓰기 스타일 변화를 정량적으로 추적했다는 점에서 기존의 탐지 방식과 차별화된다.
혁신적 방법론과 문체 변화의 실체
연구진은 ‘초과 어휘 분석(excess vocabulary analysis)’이라는 독창적인 방법을 통해 특정 단어의 사용 빈도가 예측값을 얼마나 초과했는지를 계산했다. 이 방법론은 단순한 키워드 빈도 분석을 넘어서 문맥적 패턴 변화를 포착할 수 있다는 점에서 혁신적이다. 연구진은 베이지안 통계 모델을 활용해 각 단어의 ‘정상적’ 사용 범위를 설정하고, 이를 초과하는 급증 패턴을 AI 개입의 신호로 해석했다.
예컨대 코로나19 시기에는 ‘pandemic’, ‘covid’와 같은 정보 전달 중심의 명사가 늘어났다면, 2024년에는 ‘delving’, ‘pivotal’, ‘intricate’ 등 보다 정서적이고 수사적인 표현이 주로 증가했다. 이는 단어 선택의 중심이 ‘무엇을 말하느냐’에서 ‘어떻게 말하느냐’로 이동했음을 보여준다.
실제로 연구에 따르면 2021~2022년까지 증가한 단어의 80% 가까이가 명사였으나, 2024년에는 동사가 66%, 형용사가 14%를 차지하며 문체의 중력이 바뀌었다. 이러한 변화는 ChatGPT의 훈련 방식과 직결된다. LLM의 ‘Human Feedback from Reinforcement Learning(RLHF)’ 과정에서 모델은 단순한 정보 전달보다는 ‘자연스럽고 매력적인’ 텍스트 생성을 우선하도록 학습된다. 그 결과 전통적인 학술 문체의 객관적이고 건조한 명사 중심 서술에서 벗어나 동적이고 표현력 풍부한 동사와 형용사가 늘어나는 현상이 나타났다.
특히 주목할 만한 변화는 ‘investigating’ → ‘delving into’, ‘exploring’ (단순 동사의 수사적 확장), ‘important’ → ‘pivotal’, ‘crucial’ (일반 형용사의 강조적 대체), ‘complex’ → ‘intricate’, ‘sophisticated’ (기술적 용어의 문학적 표현) 등이다.
지역별·분야별 격차와 디지털 문해력의 새로운 양상
연구에서 가장 흥미로운 발견 중 하나는 AI 개입률의 현저한 지역별·분야별 차이다. 일부 저널이나 국가에서는 AI 문체의 개입 비율이 40%에 육박했으며, 이는 다음과 같은 요인들의 복합적 작용 결과로 분석된다.
접근성 격차를 살펴보면, 영어권 vs 비영어권 연구자 간에 뚜렷한 차이가 나타난다. 비영어권 연구자들에게 ChatGPT는 언어 장벽을 낮추는 도구로 활용되면서 상대적으로 높은 사용률을 보인다. 또한 유료 AI 도구 구독 가능 여부에 따른 경제적 접근성 격차와 일부 대학에서 AI 도구 사용을 장려하거나 제한하는 기관별 정책 차이도 영향을 미친다.
분야별 특성을 보면, 수학, 물리학 등 이론 중심 분야에서는 상대적으로 낮은 AI 개입률을 보이는 반면, 생물학, 의학 등 실험 중심 분야에서는 결과 해석과 논의 부분에 높은 AI 활용률을 보인다. 특히 학제간 연구의 경우 복합적 주제일수록 AI 도구에 대한 의존도가 증가하는 경향을 보인다.
학술 출판계의 대응과 정책 현실
2024년 현재 주요 학술 출판사들은 AI 사용에 대해 명확한 입장을 표명하고 있다. Nature, Science, Cell은 AI를 공저자로 등재하는 것을 금지하고 사용 시 반드시 명시하도록 요구한다. Elsevier와 Taylor & Francis는 2024년 7월부터 AI 생성 이미지를 전면 금지했으며, JAMA Network는 ChatGPT를 저자로 인용하는 것을 명시적으로 금지한다. 국제의학학술지편집인위원회(ICMJE)는 AI 도구가 저작물의 정확성과 무결성에 대한 책임을 질 수 없다는 이유로 저자 자격을 박탈한다고 명시했다.
AI 탐지 도구들이 속속 등장하고 있지만, 그 정확성에는 여전히 한계가 있다. GPTZero, Turnitin AI 등은 70-85% 정확도로 AI 생성 텍스트를 탐지하지만, 인간이 AI 텍스트를 수정하거나 AI가 인간의 스타일을 모방하는 경우 탐지가 어렵다. 특히 비영어권 연구자들의 번역된 텍스트를 AI 생성으로 오판하는 False Positive 문제가 증가하고 있다.
학계는 AI 사용을 둘러싼 복잡한 윤리적 딜레마에 직면해 있다. 찬성 논리로는 언어 장벽 해소로 글로벌 연구 참여가 확대되고, 문법적 오류 감소로 내용에 집중할 수 있으며, 연구 효율성 향상으로 더 많은 시간을 실질적 연구에 투입할 수 있다는 점이 제기된다. 반면 반대 논리로는 학술적 진정성(academic authenticity) 훼손, ‘ChatGPT-speak’ 확산으로 학술 언어가 획일화되며, 신진 연구자들의 글쓰기 능력이 퇴화될 우려가 있다는 점이 지적된다.
교육계의 대응과 새로운 문해력의 필요성
한국의 주요 대학들도 AI 시대에 맞는 새로운 교육 정책을 수립하고 있다. 성균관대학교는 2024년 9월 논문 작성용 생성형 AI 도구 워크숍을 개설했고, 서강대학교는 LLM 기반 연구 지원 챗봇을 도입했으며, 연세대학교는 AI 활용 가이드라인을 제정하고 윤리 교육을 강화했다.
AI 시대의 연구자들에게는 새로운 역량이 요구된다. 첫째, AI 활용 문해력으로 어떤 도구를 언제, 어떻게 사용할지 판단하는 능력이 필요하다. 둘째, 비판적 검증 능력으로 AI가 생성한 내용의 사실성과 적절성을 평가하는 능력이 요구된다. 셋째, 하이브리드 글쓰기로 인간의 창의성과 AI의 효율성을 결합하는 능력이 중요해졌다.
기술적 혁신과 탐지 기술의 진화
연구진들은 더욱 정교한 AI 탐지 방법을 개발하고 있다. 문체 지문(Stylometric Fingerprinting)은 개별 저자의 고유한 문체적 특징을 학습해 AI 개입 여부를 판단하고, 시계열 분석은 동일 저자의 과거 논문과 현재 논문의 문체 변화 패턴을 분석한다. 다중 모달 검증은 텍스트뿐만 아니라 인용 패턴, 구조적 특징 등을 종합 분석하는 방식이다.
흥미롭게도 AI 생성 텍스트를 ‘인간화’하는 도구들도 등장하고 있다. Undetectable AI, QuillBot 같은 도구들이 AI 생성 텍스트를 인간이 쓴 것처럼 변환하고, 각종 Paraphrasing 도구들은 문장 구조와 어휘를 변경해 탐지를 회피한다. 이는 탐지와 회피의 끝없는 기술 경쟁을 예고한다.
부작용과 위험 신호들
연구에 따르면 ChatGPT 4.0은 최대 70%의 가짜 논문을 참고문헌으로 인용하는 심각한 문제를 보인다. 이는 실존하지 않는 저자와 논문 제목 생성, 실제 저자의 이름에 가짜 논문 제목 결합, 올바른 저널명에 존재하지 않는 논문 할당 등의 현상으로 나타난다.
‘ChatGPT-speak’라고 불리는 특유의 문체가 확산되면서 학술 언어의 다양성이 위협받고 있다. “delve into”, “it is crucial to note” 등의 표준화된 수사적 표현이 남용되고, 개별 연구자의 독특한 목소리가 상실되는 창의적 표현의 감소가 나타나고 있다. 또한 비서구권 연구자들의 고유한 표현 방식이 감소하면서 문화적 다양성이 훼손되고 있다.
미래 전망과 대응 방안
단기적으로는 1-2년 내 투명성 강화를 통해 모든 학술지에서 AI 사용 여부를 의무 공개하고, 연구자 대상 AI 윤리 및 활용 교육을 확대하며, 더욱 정확한 AI 탐지 알고리즘을 개발해야 한다.
중장기적으로는 3-5년 내 AI 시대에 맞는 연구 평가 기준을 개발하고, 인간-AI 협업의 최적 방안을 모색하며, 글로벌 차원의 AI 사용 가이드라인을 통일해야 한다.
근본적으로는 AI를 단순히 금지하거나 무제한 허용하는 이분법적 접근을 넘어서, AI와 인간이 상호 보완하는 새로운 학술 생태계를 구축해야 한다. 이는 AI는 초안 작성과 편집, 인간은 창의적 사고와 비판적 분석이라는 역할 분담의 명확화, AI 활용 논문에 대한 더욱 엄격한 검토 과정이라는 품질 보증 시스템, 그리고 학문적 진정성을 유지하면서도 기술의 혜택을 누리는 균형점을 찾는 윤리적 프레임워크를 포함한다.
결론: 전환점에서의 선택
이 연구가 보여주는 13.5%라는 수치는 단순한 통계를 넘어 학술 출판의 티핑 포인트를 의미한다. 2024년은 AI가 학문 생산에서 단순한 조력자에서 실질적인 공저자로 이동하는 역사적 전환점이 되었다.
그러나 이 변화가 학술적 퇴보를 의미하지는 않는다. 오히려 인간의 지적 능력을 확장하고 글로벌 지식 생산의 민주화를 이끌 잠재력을 지니고 있다. 핵심은 이 강력한 도구를 어떻게 현명하게 활용하느냐에 있다.
학계는 이제 기로에 서 있다. AI를 적대시하고 배척할 것인가, 아니면 학문적 엄밀성을 유지하면서도 그 혜택을 누릴 방법을 찾을 것인가. 후자를 선택한다면, 우리는 인류 지식 발전의 새로운 장을 열 수 있을 것이다. 그러기 위해서는 연구자, 출판사, 교육기관, 그리고 정책 입안자들이 함께 새로운 윤리적 프레임워크를 구축해야 한다.
AI가 쓴 논문이 어디까지 왔는지에 대한 답은 결국 우리가 그것을 어디까지 데려갈 것인지에 달려 있다. 이 여정에서 중요한 것은 기술의 속도에 맞춰가는 것이 아니라, 학문적 가치와 인간적 지혜를 잃지 않는 것이다.
댓글을 남겨주세요
댓글을 남기려면 로그인 해야 합니다.