과학 · AI Index 2026

리드

AI는 이미 자연과학의 공식 연구 도구가 됐다. 2025년 AI 관련 자연과학 논문 수는 80,150로 전년 대비 +26%. 분야별로는 지구과학이 8.79%로 AI 침투율이 가장 높고, 자연과학 전체 평균은 6.80%, 생명과학 6.48%, 물리 5.84%다. '컴퓨터 과학 안의 AI'가 아니라, 모든 자연과학이 AI를 자기 도구로 편입했다는 의미다.

2025년의 특이점은 작은 모델이 큰 모델을 이긴 해라는 것이다. 1억 1,100만 파라미터짜리 단백질 모델 MSAPairformer가 ProteinGym에서 이전 선두를 넘어섰다. 2억 파라미터의 유전체 모델 GPN-Star는 400억 파라미터 모델보다 높은 성능을 냈다. 데이터 품질과 도메인 큐레이션이 크기보다 더 중요한 변수가 된 상황이다.

핵심 수치

80,150건 — 2025 자연과학 AI 논문 (전년 대비 +26%). 출처: PDF p.234
8.79% — 지구과학 전체 논문 중 AI 비중 (최고). 출처: PDF p.235
38.8% vs 83.5% — PaperArena에서 최고 AI agent vs 박사 전문가. 출처: PDF p.233
~17% — BixBench(실세계 생물정보학) 프론티어 모델 정확도. 출처: PDF p.233

주장 1 — AI 논문은 자연과학의 정식 일부가 됐다

자연과학 AI 논문 — 80,150건

폭증

Stanford HAI, AI Index 2026 (p.234, Fig 5.1.1)

2024년 63,547건이던 자연과학 AI 논문이 2025년 80,150건으로 늘었다. 1년 +26%. AI로 논문을 쓰는 것과 AI를 대상으로 연구하는 것은 다르지만, 이 수치는 후자에 해당한다. 자연과학 연구자들이 ML/DL을 자기 실험 설계의 일부로 받아들였다는 뜻이다.

주장 2 — 지구과학이 AI 침투율이 가장 높다

분야별 AI 비중 — 5.8~8.8%

Stanford HAI, AI Index 2026 (p.235, Fig 5.1.2)

2025년 기준 전체 논문 중 AI 관련 논문 비중은 지구과학이 8.79%로 가장 높다. 자연과학 전체 평균 6.80%, 생명과학 6.48%, 물리 5.84%. 기상·기후·지구관측 데이터는 수십 년 누적된 표준화된 시계열이 많아 AI 학습 대상으로 친화적이다. Aardvark Weather는 AI가 전통 수치예보(numerical weather prediction)를 대체하는 첫 end-to-end 파이프라인이 됐고, FourCastNet 3는 60일 글로벌 예보를 4분 안에 돌린다 — 기존 모델 대비 8~60배 빠르다.

천문학에서는 AION-1이 첫 천문 파운데이션 모델로 등장했다. 5개 주요 서베이에서 2억 개가 넘는 천체 대상으로 학습했고, Multimodal Universe 데이터셋이 약 100TB의 관측 데이터를 통합했다. 데이터 표준화가 된 도메인부터 파운데이션 모델이 등장한다는 패턴이 반복해서 관찰된다.

주장 3 — 자율 연구에서 AI는 아직 박사의 절반

PaperArena — AI 38.8% vs PhD 83.5%

Stanford HAI, AI Index 2026 (p.233)

논문 작성, 실험 설계, 결과 해석까지 end-to-end로 수행하는 'AI 과학자' 시나리오에서는 격차가 크다. PaperArena에서 최고 AI agent의 점수는 38.8%, 박사 전문가 베이스라인은 83.5%다. BixBench(실세계 생물정보학 과제)에서는 프론티어 모델의 정확도가 약 17%에 그친다.

다른 지표도 있다. ChemBench에서는 최고 모델이 평균 화학자를 넘어섰다. 그러나 같은 모델이 종종 기초 과제에서 실패한다. ReplicationBench의 논문 스케일 천체물리 재현에서 프론티어 모델은 20% 미만. UnivEarth의 지구관측 질문에서는 33% 정확도이고, 코드 실행 기준으로는 58%가 실패한다.

2025년에는 Sakana의 AI Scientist-v2가 생성한 논문이 ICLR 워크숍에 채택되는 첫 사례가 나왔다. Google의 AI Co-Scientist는 세 개의 생물의학 영역에서 검증을 받았다. 자율 연구의 문턱은 이제 열리기 시작한 단계다 — 진입은 했지만 독립된 연구자 수준은 아니다.

주장 4 — 서브필드별 볼륨도 확연하다

하위분야 볼륨 비교

Stanford HAI, AI Index 2026 (p.235, Fig 5.1.1)

2025년 AI 논문 총량을 세부 분야별로 보면 자연과학 전체 80.15K, 물리 33.05K, 생명 28.91K, 지구 20.46K로 집계된다. 의학·약학을 다룬 6장의 연구와 부분 중복이 있지만, 이 챕터는 기초과학 연구 방법 자체에 AI가 들어온 비율을 본다.

한 가지 리포트가 반복해서 강조하는 지점은, 기초과학 AI 모델의 상당수가 학계·정부 연구소에서 나온다는 점이다. 범용 AI는 산업계가 90% 이상을 공급하지만, 과학 AI는 공공·학계 비중이 월등하다. 지구과학 데이터셋은 사실상 정부·학술 기관에서만 나온다. 이 구조는 AI 경제의 나머지 영역과 정반대 방향을 향한다 — 기초 데이터의 공공성이 AI 과학의 경쟁력 자체인 구조다.

Korea Context (직접 언급 없음)

이 챕터에서 한국의 개별 연구 성과는 원문에 개별 명시되지 않았다. AI 기상·신약·단백질 쪽 한국 사례(서울대 AI 기상 모델, KAIST 단백질 연구 등)는 리포트 본문의 케이스 스터디에 포함되지 않았다.
한국의 R&D 전반은 Chapter 01, 의료 쪽 사례는 Chapter 06의 맥락에서 살핀다. Korea Focus에는 과학-의료 경계 지표가 있다.

→ 한국 연구 지형은 Korea Focus #rnd

So What?

AI의 과학 진입은 3단계 지도다. (1) 데이터에 ML을 적용하는 단계(수십 년), (2) 연구자의 워크플로를 보조하는 단계(2023~2025에 급팽창), (3) 자율 발견 단계(2025에 문턱). 기관의 전략은 어느 단계에 집중할지부터 정해야 한다.
크기가 아니라 큐레이션이 이겼다. 111M 파라미터가 40B를 넘긴 장면은 '작은 팀도 경쟁 가능하다'는 메시지다. 단, 전제는 도메인 특화 데이터 표준과 큐레이션 파이프라인이 갖춰진 경우다.
과학 AI는 공공 데이터 인프라 싸움이다. 지구과학·천문학에서 파운데이션 모델이 먼저 나온 이유가 여기에 있다. 한국이 강한 기상·바이오·신소재에서 공공 데이터 표준화가 경쟁력의 전제라는 관점은 Korea Focus에서 이어 본다.

원본 참조: Stanford HAI, AI Index Report 2026, Chapter 5 (Science), pp. 232–255.