이번 포스팅에서는 윈도우11 라이브 캡션 사용법부터, 자막 위치·스타일·언어 변경 등 상세 설정 노하우, 실제 음성 인식 성능 평가, 그리고 더 이상 사용하지 않을 때 라이브 캡션을 깔끔하게 끄는 방법까지 한 번에 정리해 보았습니다.
참고로 아래 글은 아래 테스트 날짜와 기기, 앱 버전에서 작동 여부를 직접 확인 완료 하였습니다.
테스트 날짜 : 26년 5월 26일
사용기기(PC) : Microsoft Surface Pro 11th Edition
윈도우 버전 : Windows 11 Pro / 25H2
OS 빌드 : 26200.8457
유튜브 영상이나 화상 회의를 보는 도중 갑자기 이어폰을 끼지 못하는 상황, 혹은 청각이 불편하신 가족분들과 함께 영상을 시청해야 할 때, 별도의 자막 파일 없이도 화면에 자동으로 자막을 띄워주는 기능이 있다면 정말 편리하실 텐데요. 마이크로소프트는 윈도우11에서 이런 사용자 요구를 정확히 반영한 윈도우11 라이브 캡션(Live Captions) 기능을 기본 탑재해 두었습니다.
윈도우11 라이브 캡션은 PC에서 재생되는 모든 오디오를 실시간으로 인식하여 화면 위에 자동 자막으로 변환해 주는 접근성 기능입니다. 유튜브, 넷플릭스, 디스코드, Zoom, 팟캐스트, 심지어 마이크로 입력되는 내 목소리까지 거의 모든 소리 입력에 대응하며, 한국어를 포함해 다국어 인식이 가능합니다. 무엇보다 모든 음성 인식이 PC 내부(로컬)에서 처리되기 때문에 인터넷 연결 없이도 작동하고, 음성 데이터가 외부로 전송되지 않아 보안에 안심할 수 있다는 점이 큰 장점입니다.
이번 포스팅에서는 윈도우11 라이브 캡션 사용법에 대해 정리해 보았습니다. 우선 가장 기본이 되는 윈도우11 라이브 캡션 켜는 방법에 대해 알아보고, 캡션 위치·자막 스타일·기본 설정 등 세부 옵션을 다듬는 방법, 실제 사용해 본 윈도우11 라이브 캡션 성능 평가, 그리고 마지막으로 윈도우11 라이브 캡션 끄기 방법까지 정리해보았습니다.
윈도우11 라이브 캡션 사용법 (켜는 방법)
윈도우11 라이브 캡션은 별도의 프로그램 설치 없이 윈도우 설정 메뉴에서 바로 활성화할 수 있습니다. 처음 켤 때 한 번만 한국어 언어 파일을 다운로드 받으면, 이후에는 단축키 한 번으로 곧바로 사용 가능합니다.
1. 설정 → 접근성 → 캡션 메뉴 진입
키보드 Windows 키 + I를 눌러 윈도우 설정을 열고, 좌측 메뉴에서 [접근성]을 클릭한 뒤 우측 화면을 아래로 스크롤 하여 [캡션] 항목을 선택해줍니다.

2. 라이브 캡션 토글 켬(On) + 언어 파일 다운로드 동의
캡션 화면이 표시되면 [라이브 캡션] 옆 토글 스위치를 ‘켬’으로 변경해줍니다. 이때 “번역을 사용하여 라이브 캡션을 설정하시겠습니까?”라는 상단 알림이 표시되는데, [예, 계속합니다]를 클릭해주시면 됩니다.

참고로 키보드만으로 빠르게 라이브 캡션을 켜는 방법도 있습니다. Windows 로고 키 + Ctrl + L 단축키를 동시에 누르면 메뉴 진입 없이 곧바로 윈도우11 라이브 캡션이 활성화됩니다.
3. 언어 팩 다운로드 완료까지 대기
최초 1회에 한해 음성 인식용 언어 파일이 자동으로 다운로드 됩니다. 화면 상단에 “언어 파일 다운로드 중” 진행률 표시줄이 나타나는데, 한국어 기준 대략 100~200MB 정도이며 인터넷 속도에 따라 1~3분 정도 소요됩니다.

다운로드가 완료되면 바로 윈도우11 라이브 캡션이 작동을 시작하며, 이후부터는 인터넷 연결 없이도 오프라인 환경에서 음성 인식이 가능합니다. 음성 데이터는 클라우드에 전송되지 않고 PC 내부에서만 처리되므로 개인정보 측면에서도 안전합니다.
윈도우11 라이브 캡션 상세 설정 (위치, 자막 스타일, 기본 설정)
윈도우11 라이브 캡션을 활성화하면 기본적으로 화면 상단에 작은 캡션 창이 표시되는데, 사용 환경에 따라 위치·스타일·세부 동작을 자유롭게 변경할 수 있습니다.
1. 캡션 표시 위치 변경 (위/아래/오버레이)
라이브 캡션 창 우측의 [설정(톱니바퀴) 아이콘]을 클릭한 뒤 [위치] 메뉴로 진입하시면 세 가지 표시 옵션을 선택할 수 있습니다.

– 위 화면 / 아래 화면 : 캡션 창이 바탕화면 상단 또는 하단에 고정 도킹되며, 다른 앱 창이 캡션을 가리지 않도록 작업 영역이 자동 조정됩니다. 화상회의나 강의 시청 시 추천합니다.
– 화면에 오버레이됨 : 캡션 창이 다른 앱 위에 떠 있는 형태로 표시되며, 마우스로 드래그하여 원하는 위치로 자유롭게 이동할 수 있습니다. 영상 시청 시 추천합니다.
2. 기본 설정 – 욕설 필터링 / 마이크 오디오 포함
설정(톱니바퀴) 아이콘에서 [기본 설정]으로 진입하면 윈도우11 라이브 캡션의 동작 방식을 세밀하게 조정할 수 있습니다.

– 욕설 필터링 : 비속어 또는 부적절한 단어를 별표(*) 처리합니다. 가족 단위 시청 환경에서 유용합니다.
– 마이크 오디오 포함 : 기본적으로 활성화되어 있으며, PC에서 재생되는 소리 뿐 아니라 마이크로 들어오는 내 목소리까지 자막으로 변환합니다. 화상회의에서 본인이 한 말도 자막으로 보고 싶다면 켜둡니다. 단순히 영상 시청만 한다면 꺼두는 것이 깔끔합니다.
– 자막 스타일 : 글꼴 크기·색상·배경 투명도·외곽선 등을 자유롭게 커스터마이징 할 수 있습니다.
윈도우11 라이브 캡션 성능 직접 테스트 (실사용 평가)
실제로 한국어 영상과 음성 입력을 통해 윈도우11 라이브 캡션의 인식 성능을 직접 테스트해 보았습니다.

마이크 앞에서 “안녕하세요? it 매뉴얼입니다”라고 명확하게 발화했을 때, 보시는 것처럼 거의 실시간(0.5초 내외 지연)으로 정확하게 한국어 자막이 표시됨을 확인할 수 있었습니다. 다만 실사용 평가는 아래와 같이 정리해 볼 수 있습니다.
– 표준 발음의 뉴스·강의·다큐멘터리 : 인식률 90% 이상으로 매우 우수합니다.
– 예능·일상 대화 (빠른 발화 + 사투리) : 인식률 70~80% 수준이며, 고유명사나 신조어는 다소 어색하게 변환되는 경우가 있습니다.
– 배경음악·여러 사람 동시 발화 : 인식률이 떨어지며, 노래 가사 자막 변환은 권장되지 않습니다.
– 지연 시간 : 평균 0.3~1초 사이로, 실시간 자막 용도로 충분히 사용 가능합니다.
전반적으로 윈도우11 라이브 캡션은 별도의 결제나 외부 서비스 없이도 데스크톱 환경에서 안정적인 한국어 자막 변환을 제공한다는 점에서, 청각 보조 도구나 외국어 학습 도구로서 충분한 가치가 있다고 평가됩니다.
윈도우11 라이브 캡션 끄기 방법
윈도우11 라이브 캡션을 더 이상 사용하지 않을 때는 아래 두 가지 방법 중 편한 것을 선택하시면 됩니다.
방법 1. 단축키로 즉시 끄기
가장 빠른 방법은 Windows 로고 키 + Ctrl + L 단축키를 다시 한 번 누르는 것입니다. 켤 때 사용했던 단축키와 동일하며, 토글 방식이라 누를 때마다 라이브 캡션이 켜지고 꺼지는 것이 반복됩니다.
방법 2. 라이브 캡션 창의 X 버튼 클릭
화면에 표시된 라이브 캡션 창 우측 상단의 X(닫기) 버튼을 직접 클릭하셔도 즉시 종료됩니다. 단, 이 방법은 현재 세션에서만 캡션이 사라지며 PC를 재부팅하면 자동으로 다시 켜지지 않으므로 안심하셔도 됩니다.
방법 3. 설정 메뉴에서 완전히 비활성화
아예 윈도우11 라이브 캡션 기능 자체를 비활성화 하고 싶다면, 설정 → 접근성 → 캡션으로 들어가서 라이브 캡션 토글을 ‘끔(Off)’으로 변경해주시면 됩니다. 이 경우 단축키를 눌러도 라이브 캡션이 작동하지 않게 됩니다.
윈도우11 라이브 캡션 사용 관련 개인 노하우
단순한 켜기/끄기 매뉴얼을 넘어, 윈도우11 라이브 캡션을 실제로 더 유용하게 활용하기 위한 실무적인 노하우를 공유드립니다.
노하우 1. 시스템 사운드를 캡션으로 잡으려면 ‘스테레오 믹스’ 또는 출력 장치 확인
의외로 많은 분들이 놓치는 부분인데, 윈도우11 라이브 캡션은 기본적으로 현재 활성화된 오디오 출력을 인식합니다. 만약 블루투스 이어폰으로 듣고 있는 영상의 자막이 안 잡힌다면, 사운드 설정에서 출력 장치가 올바르게 선택되어 있는지 한 번 확인해 보시는 것을 추천드립니다. 또한 일부 DRM이 적용된 스트리밍 콘텐츠(예: 일부 넷플릭스 영상)는 오디오가 보호되어 캡션이 잡히지 않을 수도 있습니다.
노하우 2. 영어 학습 도구로 활용하기 (영문 자막 변환)
윈도우11 라이브 캡션은 영어 음성을 영어 자막으로 변환하는 것 외에도, 영어 음성을 한국어로 번역하는 기능을 제공하지는 않지만, 반대로 다른 언어 음성을 영어로 번역해 표시하는 기능을 지원합니다. 라이브 캡션 창의 [언어 변경] 메뉴에서 영어 언어 팩을 추가 다운로드 받으시면, 유튜브 영어 강의나 TED 영상의 자막이 없는 콘텐츠도 자동으로 영어 캡션을 보면서 시청할 수 있어 영어 듣기 학습에 매우 유용합니다.
자주 묻는 질문 (FAQ)
Q1. 윈도우11 라이브 캡션이 메뉴에 안 보입니다. 어디서 활성화 하나요?
A1. 윈도우11 라이브 캡션은 Windows 11 버전 22H2 이상에서만 사용 가능합니다. 설정 → 시스템 → 정보에서 Windows 사양을 확인하신 뒤, 버전이 낮다면 Windows Update를 통해 최신 버전으로 업그레이드 해주셔야 합니다. 자세한 시스템 요구사항은 마이크로소프트 공식 안내 페이지 [Microsoft – 라이브 캡션을 사용하여 오디오 이해] 페이지에서 확인하실 수 있습니다.
Q2. 윈도우11 라이브 캡션 한국어 인식이 가능한가요?
A2. 네, 가능합니다. 25H2 기준 한국어 음성 인식이 정식 지원되며, 최초 1회 한국어 언어 팩 다운로드 후에는 인터넷 연결 없이도 오프라인에서 한국어 자막 변환이 가능합니다. 표준어 기준 인식률은 90% 내외로 상당히 안정적인 편입니다.
Q3. 라이브 캡션이 마이크 소리도 인식하나요? 화상회의에서 내 목소리만 빼고 싶습니다.
A3. 라이브 캡션 창의 설정(톱니바퀴) → [기본 설정] → [마이크 오디오 포함] 항목의 체크를 해제해주시면 됩니다. 이 옵션을 끄면 PC 스피커에서 나오는 상대방 음성만 자막으로 변환되고, 내 마이크 음성은 자막에서 제외됩니다.
Q4. 라이브 캡션 자막 글자가 너무 작은데 키울 수 있나요?
A4. 가능합니다. 라이브 캡션 창 설정 → [기본 설정] → [자막 스타일] 메뉴에서 글꼴 크기, 색상, 배경 투명도 등을 자유롭게 조정할 수 있습니다. 미리보기 화면을 통해 변경 사항을 즉시 확인 가능하며, 시인성 좋은 노란색 글자에 검정 외곽선 조합을 추천드립니다.
Q5. 윈도우11 라이브 캡션을 켜면 PC 성능에 부담이 가나요?
A5. 음성 인식이 PC 내부 NPU 또는 CPU에서 처리되기 때문에 약간의 리소스를 사용하긴 합니다. 다만 최근 5년 이내 제조된 인텔 i5/AMD 라이젠 5 이상 사양에서는 체감 성능 저하가 거의 없습니다. 노트북 사용 시에는 배터리 소모가 평소보다 다소 빠를 수 있으니, 사용하지 않을 때는 Windows 로고 키 + Ctrl + L로 꺼두시는 것을 권장합니다.
핵심 내용 요약
- 기본 활성화 : 설정 → 접근성 → 캡션 메뉴에서 윈도우11 라이브 캡션 토글을 켜거나, 단축키 Windows + Ctrl + L로 즉시 활성화할 수 있습니다.
- 한국어 지원 : 최초 1회 한국어 언어 팩 다운로드(약 100~200MB) 후에는 오프라인 환경에서도 한국어 자막 변환이 가능합니다.
- 상세 설정 : 캡션 창 톱니바퀴 아이콘에서 표시 위치(위/아래/오버레이), 마이크 포함 여부, 욕설 필터링, 자막 스타일을 자유롭게 변경할 수 있습니다.
- 실사용 성능 : 표준 발음 기준 90% 이상의 인식률을 보이며, 평균 지연 시간은 0.3~1초로 실시간 자막 용도로 활용하기에 충분합니다.
- 끄기 방법 : 단축키 재입력, 캡션 창 X 버튼, 또는 설정 메뉴에서 토글을 끄는 세 가지 방법 중 편한 것을 선택하면 됩니다.
- 개인정보 안전 : 모든 음성 데이터는 PC 내부에서만 처리되며 클라우드나 마이크로소프트로 전송되지 않습니다.
이번 포스팅에서는 윈도우11 라이브 캡션 사용법에 대해 정리해보았습니다. 우선 가장 기본이 되는 윈도우11 라이브 캡션 켜는 방법에 대해 알아보고, 캡션 위치·자막 스타일·기본 설정 등 세부 옵션 변경법, 직접 테스트해본 윈도우11 라이브 캡션 성능 평가, 그리고 마지막으로 윈도우11 라이브 캡션 끄기 방법까지 정리해보았습니다.
앞선 포스팅에서 정리한 윈도우11 활용법 및 노하우 관련 글은 아래와 같습니다.
윈도우11 바탕화면 보기 사라짐 해결 4가지 방법 1분 해결 꿀팁 (바탕화면보기 단축키)
윈도우11 와이파이 비밀번호 찾기 3가지 방법 총정리 (설정, 제어판, CMD)

작성자 : Sean Woo
[전공] HCI(인간-컴퓨터 상호작용)·UX(사용자 경험 연구)
[업무] 신기술 기반 사업 전략·기술 기획·디지털 트랜스포메이션 업무
ITmanual.net에서는 실생활, 업무를 진행하면서 느꼈던,
스마트폰(아이폰·갤럭시)·운영체제·각종 앱/프로그램·IT기기 활용 노하우를 실생활 중심 IT 매뉴얼로 정리합니다.