1. 개요
Screen reader컴퓨터나 모바일 화면의 텍스트를 TTS를 통해 읽어주는 소프트웨어이다.
일반적으로 시각장애인이 이를 이용해 눈으로 보는 대신 소리로 들으면서 화면에 담긴 정보를 이해하는데 사용한다.
스크린 리더는 단순히 제공된 내용을 읽어주는 소프트웨어에 불과하므로 텍스트 데이터를 제외한 시각적인 힌트로 제공된 내용을 사용자에게 알려주는 것은 힘들다. 대표적으로 이미지가 있는데 보통 접근성을 고려해서 이미지에 대체 텍스트를 집어넣음으로써 시각장애인에게 해당 이미지가 무슨 내용을 담고 있는지 알려준다. 최근(2010년대~2020년대)에 개선되거나 출시된 것인 경우 OCR기능과 연동하여 대체 텍스트가 없는 이미지 파일 내 텍스트를 추출하여 읽어줄 수 있는 기능이 있다.
웹에서도 웹 표준을 다룰 때 많이 거론되며 웹사이트가 접근성을 잘 지키는가를 평가하는 가장 큰 척도 중 하나가 스크린 리더로 읽힐 때 올바른 내용을 제공하는가이다. 만약 alt 속성 없는 이미지가 도배된 사이트라면 스크린 리더를 사용하는 시각장애인들에게는 무슨 내용인지 알 도리가 없다. 그나마 현재는 웹사이트에 플래시가 사라져서 나아졌지만 플래시가 도배되던 K-인터넷 리즈 시절에는 그야말로 답이 없었다.
2. 종류
2.1. PC
부팅이 완료된 뒤에야 실행되는 어플이라는 한계 때문에 부팅메뉴를 읽어주지 못하는 공통점이 있다.대부분 키보드로 작업을 하고 마우스나 터치패드/트랙패드는 비시각장애인과 협력할 때에만 사용하도록 설계되었다.
-
JAWS(Job Access With Speech): Freedom Scientific에서 개발한 스크린 리더. 무려 1989년에 DOS용도로 먼저 개발된 오랜 역사를 가진 스크린리더다. 굳이 정확히 표기하자면, DOS버전과 구분하기 위해 JAWS for Windows라고 표기해야 맞지만 너무 길기 때문에 흔히 JAWS라고만 부른다. 기본가만 1,000,000원이 넘으며 환율 사정에 따라 가격 변동이 생기지만 MS오피스등 MS사 관련 기능에서는 우월한 성능을 지닌다. 2013년부터 실로암시각장애인복지관에 의해 한국어로 번역•판매되고 있다.
사실 성능 자체만 놓고 보면 구리다(...) 다만 어떤 스크린리더보다 상세하게 잘 읽어준다.[1] -
내레이터(Narrator):
Windows 2000부터 탑제된 윈도우 운영체제의 기본 스크린 리더다. 한국어 TTS는
Windows 8에 탑제되었다. 다른 스크린리더에 비해 더디지만 Windows 11이 출시된 지금도 꾸준히 업데이트 되고 있다. 다소 기능이 빈약한 감이 있지만, 기본 기능에는 충실한 스크린리더다. 한국인들에게 지원되는
TTS인 Microsoft Heami Desktop이 너무 저질이라 악명이 높다. 스크린리더 자체보다는 TTS가 인식을 깎아먹은 케이스. 23H2 이후 자연스러운 음성이 추가되며 훨씬 낳아졌다.
또한, 내레이터를 끌때 바로 꺼지는게 아니라 내레이터를 끝냅니다 음성이 나오고 꺼진다.
여담으로, Windows XP 이전의 TTS는 Microsoft Sam인데, soi와 soy를 구별하지 못해 발음할 수 없다.soi 발음이 헬리콥터 같아서 Roflcopter라고도 불렸다. #1 #2 #3 - NVDA(NonVisual Desktop Access): 호주의 비영리 기관인 NVAccess에서 Python을 기반으로 개발한 무료 오픈소스 스크린 리더로, 저사양 컴퓨터에서도 작동한다는 것이 장점이다. 유료 스크린 리더에 비해 기본 기능은 적지만, 유저 또는 개발자가 만든 추가 기능을 통해 여러 기능을 추가할 수 있다. 초기에는 개인 사용자들을 중심으로 국문화가 진행되었으며, 사회복지공동모금회의 사업으로 지원받아 경북점자도서관에서 국내 환경에 필요하고 알맞게 커스텀한 버전인 VoiceWith(보이스위드)를 무료로 배포하기 시작했다. 경북점자도서관 회원만 보이스위드를 최대 3대의 기기에 설치할 수 있었으나 언젠가부터 인증 방식을 없애버렸다.
- orca:리눅스 gnome 환경에서 사용할 수 있는 스크린리더. 리눅스를 사용하는 사람이 윈도우와 맥에 비해 적다보니, 다른 스크린리더에비해 기능이 조금 떨어지긴 하지만, 일반적인 웹,화면탐색,터미널 이용등엔 문제가 없다.
- 센스리더(Sense Reader): 엑스비전테크놀로지에서 개발 및 판매하는 스크린 리더로 국내에서는 가장 유명하며 널리 사용되고 있다. 가격이 최소 30만원에서부터 100만원에 달하는 고가이지만, 국내 컴퓨터 환경에 가장 최적화되어 있으며 10여년간 초기 구입비를 제외하면 지속적으로 무료 업데이트를 지원하고 있다. 단축키가 NVDA, Narrator, 보이스오버에 비해 복잡하다. 독음과 획수가 같은 일부 한자를 똑같이 읽어주는 문제가 있다. 예로 人과 儿(어진사람 인)을 똑같이 '사람 인, 2획'으로 읽어준다.
- 실로암보이스: 실로암시각장애인복지관에서 만든 스크린 리더다. Korean JAWS가 생겨나면서 개발이 중단되었다. Windows 7까지만 사용이 가능하다.
- 보이스오버(VoiceOver): macOS의 번들 스크린리더다. Narrator를 제외한 다른 스크린리더들과 다르게 운영체제를 만든 애플에서 공식적으로 제공하고있는 스크린리더다.
2.2. 모바일
모바일 스크린 리더는 터치 스크린에 최적화된 것이 특징이다. 시각장애인은 눈으로 보고 정확한 위치를 누를 수 없기 때문에 두 번 눌러야 실행되는 것이 특징이다. 손가락을 쓸어 넘겨는 동작을 통해 화면 속 항목을 한 개씩 탐색하고, 두번 눌러서 실행한다. iOS나 안드로이드에서 이 기능을 잘못켰다가 못 꺼서 엉엉 우는 사람들을 가끔 볼 수 있다.- 톡백(TalkBack): 안드로이드의 내장 스크린 리더. 초기 갤럭시 모델은 보이스 어시스턴트(Voice Assistant)라는 삼성이 톡백을 개조한 독자적인 전용 버전이 사용되었기 때문에 내장되지 않았지만 안드로이드 11부터 보이스 어시스턴트가 톡백과 통합되어 안드로이드11 이상이 탑재된 모든 갤럭시 기기도 톡백을 내장하고 있다.
- 보이스오버(VoiceOver): iOS의 번들 스크린 리더다. macOS와 마찬가지로 애플에서 제공, 관리한다. macOS용 VoiceOver를 기반으로 iOS에 맞춰서 만든 스크린리더이기 때문에 macOS용과 사용자 경험이 비슷하다. macOS VoiceOver에서 트랙패드 명령자를 켜면 iOS와 비슷한 손동작으로 화면을 탐색할 수 있다.
3. 여담
사용자 측면에선 Narrator(최소한 지원), orca, 보이스오버처럼 운영체제 자체에서 스크린리더를 제공해주는 것이 좋다.nvda, 센스리더 등 사용자가 별도로 설치해야되는 프로그램이라면, 운영체제를 설치한 뒤부터 스크린리더를 설치할까지 스크린리더의 도움을 받을 수 없기 때문이다.
시간을 절약하기 위해 대체로 빠른 속도로 설정하고 사용하기 때문에 적응기간이 필요하다.
특정 언어를 지원하는 TTS 음성엔진마다 읽어줄 수 있는 문자 집합이 정해져 있다. 국어( 한국어) 기준으로 한글, 한자, 로마자, 숫자와 일부 문장부호만 읽어주고 다른 문자(센스리더는 이에 가나, 주음부호를 제외할 수 있다.) 및 [문장부호]]를 읽어주지 못한다. 반면 VoiceOver는 점자를 제외하고 유니코드 테이블에 등록된 형식으로 읽어주지만, 한국어 엔진으로 한자도 유니코드 테이블에 등록된 형식으로 읽는다. 예로 上을 CJK Unified 4009로 읽어준다.
나무위키 내 항목에 있는 가려진 단락, 표의 접힌 부분도 읽어 줘 버린다.
[1]
예를 하나 들자면, 정확한 문구는 아니다만 확인 버튼. 활성화하려면 스페이스를 누르세요 식으로도 읽는다.