mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-09-29 13:50:05

딥 웹

1. 개요2. 정의
2.1. 딥 웹과 다크 웹의 차이 및 오해
3. 접속방식4. 종류5. 실체가 알려진 딥 웹

1. 개요

딥 웹(deep web, 심층 웹)이란 인터넷 봇(웹 크롤러)에 의해 수집, 색인되지 않거나 접근이 보호되어 있는 등의 이유로, 일반적인 검색 엔진이나 주요 트래픽 웹의 링크를 통해 도달할 수 없는 을 가리킨다. 반의어는 서피스 웹(surface web, 표면 웹)이다.

2. 정의

넷, 혹은 네트워크라는 것은 간단히 말하면 둘 이상의 컴퓨터를 연결하는 기술이고, 웹은 네트워크 기술을 바탕으로 쌓아올려진 정보와 콘텐츠의 총망라이다. 그렇기 때문에 인터넷 하면 흔히 생각하는 동영상이나 블로그 등과 그를 이어주는 검색 엔진을 넘어 이메일, 파일 공유(토렌트, eMule 등), 웹캠, 동영상 스트리밍, 온라인 게임, VoIP, 모바일 앱 등 다양한 서비스들도 포함된다.[1] 그리고 딥 웹은 위의 모든 것 중 구글 검색에 뜨지 않는 대부분의 것이다. 즉, '검색 가능한 것' 내지는 '인덱싱 된 것'의 여집합이 딥 웹인 것이고, 그렇기 때문에 딥 웹의 역사는 검색 엔진의 역사와 밀접한 연관이 있다.[2]

2.1. 딥 웹과 다크 웹의 차이 및 오해

2010년 즈음 커뮤니티 등지로부터 딥 웹을 각종 음모론과 괴담하고 결부시켜 소개하는 경향이 짙어 규모를 과장시키거나 음지 성격으로 알리는 내용들이 많았다. 예를 들자면 "온갖 비인륜적 요소 미디어와 고어 및 혐짤, 마약이나 살인 청부, 스너프 필름, 아동 포르노 등 암시장 총망라다" 등이 그것인데, 본래 의미는 위처럼 검색 엔진 바깥의 총체를 일컫는 용어로서 위 괴담들은 다크 웹으로 분류해야 맞다. # 본 나무위키를 포함 딥 웹의 정의를 정정하는 소개가 후속으로 나오면서 사실 무근의 괴담들도 어느 정도 누그러졌지만 괴담의 재미와 충격이 많은 이들에게 각인된 탓인지, 괴이하거나 근원을 알 수 없는 미디어물이라면 딥 웹 드립을 치는 반응도 나오는 등[3] 일종의 인터넷 밈 같은 어휘로서도 활용되는 양상을 보이기도 한다.

그래서 대중의 인식과는 달리 사전적인 의미의 '딥 웹'은 우리 주변에서도 흔하게 접할 수 있다. 후술하겠지만 당장 자신의 이메일함은 로그인을 해야만 볼 수 있는 정보이므로 딥 웹에 해당하며, 각종 클라우드 서비스에 업로드된 자료들, WSJ 등 유료 인터넷 뉴스의 구독자 전용 지면[4] 또한 딥 웹에 해당한다고 볼 수 있다. 물론 위에 설명한 다크 웹 또한 딥 웹의 일종이긴 하나, 극히 일부에 불과하다.

또한 서피스 웹보다 딥 웹이 훨씬 방대하다는 이야기도 있는데, 아무도 딥 웹의 정확한 크기를 가늠할 수가 없으니 어느 정도는 맞고 어느 정도는 틀릴 수 있는 이야기이다. 딥 웹이라는 용어를 사실상 처음으로 사용한 2001년의 논문에 따르면 400배에서 550배에 달한다고 하고, 조금 더 최근의 연구에 따르면 그보다는 적다고 하지만 정확한 규모는 아무도 모른다. 크기를 알아내고자 하는 임의의 누군가가 접속해 자료를 열람할 수 있다면 검색 엔진 개발자(사)가 이를 인덱싱하지 않을 이유가 없고, 그렇게 되면 딥 웹이 아니게 되기 때문. 하지만 대부분의 자료나 연구에서 딥 웹이 더 크다는 것에는 동의를 하는 편이다.

3. 접속방식

4. 종류

5. 실체가 알려진 딥 웹



[1] 지금은 한정적인 분야에서만 쓰이는 텔넷, FTP, IRC 등도 있으며 이제는 거의 사라진 유즈넷, 고퍼, 아키(Archie)도 모두 인터넷에 해당한다. [2] 물론 검색 엔진이 있기 전에도 서피스 웹과 딥 웹으로 구분할 수 있을 자료는 존재하긴 했다. 예를 들면 특정 서비스에 로그인해야만 보이는 것들. 하지만 현재에 쓰이는 딥 웹의 정의는 사실상 검색 엔진에 의해 찾아지지 않는 것이므로 딥 웹의 역사=검색엔진의 역사 라고 하여도 크게 문제는 없는 것이다. [3] 영상이 기괴하기로 정평난 김근육 시리즈 제작자가 셀프로 딥 웹이라는 드립 시전하는 영상 #. 여담으로 유튜브에 업로드 되었으므로 서피스 웹 중의 서피스 웹이다. 역시 난해하다 [4] 그 웹페이지 자체는 제목이 검색엔진에 인덱싱되어 있지만 그 내용은 그렇지 않기 때문에 반쯤 딥 웹이다. [5] 심지어 이마저도 회원 등급을 철저히 차등하여 내부적으로 이용할 수 있는 게시판이 여러 단계로 구분지어진다. 이를 악용한 대표적인 사건이 SLR클럽 소모임 성인 정보 자료실화 사건이다. #

분류