新的停车问题!不谈技巧谈位置 你真的选对了吗?
![]() | Bài vi?t ho?c ?o?n này c?n ng??i am hi?u v? ch? ?? này tr? giúp biên t?p m? r?ng ho?c c?i thi?n. |

Web chìm (ti?ng Anh: deep web)[1] hay web ?n (ti?ng Anh: invisible web[2], undernet ho?c hidden web[3]) là ph?n n?i dung trên th? gi?i m?ng World Wide Web kh?ng thu?c v? web n?i (surface web), mà c? th? là nh?ng trang kh?ng ???c ?ánh d?u, ch? m?c (index) và kh?ng th? tìm ki?m ???c khi dùng các c?ng c? tìm ki?m th?ng th??ng. N?i dung c?a web chìm ?n bên d??i các b?n m?u HTML,[4][5] và có th? yêu c?u m?t kh?u ho?c truy c?p b?o m?t khác qua trang web c?ng c?ng.
Web chìm bao g?m nhi?u ?ng d?ng r?t ph? bi?n nh? web mail và ngan hàng tr?c tuy?n nh?ng nó c?ng bao g?m các d?ch v? mà ng??i dùng ph?i tr? ti?n, và ???c b?o v? b?i m?t paywall, nh? video theo yêu c?u, m?t s? t?p chí và báo chí tr?c tuy?n, và nhi?u h?n n?a. Nhà khoa h?c máy tính : Michael K. Bergman ???c cho là ?? t?o ra thu?t ng? này vào n?m 2001 nh? m?t thu?t ng? l?p ch? m?c tìm ki?m.[6]
N?m 2011, l??ng th?ng tin trên web chìm ?? v??t h?n h?n web n?i.
Quy m?
[s?a | s?a m? ngu?n]Web chìm là m?t ph?n c?a Internet. Trong m?t bài báo phát hành n?m 2001, nhà h?c gi? c?ng nh? là m?t doanh nhan tên Michael K. Bergman ?? vi?t: "Nh?ng trang deep web hi?n nay có kích th??c g?p 400 ??n 550 l?n so v?i nh?ng trang web ???c ??nh ngh?a th?ng th??ng trên th? gi?i."[7][8][9]
Trong m?t nghiên c?u t?i ??i h?c California, Berkeley n?m 2011, d?a trên ??c l??ng ngo?i suy, dung l??ng d? li?u trên web chìm kho?ng 7500 terabyte. C? th? g?m kho?ng 300.000 trang web chìm trong n?m 2004, và theo Shestakov, kho?ng 14 000 trang web chìm có xu?t x? t? Nga vào n?m 2006.
Tên g?i
[s?a | s?a m? ngu?n]Ngu?n g?c
[s?a | s?a m? ngu?n]Trong m?t bài báo chuyên ?? v? web chìm trên t?p chí Electronic Publishing, Michael Bergman ?? nh?c ??n vi?c Jill Ellsworth ?? s? d?ng thu?t ng? Invisible Web vào n?m 1994 ?? ám ch? các website kh?ng ??ng ky v?i b?t k? máy tìm ki?m nào c?. Bergman ?? trích d?n m?t bài vi?t vào tháng 1 n?m 1996 c?a tram pu: "M?t trang web ???c thi?t k? h?p ly, nh?ng ng??i l?p ra trang web ?ó ?? kh?ng ?? y t?i vi?c ??ng ky nó v?i b?t k? máy tìm ki?m nào. Vì v?y, kh?ng ai tìm th?y nó và nó ???c ?n. T?i g?i ?ó là web ?n (Invisible Web)."
Thu?t ng? Invisible Web tr??c ?ó ?? ???c Bruce Mount và Matthew B. Koll s? d?ng t?i Personal Library Software, trong m?t miêu t? v? các c?ng c? cocomelon @1 ???c tìm th?y trong m?t ?n ph?m vào tháng 12 n?m 1996.
Vi?c s? d?ng l?n ??u thu?t ng? Deep Web, hi?n nay ?? ???c m?i ng??i c?ng nh?n, ?ó là vào n?m 2001 trong m?t nghiên c?u c?a Bergman.
Khái ni?m hi?n t?i
[s?a | s?a m? ngu?n]Khái ni?m Deep Web ???c s? d?ng ?? ch? t?t c? nh?ng trang web mà các máy tìm ki?m nh? Google, Bing, Yahoo... kh?ng th? tìm th?y, bao g?m databases, các th?ng tin ??ng nh?p, Webmail...[10]
Tài nguyên
[s?a | s?a m? ngu?n]S? l??ng th?ng tin trên deep web ?ang t?ng nhanh. Giá tr? n?i dung c?a chúng kh?ng th? ?ánh giá ??y ?? ???c... l??ng th?ng tin ???c (các máy tìm ki?m) tìm th?y ch? chi?m 0.03% t?ng l??ng th?ng tin có trên Internet.[11]
—?Michael K Bergman, [8]
Tài nguyên trên web chìm ???c phan lo?i theo m?t ho?c nhi?u lo?i có trong danh m?c sau:
- N?i dung web ??ng: các trang web ??ng tr? v? k?t qu? theo m?t truy v?n ho?c x? ly theo d?ng form, ??c bi?t n?u s? d?ng các thành ph?n nh?p tên mi?n m? (nh? text field); các mi?n này r?t khó x? ly n?u kh?ng có ki?n th?c v? tên mi?n.
- Các n?i dung kh?ng ???c t?o liên k?t hyperlink: các trang kh?ng liên k?t v?i các trang khác, s? ng?n c?n các ch??ng trình dò (crawling program) truy c?p vào n?i dung c?a nó. Các trang này ???c truy c?p tr?c ti?p trên thanh ??a ch? trình duy?t, vì kh?ng có các ???ng d?n t?/trong b?t k? trang web nào khác.
- Các trang web ph?i xác th?c truy c?p: các trang yêu c?u ph?i ??ng ky và ??ng nh?p m?i vào xem th?ng tin ???c (các tài nguyên ???c password b?o v?).
- Các trang web có n?i dung thay ??i theo ng? c?nh: các trang web này hi?n th? n?i dung thay ??i tùy thu?c vào m?t s? ?i?u ki?n tác ??ng, ví d? nh? ng??i dùng t? các d?i IP c?a chau á truy c?p vào thì s? ???c xem n?i dung phù h?p cho khu v?c chau á.
- Các n?i dung web b? gi?i h?n truy c?p: m?t s? trang web gi?i h?n vi?c truy c?p t?i các n?i dung c?a nó b?ng m?t s? ph??ng pháp k? thu?t nh? file Robots.txt, CAPTCHAs ho?c tham s? HTTP headers ?? ng?n c?m các máy tìm ki?m truy c?p n?i dung c?a nó, c?ng nh? t?o phiên b?n cache n?i dung.
- N?i dung sinh t? script ho?c Flash, Ajax: m?t s? trang web ch? có th? truy c?p th?ng qua m?t liên k?t ???c sinh ra b?i m?t ?o?n m? JavaScript (mà hva là m?t ví d? tr?c ti?p), ho?c n?i dung ???c nhúng bên trong Flash ho?c ch? có th? ???c t?i v? th?ng qua Ajax.
- Các n?i dung kh?ng theo ki?u HTML/text: Các n?i dung d?ng text ???c m? hóa trong các file ?a ph??ng ti?n (hình ?nh ho?c video) ho?c các ??nh d?ng file ??c bi?t mà các c? máy tìm ki?m kh?ng th? x? ly ???c.
- N?i dung v?n b?n ch? có th? truy c?p th?ng qua giao th?c Gopher ho?c các file ???c l?u tr? trên các máy ch? FTP thì kh?ng ???c l?p ch? m?c b?i h?u h?t các máy tìm ki?m hi?n nay: các máy tìm ki?m th?ng d?ng nh? Google m?c nhiên kh?ng l?p ch? m?c cho các trang kh?ng dùng giao th?c HTTP ho?c HTTPS.
Truy c?p
[s?a | s?a m? ngu?n]?? khám phá n?i dung trên các trang web, các máy tìm ki?m s? d?ng các máy dò ?? l?n theo các hyperlink th?ng qua các s? ?? bi?t c?a c?ng giao th?c ?o. K? thu?t này ly t??ng ?? khám phá các ngu?n tài nguyên trên web n?i, nh?ng kh?ng có tác d?ng m?y ??i v?i web chìm. Ví d?, nh?ng máy dò này kh?ng th? tìm các trang liên k?t ??ng mà k?t qu? truy v?n database d?a trên s? v? ??nh các truy v?n có th? x?y ra. Chú y là ?i?u này có th? (m?t ph?n) ???c v??t qua b?i cách cung c?p các ???ng d?n t?i các k?t qu? truy v?n, nh?ng ?i?u này l?i v? tình làm th?i ph?ng s? n?i ti?ng cho m?t Trang deep web.
Vào 2005, Yahoo! th?c hi?n m?t d?ch v? tìm ki?m m?t ph?n nh? c?a web chìm b?ng cách ra m?t Yahoo! Subscriptions. Máy tìm ki?m này tìm ki?m trong vài trang web mà ph?i ??ng ky thành viên m?i vào xem n?i dung ???c. Vài trang này hi?n th? ??y ?? n?i dung cho máy tìm ki?m robot do ?ó chúng s? hi?n th? trên k?t qu? tìm ki?m c?a ng??i dùng, nh?ng sau ?ó hi?n th? lên m?t trang ??ng nh?p (log in) ho?c trang ??ng ky khi click vào m?t ???ng d?n t? trang k?t qu? tìm ki?m t? trang ?ó.
T? lúc trình duy?t Tor ra ??i, ng??i dùng có th? d? dàng truy c?p ???c vài t?ng trong deep web m?t cách khá an toàn (kh?i nh?ng trang dark web ho?c nh?ng trang web c?a t?i ph?m, web ch?a n?i dung phi pháp, hacker, th?ng tin m?t...) tràn lan trong deep web mà kh?ng ???c ki?m soát, ?nh h??ng ??n s? b?o m?t và an toàn c?a ng??i truy c?p. ?? duy?t các web trong ??y c?n nh?ng th? vi?n các ???ng d?n. Tuy nhiên, ?? truy c?p ???c nh?ng trang web b?o m?t h?n trong web chìm, ng??i dùng c?n ph?i có ki?n th?c v? ph?n m?m và ph?n c?ng cao.
N?i dung
[s?a | s?a m? ngu?n]Nói chung, n?i dung trên deep web (bao g?m c? dark web) ch?a ??ng các n?i dung sau:[12]
- Bán v? khí kh?ng có gi?y phép
- Hình ?nh khiêu dam tr? em
- Bán ph?n m?m ??c h?i, ph?n m?m l?u và h??ng d?n v? hacking
- Bán thu?c b?t h?p pháp
- Bán th?ng tin th? tín d?ng b? ?ánh c?p và tài kho?n ng??i dùng
- Bán các tài li?u gi? m?o và ti?n t?
- Tuy?n d?ng sát th?
- Bài b?c
- R?a ti?n
- Giao d?ch n?i gián
Dò tìm web chìm
[s?a | s?a m? ngu?n]Các nhà nghiên c?u ?? khám phá ra cách th?c dò tìm web chìm m?t cách t? ??ng. N?m 2011, Sriram Raghavan và Hector Garcia-Molina gi?i thi?u m? hình ki?n trúc cho m?t máy dò web ?n, s? d?ng các t? khóa cung c?p b?i ng??i dùng ho?c thu th?p t? các giao di?n truy v?n ?? truy v?n t?i các trang và tài nguyên web chìm. Alexandros Ntoulas, Petros Zerfos, và Junghoo Cho t?i UCLA ?? t?o ra m?t máy dò Hidden-Web cho phép t? ??ng t?o ra các truy v?n có y ngh?a m?t cách t? ??ng t?i các form nh?p d? li?u tìm ki?m. (ví d?: DEQUEL: ngoài nh?p l?nh truy v?n, nó còn chi?t xu?t d? li?u có c?u trúc t? các trang k?t qu?. M?t máy dò khác là DeepPeep, m?t d? án khác c?a ??i h?c Utah ???c tài tr? b?i t? ch?c National Science Foundation, cho phép t?p h?p các ngu?n Hidden-Web (d?ng Web) trong các tên mi?n khác nhau d?a vào các k? thu?t dò tìm d?a trên ng? c?nh.
Các máy tìm ki?m th??ng m?i ?? b?t ??u t?o ra các ph??ng pháp khác nhau ?? dò tìm web chìm. (???c phát tri?n ??u tiên b?i Google) và mod oai là các c? ch? cho phép các bên liên quan có th? khám phá các ngu?n tài nguyên deep web trên các server (trang ch?) ??c thù. C? hai c? ch? trên ??u cho phép các web server qu?ng cáo các ???ng d?n (URL) ???c truy c?p t?i chúng, b?ng cách ?ó nó cho phép t? ??ng khám phá các ngu?n tài nguyên kh?ng liên k?t tr?c ti?p t?i web n?i. H? th?ng duy?t web chìm c?a Google tính toán tr??c các tác v? nh? cho m?i form HTML và ??a vào trang HTML k?t qu? tìm ki?m vào ch? m?c tìm ki?m c?a Google. K?t qu? hi?n th? c?a các trang web chìm chi?m m?t ngàn truy v?n trong m?t giay. Trong h? th?ng này, các tính toán tr??c ???c th?c hi?n theo 3 ph??ng th?c sau:
- Ch?n các giá tr? ??u vào ?? tìm ki?m các th?ng tin d?ng ky t? (text search) th?ng qua các t? khóa (keyword),
- Xác ??nh các y?u t? ??u vào mà ch?p nh?n ch? các ki?u d? li?u xác ??nh nào ?ó (ví d? nh? ngày, tháng...),
- Ch?n m?t s? nh? các liên k?t ??u vào ?? t?o ra các URL thích h?p ?? ??a vào ch? m?c-tìm ki?m-web.
Phan lo?i tài nguyên
[s?a | s?a m? ngu?n]?? t? ??ng xác ??nh m?t tài nguyên web có ph?i thu?c d?ng web n?i hay web chìm hay kh?ng là m?t vi?c khó. M?t tài nguyên ???c ?ánh d?u b?i m?t search engine, thì kh?ng nh?t thi?t nó thu?c lo?i web n?i, b?i vì các tài nguyên trên m?ng có th? ???c tìm th?y b?ng nhi?u ph??ng pháp khác nhau (nh? Sitemap Protocol, mod oai, OAIster) thay vì các ph??ng pháp dò tìm (crawling) truy?n th?ng. N?u m?t máy tìm ki?m cung c?p m?t ???ng d?n c?a m?t tài nguyên nào ?ó trong m?t k?t qu? tìm ki?m c? th?, có th? cho ?ó là web n?i. Kh?ng may là, các máy tìm ki?m kh?ng ph?i kh?ng nào c?ng cung c?p t?t c? các ???ng d?n này (backlink). Ngay c? khi có backlink, c?ng kh?ng cách nào ?? phát hi?n ra ngu?n này có cung c?p ???ng d?n c?a chính nó t?i các trang web n?i mà kh?ng ph?i crawling toàn b? trang web hay kh?ng. Ngoài ra, c?ng có tr??ng h?p m?t tài nguyên ?n n?p trên web n?i, và m?t máy tìm ki?m nào ?ó ch?a tìm ra nó. Do ?ó, n?u chúng ta có m?t tài nguyên ??c quy?n, chúng ta kh?ng th? bi?t ch?c ch?n tài nguyên ?ó ?n n?p trên web n?i ho?c web chìm mà ch?a qua crawl (dò tìm) trang web ?ó.
H?u k?t c?ng vi?c phan lo?i k?t qu? tìm ki?m ?? ???c th? m?c hóa web n?i b?ng các ?? tài. ?? phan lo?i tài nguyên web chìm, Ipeirotis et al ?? gi?i thi?u m?t thu?t toán cho phép phan lo?i m?t trang web chìm thành các th? m?c mà t?o ra nhi?u hit nh?t d?a trên vài l?a ch?n c?n th?n, các truy v?n-t?p trung vào-ch? ??. Các ch? m?c c?a deep web ?ang phát tri?n g?m có OAIsters t?i ??i h?c Michigan, Intute t?i ??i h?c Manchester, Infomine t?i ??i h?c California t?i Riverside, và DirectSearch (b?i Gary Price). Các x?p lo?i này ??ng trên m?t thách th?c là vi?c tìm ki?m web chìm chia ra 2 c?p ?? th? m?c hóa. C?p ?? 1 là các trang ???c th? m?c hóa thành các ch? ?? theo chi?u d?c (nh? s?c kh?e, du l?ch, ? t?) và các ch? ??-ph? tùy theo tính ch?t c?a các n?i dung n?m d??i các database (c? s? d? li?u) c?a chúng.
Thách th?c l?n h?n n?a là ?? th? m?c hóa và bi?u ?? hóa các th?ng tin trích xu?t t? các ngu?n web chìm theo nhu c?u ng??i dùng-cu?i. Các b?n báo cáo tìm ki?m web chìm kh?ng th? hi?n th? các URL nh? các tìm ki?m th?ng th??ng. Ng??i dùng-cu?i mong ch? các c?ng c? tìm ki?m kh?ng ch? tìm ra nh?ng gì h? mu?n m?t cách nh?t mà còn ph?i hi?n th? k?t qu? ?ó m?t cách tr?c quan và than thi?n v?i ng??i dùng n?a. ?? hi?u ???c ng? ngh?a, các báo cáo tìm ki?m ph?i hi?u sau vào n?i dung n?m d??i các tài nguyên này ho?c là ng??i dùng s? b? l?c l?i trong bi?n URL mà n?i dung ??ng sau nó ch? ?n nh?p gì c?. ??nh d?ng mà các k?t qu? tìm ki?m hi?n th? ra r?t phong phú tùy theo ch? ?? ??c thù c?a tìm ki?m nào và lo?i n?i dung ???c ph? ra. Thách th?c này là tìm ra và bi?u ?? hóa các thành ph?n d? li?u t??ng t? t? nhi?u ngu?n khác nhau sao cho các k?t qu? tìm ki?m ???c s?p x?p trong m?t ??nh d?ng th?ng nh?t trên b?n báo cáo tìm ki?m b?t k? ngu?n tài nguyên mà nó l?y t? ?au.
Các t?ng trên Web chìm
[s?a | s?a m? ngu?n]Vi?c chia t?ng trên Web chìm có y ki?n trái ng??c: M?t s? cho r?ng trên Web chìm có 8 t?ng (ho?c h?n). Trong khi s? khác kh?ng ??nh r?ng, trên Web chìm hoàn toàn kh?ng có t?ng nào c? và khái ni?m t?ng trên Web chìm dùng ?? ch? kh? n?ng b?o m?t, khó truy c?p c?a m?t ??a ch? Internet nào ?ó, hay m?c ?? nguy hi?m c?a các th?ng tin website chia s?... ???c phan ra nh? FBI.
- M?c ?? 1: Web n?i (Surface Web)
Dùng ?? ch? nh?ng trang web mà chúng ta v?n truy c?p hàng ngày nh? Wikipedia, YouTube, Facebook... Chúng g?i chung là Web n?i, m?c dù ??i khi chúng ???c g?i là Common Web (Web th?ng th??ng) và ???c cho là T?ng 0 c?a Internet, trong khi nh?ng trang web ?en h?n nh? Reddit m?i là t?ng 1 c?a Internet.
- M?c ?? 2: Web v? th?a nh?n (Bergie Web)
???c cho r?ng, ?ay là t?ng cu?i cùng mà m?t ng??i dùng Internet có th? truy c?p m?t cách th?ng th??ng nh?t mà kh?ng c?n s? can thi?p khác ?? có th? truy c?p chúng (th?ng qua m?t proxy, dùng các trình duy?t h? tr? nh? Tor ho?c có s? can thi?p ??c bi?t vào ph?n c?ng máy tính). Theo khuy?n cáo, t?t nh?t kh?ng nên truy c?p nh?ng trang web sau v?i m?c ?? cao h?n 2. T?i ?ay, b?n có th? b?t g?p nh?ng trang web bí m?t (ng?m) ???c li?t kê, ví d? nh? 4chan.
- M?c ?? 3: Web ?n, Web chìm (Deep web, Onion Web)
T?ng này có th? truy c?p th?ng qua proxy ho?c h? th?ng m?ng Tor. Ch?a ??ng nh?ng th?ng tin nh?y c?m, kinh d?: ?u dam, clip kinh d?, trang web c?a các hacker (các trang chuyên hack).. Vì là t?ng ??u tiên c?a Internet mà vi?c truy c?p ph?i ???c ph?i th?ng qua m?t s? h? tr? t? m?ng Tor ho?c thi?t ??t ph?n c?ng, nên ??i khi c?ng dùng ?? ch? c? nh?ng t?ng cao h?n c?a Internet. T?ng này kh?ng th? truy c?p b?ng trình duy?t bình th??ng vì ??a ch? ?u?i c?a trang web lo?i này (.onion) khi truy c?p s? b? DNS xem là ??a ch? web kh?ng h?p l? khi truy c?p. Ch? có khi ?? k?t n?i v?i Proxy m?i có th? vào t?ng này b?ng trình duy?t bình th??ng.
- M?c ?? 4: Web ?i?u l? (Web Charter)
Lo?i m?ng này ???c chia thành 2 ph?n, ?? ch? cách th?c truy c?p:
- Ph?n 1: ???c truy c?p th?ng qua Tor, ch?a ??ng nh?ng n?i dung liên quan ??n ma tuy, v? khí, bu?n bán ng??i (human trafficking), gi?t ng??i thuê, bu?n bán các lo?i m?t hàng c?m. Ho?c các ?n b?n c?m (phim, sách v? d? giáo, ho?c b?o l?c...) th?m chí là ch? ?en ma túy nh? Silk Road (ch? ?en) . ?ay là t?ng cu?i cùng có th? truy c?p b?ng trình duy?t Tor khi s? d?ng máy tính bình th??ng. ? t?ng này ??i v?i ng??i dùng chuyên nghi?p th??ng s? s? d?ng Linux ch? kh?ng ph?i Windows vì Windows tuy b?o m?t nh?ng th?c t? bên trong có r?t nhi?u l? h?ng b?o m?t ch?a ???c khai thác r?t nguy hi?m cho ng??i s? d?ng.
- Ph?n 2: Truy c?p ch? khi có s? thay ??i v? ph?n c?ng (nang c?p ph?n c?ng máy tính sao cho th?t m?nh r?i ti?p t?c vào.) (? ?ay ch? nên s? d?ng Linux ch? kh?ng s? d?ng Windows vì Windows ? ?ay ?? h?t an toàn. Chúng th??ng ch?a ??ng thí nghi?m tình d?c trên tr? em, ph? n? mang thai và các thí nghi?m khoa h?c k? l? và v? cùng kinh kh?ng (k? c? trên c? th? con ng??i), th??ng khó ???c ch?p nh?n ???c vì tính v? nhan ??o c?a chúng.
- M?c ?? 5: Web ?n d?ng m?ng l??i xuyên th? gi?i - m?ng trong m?ng
N?u mu?n truy c?p ???c các trang web t?i m?c ?? 5, c?n có m?t h? th?ng máy tr?m ??c bi?t. T?i ?ay là n?i rò r? nh?ng tài li?u m?t c?a Qu?c gia, t? ch?c mà v?n th??ng th?y trên Wikileaks; các ho?t ??ng tam linh k? quái, các h?i ?oàn ho?t ??ng bí m?t, nh?ng ho?t ??ng hi?n t?... Ch? có th? truy c?p b?ng máy tr?m. Vi?c k?t n?i v?i lo?i m?ng này ???c c?nh báo là nên truy c?p b?ng m?t lo?i máy tr?m ??c bi?t, th??ng các lo?i máy này có c?u hình r?t m?nh ?? có th? gi?i m? t?t c? khóa b?o m?t có trong trang web. Lo?i m?ng này là m?ng - trong - m?ng, ?? k?t n?i vào lo?i web này c?n th?i gian r?t lau do ph?i k?t n?i v?i nhi?u máy ch?.
- M?c ?? 6: Diversion Web
Vi?c truy c?p vào Diversion Web ?òi h?i ph?i hi?u r? các v?n ?? liên quan ??n c? h?c l??ng t? và c?n có ki?n th?c sau r?ng v? máy tính và internet. K? c? vi?c v??t qua nh?ng hàng rào b?o m?t c?a Chính ph?. Kh?ng quá nhi?u th?ng tin ???c bi?t v? các trang web ? m?c ?? 6, th??ng ???c xem là rào c?n an toàn cho ng??i truy c?p n?u kh?ng mu?n ch?u r?i ro khi ti?n sau h?n.
- M?c ?? 7: The Fog/Virus Soup
Là n?i ho?t ??ng c?a nh?ng chuyên gia An ninh Internet, các tin t?c , th??ng di?n ra các hành ??ng phá ho?i l?n nhau, m?t cách c?ng khai ho?c lén lút nh?m b?o v? nh?ng th?ng tin m?t (nh?ng ??n hàng giá tr? cao hàng t? ??la). M?i ho?t ??ng t?i ?ay ??u kh?ng an toàn, ??c bi?t là nh?ng tài nguyên t?i v?, th??ng ch?a ??ng virus máy tính.
- M?c ?? 8: The Primarch System
Là n?i t?n cùng c?a "??i d??ng Internet", ???c phát hi?n ra vào n?m 2000 trong m?t l?n rà soát d? li?u t?p trung (Massive Deep Web Scan).
Vi?c có hay kh?ng vi?c phan t?ng Deep Web d?a m?c ?? b?o m?t c?a chúng v?n ch?a có s? th?ng nh?t.
Tính t?t – x?u
[s?a | s?a m? ngu?n]- M?t s? l??ng kh?ng nh? các trang Deep Web cung c?p nh?ng th?ng tin kh?ng t?t cho c?ng ??ng nh? ma tuy, tình d?c (??c bi?t là tình d?c liên quan ??n tr? em - ?u dam, tra t?n tình d?c), mua bán v? khí trái phép. ??c bi?t là giao d?ch ti?n ?o (nh? Bitcoin), mua bán n?i t?ng, mua bán ng??i
- Deep Web c?ng là n?i chia s? nh?ng tài li?u m?t b? rò r?, ch?ng h?n nh? th?ng qua WikiLeaks.
T??ng lai
[s?a | s?a m? ngu?n]Ranh gi?i gi?a nh?ng gì mà các c? máy tìm ki?m phát hi?n ???c và deep web ?? b?t ??u tr? nên phai nhòa, khi các d?ch v? tìm ki?m b?t ??u cung c?p d?ch v? truy xu?t t?i m?t ph?n ho?c toàn b? các n?i dung c?m c?p 1. L??ng n?i dung deep web ?ang ???c m? ra ?? t? do tìm ki?m khi các nhà xu?t b?n và th? thi?n ??ng y v?i các c? máy tìm ki?m l?n. Trong t??ng lai, n?i dung c?a deep web có th? b? thu h?p b?i vì c? h?i tìm ki?m th?ng tin b?ng cách tr? phí ho?c các d?ng b?n quy?n khác ra ??i.
Xem thêm
[s?a | s?a m? ngu?n]Chú thích
[s?a | s?a m? ngu?n]- ^ Hamilton, Nigel. "The Mechanics of a Deep Net Metasearch Engine". CiteSeerX 10.1.1.90.5847.
{{Chú thích t?p chí}}
: Chú thích magazine c?n|magazine=
(tr? giúp) - ^ Devine, Jane; Egger-Sider, Francine (tháng 7 n?m 2004). "Beyond google: the invisible web in the academic library". The Journal of Academic Librarianship. Quy?n 30 s? 4. tr. 265–269. doi:10.1016/j.acalib.2004.04.010. Truy c?p ngày 6 tháng 2 n?m 2014.
- ^ Raghavan, Sriram; Garcia-Molina, Hector (11–ngày 14 tháng 9 n?m 2001). "Crawling the Hidden Web". 27th International Conference on Very Large Data Bases. Rome, Italy.
{{Chú thích t?p chí}}
: Ki?m tra giá tr? ngày tháng trong:|date=
(tr? giúp) - ^ Madhavan, J., Ko, D., Kot, ?., Ganapathy, V., Rasmussen, A., & Halevy, A. (2008). Google's deep web crawl. Proceedings of the VLDB Endowment, 1(2), 1241-1252.
- ^ Shedden, Sam (ngày 8 tháng 6 n?m 2014). "How Do You Want Me to Do It? Does It Have to Look like an Accident? – an Assassin Selling a Hit on the Net; REVEALED INSIDE THE DEEP WEB". Sunday pMail. Trinity Mirror. B?n g?c l?u tr? ngày 1 tháng 3 n?m 2020. Truy c?p ngày 5 tháng 5 n?m 2017 – qua Questia.
{{Chú thích web}}
: ?? b? qua tham s? kh?ng r?|tr? ti?n=
(tr? giúp) - ^ Wright, Alex (ngày 22 tháng 2 n?m 2009). "Exploring a 'Deep Web' That Google Can't Grasp". The New York Times. Truy c?p ngày 23 tháng 2 n?m 2009.
- ^ Cau g?c: "The deep web is currently 400 to 550 times larger than the commonly defined world wide web."
- ^ a b The dark side of the internet - The Guardian
- ^ Deep Web Search Engines to Explore the Hidden Internet - The Hacker News
- ^ What is Deep web - Deep Web Search Engines to Explore the Hidden Internet - The Hacker News
- ^ The deep web is the fastest growing category of new information on the internet ... The value of deep web content is immeasurable ... internet searches are searching only 0.03% ... of the [total web] pages available.
- ^ What's Hiding In The Dark Web? - TruthFinder.com