Loại dữ liệu nào các trang web thu thập về bạn?

Khi web lần đầu tiên trở thành xu hướng phổ biến vào giữa những năm 90(mid 90s) , một trong những đặc điểm chính của nó là tính ẩn danh. Không ai sử dụng tên thật của họ và bạn có thể sống cuộc sống thứ hai trực tuyến(life online) , với tốc độ 33 kbps.

Web ngày nay rất khác. Không chỉ có một sự thúc đẩy mạnh mẽ để hủy ẩn danh mọi người, các trang web bạn truy cập hàng ngày có thể ghi lại và nắm bắt tất cả các loại thông tin về bạn. Những loại thông tin? Đọc để tìm hiểu.

Địa chỉ IP của bạn(Your IP Address)

Đây là loại thông tin phổ biến nhất mà một trang web sẽ ghi lại. Địa chỉ IP hoặc Giao thức Internet(Internet Protocol) của bạn là một số biểu thị vị trí của bạn trên Internet.

Về cơ bản, nó giống với một địa chỉ trong thế giới thực. Nếu ai đó muốn gửi thư cho bạn, họ sẽ viết địa chỉ của bạn trên đó. Khi bạn nhận được nó, địa chỉ trả lại(return address) của họ sẽ ở mặt sau. Vì vậy, bạn biết nó đến từ đâu.

Nếu bạn thay thế “chữ cái” bằng “ gói internet(internet packet) ”, về cơ bản bạn biết cách hoạt động của địa chỉ IP(IP address) . Vấn đề là một trang web thực sự có thể tìm ra khá nhiều thông tin riêng tư về bạn chỉ từ địa chỉ IP(IP address) của bạn .

Họ sẽ ít nhiều biết bạn đang duyệt từ đâu và bạn đang sử dụng ISP nào. (ISP)Với công việc thám tử nhiều hơn một chút (và có thể là lệnh pháp lý), một địa chỉ IP(IP address) có thể dẫn ai đó trực tiếp đến cửa nhà bạn.

Đây là lý do tại sao rất nhiều người đang sử dụng VPN(VPNs) (mạng riêng ảo) những ngày này. VPN hoạt động như một người trung gian, vì vậy chỉ địa chỉ IP(IP address) của họ mới hiển thị cho trang web bạn đang truy cập.

Chi tiết phần cứng & phần mềm(Hardware & Software Details)

Các trình duyệt web(Web) báo cáo tất cả các loại thông tin cho một trang web yêu cầu nó. Điều này bao gồm nhiều thông tin về máy tính bạn đang sử dụng.

Trang web sẽ biết hệ điều hành(operating system) , bộ xử lý, GPU của bạn và hơn thế nữa. Điều này có vẻ vô tội, nhưng có thể được sử dụng để theo dõi hoặc xác định một máy cụ thể.

Một cách để giải quyết vấn đề này là duyệt từ bên trong một máy ảo, máy này sẽ cung cấp thông tin hệ thống(system information) chung cho trang web.

Cookie bên thứ 1 & bên thứ 3(1st & 3rd Party Cookies)

Cookie là một tệp nhỏ mà một trang web để lại trên máy tính của bạn để lưu giữ hồ sơ về những thứ chẳng hạn như tùy chọn trang web của bạn. Vì vậy, lần sau khi bạn truy cập, nó sẽ biết những điều về bạn.

Bản thân công nghệ cookie(Cookie technology) không phải là một điều xấu. Ví dụ: cookie phiên sẽ tự xóa khi bạn đóng trình duyệt. (Session)Bạn cũng nhận được cookie liên tục của bên thứ nhất, là những cookie được trang web lưu vào thiết bị của bạn để sử dụng cho chính nó.

Cookie theo dõi(tracking cookie) là một cookie bên thứ ba, bền vững, được đọc bởi các trang web khác với những trang đã tạo ra chúng. Cookie đó tích lũy thông tin về các hoạt động web của bạn và thông tin đó sau đó có thể quay trở lại người tạo cookie.

Luật pháp về cách thức và thời điểm sử dụng cookie đã được thắt chặt trong những năm gần đây. Đó(Which) là cách mà hầu hết mọi trang web đều có chính sách cookie(cookie policy) của nó bật lên ngay khi bạn truy cập nó lần đầu tiên. Nếu bạn không đồng ý với chính sách đó thì sẽ không có cookie nào được lưu trữ trên máy của bạn.

Tuy nhiên, không có gì ngăn cản một trang web lừa đảo(rogue site) tấn công máy của bạn bằng các cookie theo dõi mà bạn không biết. May mắn thay, bạn có thể sử dụng cài đặt bảo mật của trình duyệt để chặn và xóa cookie như mong muốn.

Trình theo dõi vô hình(Invisible Trackers)

Cookie có lẽ là một ví dụ về trình theo dõi vô hình, nhưng là một danh mục lớn hơn, trình theo dõi vô hình cũng bao gồm các ứng dụng web và các trang bên ngoài được nhúng trong một trang hợp pháp.

Các trang web tin tức lớn và các trang web phổ biến khác thường có nội dung quảng cáo được nhúng ở cuối bài viết, bao gồm một số hình thức theo dõi. Google cũng làm điều này. Đây là lý do tại sao khi bạn tìm kiếm một sản phẩm cụ thể trong Google , bạn sẽ thấy quảng cáo cho sản phẩm đó bật lên trên mọi trang web khác có Google Adsense .

May mắn thay, có những công cụ tìm kiếm tập trung vào quyền riêng tư như DuckDuckGo rõ ràng không theo dõi bạn.

Các trình duyệt hiện đại hiện nay cũng hỗ trợ một tính năng được gọi là “không theo dõi”, cho biết một trang web nên tắt công nghệ theo dõi khi bạn truy cập. Tuy nhiên, đây là thỏa thuận tự nguyện nên trang có thể bỏ qua nếu muốn.

Công cụ hiệu quả nhất trong cuộc chiến chống lại những kẻ theo dõi vô hình là EFF's Privacy Badger .

Dữ liệu tự động điền(Autofill Data)

Bạn có thể nhận thấy rằng khi bạn phải điền chi tiết giao hàng trên một trang web mới mà bạn chưa từng truy cập trước đây, trình duyệt của bạn sẽ tự động điền vào các chi tiết như tên và địa chỉ(name and address) của bạn . Đó là một tính năng tiện lợi, nhưng nó cũng là một cơn ác mộng về quyền riêng tư(privacy nightmare) .

Các trang web vô đạo đức có thể được mã hóa để nắm bắt thông tin đó vào lần thứ hai nó được tự động điền. Điều này có nghĩa là trang web đó hiện đã nắm bắt đầy đủ thông tin chi tiết của bạn mà bạn không hề hay biết. Như bạn có thể tưởng tượng, những thông tin như địa chỉ, tên đầy đủ hoặc số an sinh(security number) xã hội có thể được sử dụng để tàn phá những kẻ xấu.

Tốt nhất bạn chỉ nên tắt tính năng tự động điền trong cài đặt trình duyệt của mình.

Các tài khoản khác mà bạn đã đăng nhập(Other Accounts You’re Logged In To)

Khi bạn truy cập một trang web, nó có thể phát hiện những tài khoản khác mà bạn hiện đang đăng nhập bằng dấu vết chúng để lại trên máy của bạn. Đây thực sự là thông tin rất có giá trị, bởi vì kết hợp với một địa chỉ email(email address) đã biết , nó sẽ cho tin tặc biết bạn có tài khoản nào khác.

Vì vậy, nếu một trong những tài khoản đó là một phần của vi phạm dữ liệu(data breach) và mật khẩu của bạn bị phát hiện, bạn có thể gặp rắc rối. Nhiều người sử dụng các mật khẩu giống nhau hoặc tương tự trên các tài khoản, do đó, điều này khiến tin tặc dễ dàng xâm phạm bảo mật của bạn hơn.

Điều tốt nhất cần làm ở đây là sử dụng mật khẩu mạnh, duy nhất cho mọi tài khoản. Một trình quản lý mật khẩu(password manager) tốt tạo ra những mật khẩu ngẫu nhiên đó rất được khuyến khích.

Nhật ký đầu vào chi tiết(Detailed Input Logs)

Các trang web có thể được mã hóa theo cách mà mọi thao tác gõ phím và mọi chuyển động chuột(mouse movement) bạn thực hiện đều được ghi lại chi tiết. Khả năng theo dõi của các trang web về vấn đề này là khá rộng rãi.

Một tài liệu nghiên cứu mô tả chi tiết về “ tập lệnh phát lại phiên(session replay scripts) ” đã chứng minh rằng hầu hết các trang web lớn đều tạo bản ghi hoàn chỉnh các lần nhấn phím và chuyển động chuột của bạn khi bạn đang truy cập và sau đó sử dụng điều này để phân tích thêm. Bạn có thể hình dung các loại vấn đề về quyền riêng tư mà điều này có thể gây ra.

Vân tay trình duyệt(Browser Fingerprints)

“Dấu vân tay” của trình duyệt chỉ đơn giản là sự kết hợp duy nhất của dữ liệu trình duyệt, chẳng hạn như cookie nào có trên hệ thống của bạn và plugin nào được cài đặt. Trình duyệt được sử dụng càng lâu và càng được tùy chỉnh thì càng dễ dàng liên kết với một người dùng cụ thể.

Ví dụ: ngay cả khi bạn sử dụng VPN để truy cập một trang web, trang web đó sẽ biết dấu vân tay của bạn. Vì vậy, nếu bạn truy cập một trang web khác bằng chính trình duyệt đó mà không được bảo vệ ẩn danh, có thể tạo ra một liên kết rõ ràng giữa các hoạt động đó.

Sử dụng một trình duyệt hướng đến quyền riêng tư như Tor Browser là một cách tốt để ngăn chặn loại ẩn danh này.

Làm thế nào để kiểm tra những gì bạn đang rò rỉ(How To Check What You Are Leaking)

Một số trang web tồn tại sẽ giúp bạn tìm ra nơi và cách bạn đang rò rỉ thông tin. Panopticlick là một công cụ tuyệt vời của Electronic Frontier Foundation thực hiện điều đó.

Chỉ cần nhấp vào nút lớn “kiểm tra tôi” và tất cả nỗi sợ hãi hoang tưởng của bạn có thể được xác nhận. May mắn thay, không bao giờ là thời điểm xấu để nâng cao các thực tiễn về quyền riêng tư của bạn.



About the author

Tôi là một chuyên gia máy tính với hơn 10 năm kinh nghiệm. Khi rảnh rỗi, tôi thích giúp việc tại bàn văn phòng và dạy bọn trẻ cách sử dụng Internet. Kỹ năng của tôi bao gồm nhiều thứ, nhưng điều quan trọng nhất là tôi biết cách giúp mọi người giải quyết vấn đề. Nếu bạn cần ai đó có thể giúp bạn trong việc khẩn cấp hoặc chỉ muốn một số mẹo cơ bản, vui lòng liên hệ với tôi!



Related posts