📱 Các nhà nghiên cứu từ Đại học Bách khoa Zurich (ETH Zurich) cùng với các chuyên gia của Anthropic đã chứng minh rằng các mô hình ngôn ngữ hiện đại (LLM) có khả năng hiệu quả trong việc tiết lộ danh tính của những người sở hữu tài khoản ẩn danh. Phát hiện này đặt ra mối đe dọa đối với tính ẩn danh như một trong những cách chính để bảo vệ quyền riêng tư trên mạng.
➡️ Các thuật toán kết hợp các thông điệp của người dùng trên các nền tảng khác nhau, phân tích văn bản tự do và các quy luật hành vi ẩn. Trong các thí nghiệm, mạng nơ-ron đã thành công trong việc xác định 68% hồ sơ ẩn danh, và độ chính xác trong việc xác định danh tính ở một số trường hợp đạt tới 90%.
📍 Các phương pháp phân tích chính:
1. các liên kết giữa các nền tảng: AI đã phân tích các hồ sơ trên Hacker News và LinkedIn thông qua các liên kết. Ngay cả sau khi xóa tất cả các đề cập trực tiếp đến tên hoặc họ, mô hình ngôn ngữ vẫn xác định chính xác mối liên hệ giữa các tài khoản chỉ dựa trên phong cách và nội dung của các thông điệp;
2. dấu vân tay số (micro-identifiers): Sử dụng dữ liệu về sở thích và lịch sử hành động, tương tự như bộ dữ liệu nổi tiếng Netflix Prize, AI phục hồi danh tính của con người mà không cần bất kỳ chỉ dẫn trực tiếp nào về dữ liệu cá nhân;
3. phân tích sở thích trên Reddit: Nghiên cứu cho thấy rằng việc thảo luận về các chủ đề hẹp (chẳng hạn như phim) trong các cộng đồng khác nhau là một dấu hiệu độc nhất. Nếu người dùng bình luận về hơn mười bộ phim, độ chính xác trong việc xác định danh tính của họ tăng lên 99%.




