Thử thách: Nếu bạn hoặc bạn bè của bạn nhận được chuỗi văn bản sau đây trong một bữa tiệc, liệu có ai trong phòng có thể tự tin đoán hoặc suy luận bất kỳ đặc điểm cá nhân nào của tác giả văn bản không? Hãy dành vài giây cho bản thân.

ChatGPT có thể “suy luận” các chi tiết cá nhân từ văn bản ẩn danh

Nhanh tay đăng ký 4g vina để có thể nhận ngay ưu đãi data cực khủng để tha hồ xem phim trực tuyến, cập nhật tin tức mới trong ngày mà không sợ giật lag hay bị giới hạn dung lượng nhé!

Nếu bạn giống nhà văn này, có lẽ bạn không thể phân tích nhiều từ 18 từ đó, ngoài việc có thể cho rằng nhà văn nói tiếng Anh và có khả năng đã lớn tuổi. Mặt khác, các mô hình ngôn ngữ lớn làm nền tảng cho một số chatbot AI phổ biến nhất thế giới có thể nhận ra nhiều điều hơn thế. Gần đây, khi các nhà nghiên cứu đưa dòng văn bản tương tự đó vào GPT-4 của OpenAI, mô hình này đã có thể suy ra chính xác thành phố cư trú của người dùng, Melbourne Australia. Quà tặng: Quyết định của người viết khi sử dụng cụm từ “chuyển hướng”. Ở đâu đó, ẩn sâu trong tập huấn luyện khổng lồ của mô hình AI, là một điểm dữ liệu tiết lộ câu trả lời.

Một nhóm các nhà nghiên cứu kiểm tra các mô hình ngôn ngữ lớn từ OpenAI, Meta, Google và Anthropic đã tìm thấy nhiều ví dụ trong đó các mô hình có thể suy luận chính xác chủng tộc, nghề nghiệp, vị trí và các thông tin cá nhân khác của người dùng chỉ từ các cuộc trò chuyện dường như vô hại. Các tác giả giải thích trong một bài báo chưa được phản biện rằng, cùng các kỹ thuật dữ liệu được sử dụng để tạo ra công thức pha chế AI đó, cũng có thể bị lạm dụng bởi các đối tượng xấu để cố gắng vén màn một số đặc điểm cá nhân nhất định từ những người dùng giả danh “ẩn danh”.

“Các phát hiện của chúng tôi cho thấy các mô hình ngôn ngữ lớn hiện tại có thể suy luận dữ liệu cá nhân ở quy mô chưa từng có”, các tác giả viết. “Trong bối cảnh thiếu các biện pháp bảo vệ hiệu quả, chúng tôi ủng hộ một cuộc thảo luận rộng rãi hơn xung quanh các hệ quả về quyền riêng tư của mô hình ngôn ngữ lớn vượt ra ngoài việc ghi nhớ, phấn đấu để bảo vệ quyền riêng tư rộng rãi hơn. “

Các nhà nghiên cứu kiểm tra khả năng suy luận của LLM bằng cách cung cấp cho chúng các đoạn văn bản từ cơ sở dữ liệu các bình luận được lấy từ hơn 500 hồ sơ Reddit. Mô hình GPT4 của OpenAI, họ lưu ý, có thể suy luận chính xác thông tin cá nhân từ các bài đăng với độ chính xác từ 85 đến 95 phần trăm.

Thường thì, văn bản được cung cấp cho các LLM không chứa rõ ràng các dòng “Tôi đến từ Texas này” hoặc “Tôi ở độ tuổi 30”. Thay vào đó, chúng thường có các cuộc đối thoại tinh tế hơn, nơi cách diễn đạt cụ thể của các loại từ được sử dụng, cho thấy cái nhìn thoáng qua về bối cảnh của người dùng. Trong một số trường hợp, các nhà nghiên cứu nói rằng LLM thậm chí có thể dự đoán chính xác các thuộc tính cá nhân của người dùng ngay cả khi chuỗi văn bản được phân tích cố ý bỏ qua các đặc điểm như tuổi tác hoặc vị trí.

Mislav Balunović, một trong những nhà nghiên cứu tham gia nghiên cứu, cho biết LLM có thể suy ra khả năng cao rằng người dùng là người Da đen sau khi nhận được một chuỗi văn bản cho biết họ sống ở đâu đó gần một nhà hàng ở Thành phố New York. Mô hình này có thể xác định vị trí của nhà hàng và sau đó sử dụng số liệu thống kê dân số có trong cơ sở dữ liệu đào tạo của nó để đưa ra suy luận đó.

Trợ lý Giáo sư Florian Tramèr của ETH Zurich cho biết trong một cuộc phỏng vấn gần đây với Wired: “Điều này chắc chắn đặt ra câu hỏi về lượng thông tin về bản thân chúng ta đang vô tình bị rò rỉ trong những tình huống mà chúng ta có thể mong đợi sự ẩn danh”.

Xem phim trực tuyến thả ga, làm bài tập và tra cứu tài liệu thoải mái, nghe nhạc online cực mượt mà, còn chần chờ gì nữa mà bạn không nhanh tay đăng ký gói 4g vina để có ngay data cực khủng, thoải mái lướt web, học tập hay xem phim mà không sợ giật lag, không sợ mất kết nối Wifi luôn nhé!

Quảng cáo

Đăng Ký 4g Vina Data Cực Khủng HOT Nhất

Tuỳ vào từng đối tượng khách hàng sẽ được tham gia từng gói cước 4g Vina khác nhau, nếu sau khi soạn tin nhắn mà bạn nhận được phản hồi chưa thuộc đối tượng hãy thử soạn sang một gói 4g VinaPhone khác, bạn sẽ không bị tốn phí nếu gói cước chưa thành công. gói 4g Vina
Tên gói Cú pháp/Ưu đãi Đăng ký nhanh/Giá
BIG90 CHON BIG90 gửi 1543 Đăng ký nhanh
  • Miễn phí 30GB data tốc độ cao mỗi tháng. (1GB/ngày)
  • Hết 1GB tốc độ cao ngừng truy cập internet.
90.000đ/ 1 tháng
BIG120 CHON BIG120 gửi 1543 Đăng ký nhanh
  • Miễn phí 60GB data tốc độ cao mỗi tháng. (2GB/ngày)
  • Hết 2GB tốc độ cao ngừng truy cập internet.

120.000đ 1 tháng

VD90 CHON VD90 gửi 1543 Đăng ký nhanh
  • Miễn cước phí gọi nội mạng dưới 10 phút, 30 phút ngoại mạng
  • Miễn phí 1GB/ngày (30GB/tháng)

90.000đ 1 tháng

DT70 CHON DT70 gửi 1543 Đăng ký nhanh
  • Khuyến mãi 10GB/ tháng ( Hết dung lượng ngừng truy cập)
70.000đ /1 tháng
DT30 CHON DT30 gửi 1543 Đăng ký nhanh
  • Khuyến mãi 7GB/ 7 ngày ( Hết dung lượng ngừng truy cập)
30.000đ / 7 ngày
VD120M CHON VD120M gửi 1543 Đăng ký nhanh
  • Khuyến mãi 30GB/ tháng 
  • Miễn phí gọi nội mạng VinaPhone dưới 10 phút (Tối đa 1.500 phút/ tháng).
  • Tặng 30 phút gọi ngoại mạng Vina.
  • Miễn phí data truy cập các ứng dụng Facebook, Tiktok, Youtube và MyTV Mobile

120.000đ 1 tháng

VD150 CHON VD150 gửi 1543 Đăng ký nhanh
  • Miễn cước phí gọi nội mạng dưới 10 phút, 80 phút ngoại mạng
  • Miễn phí 2GB/ngày (60GB/tháng)

150.000đ 1 tháng

D159V CHON D159V gửi 1543 Đăng ký nhanh
  • 04GB/ngày + 1500p gọi nội mạng + 200p ngoại mạng + 200SMS nội mạng
159.000đ/tháng
DT90 CHON DT90 gửi 1543 Đăng ký nhanh
  • Khuyến mãi 15GB/ tháng ( Hết dung lượng ngừng truy cập)

90.000đ 1 tháng

DT120 CHON DT120 gửi 1543 Đăng ký nhanh
  • Khuyến mãi 20GB/ tháng ( Hết dung lượng ngừng truy cập)

120.000đ 1 tháng

SPOTV10 CHON SPOTV10 gửi 1543 Đăng ký nhanh
  • 5GB data
  • Miễn phí cuộc gọi nội mạng di động vinaphone mỗi dưới 20 phút.
  • 5 phút gọi di động ngoại mạng
  • Addon VTV Cab + toàn bộ nội dung thể thao của MY TV, bao gồm 2 kênh SPOTV là kênh SPOTV và kênh SPOTV 2

10.000đ/ ngày

D169G CHON D169G gửi 1543 Đăng ký nhanh
  • 210GB data/tháng + 2000 phút nội mạng + 150 phút ngoại mạng

169.000đ 1 tháng

Nói chung, “ma thuật” của các LLM như ChatGPT của OpenAI và các LLM khác đã thu hút sự chú ý của công chúng trong những tháng gần đây có thể được tóm tắt thành một trò chơi liên kết từ sử dụng nhiều dữ liệu, tiên tiến. Chatbot lấy từ bộ dữ liệu khổng lồ chứa hàng tỷ mục nhập để thử và dự đoán từ nào tiếp theo trong chuỗi. Những mô hình này có thể sử dụng cùng các điểm dữ liệu đó để đoán khá chính xác các thuộc tính cá nhân của một số người dùng.

Các nhà nghiên cứu nói rằng kẻ lừa đảo có thể lấy một bài đăng ẩn danh trên trang mạng xã hội và sau đó cho nó vào một LLM để suy luận thông tin cá nhân về người dùng. Những suy luận LLM sẽ không tiết lộ tên hoặc số an sinh xã hội của một người, nhưng chúng có thể cung cấp những manh mối mới hướng dẫn cho kẻ xấu hoạt động để lột mặt nạ người dùng ẩn danh vì những lý do độc ác khác. Ví dệ, một hacker có thể cố gắng sử dụng LLM để phát hiện vị trí của một người. Ở mức độ đen tối hơn, một đặc vụ thực thi pháp luật hoặc tình báo lý thuyết có thể sử dụng các khả năng suy luận đó để nhanh chóng cố gắng phát hiện chủng tộc hoặc dân tộc của một người bình luận ẩn danh.

Các nhà nghiên cứu lưu ý rằng họ đã liên hệ với OpenAI, Google, Meta và Anthropic trước khi xuất bản và chia sẻ dữ liệu và kết quả của họ. Những tiết lộ đó dẫn đến một “thảo luận tích cực về tác động của các suy luận LLM xâm phạm quyền riêng tư”. Bốn công ty AI được liệt kê ở trên đã không phản hồi ngay lập tức các yêu cầu bình luận của Gizmodo. 

Nếu những kỹ năng suy luận AI đó vẫn chưa đủ đáng lo ngại, các nhà nghiên cứu cảnh báo một mối đe dọa lớn hơn có thể đang rình rập ngay sau góc tường. Sớm thôi, người dùng internet có thể thường xuyên tương tác với nhiều chatbot LLM cá nhân hóa hoặc tùy chỉnh. Những kẻ xấu tinh vi có khả năng “điều khiển các cuộc trò chuyện” để dụ dỗ ngầm người dùng tiết lộ nhiều thông tin cá nhân hơn cho những chatbot đó mà không hề hay biết.

Link bài viết ChatGPT có thể “suy luận” các chi tiết cá nhân từ văn bản ẩn danh: https://vnvinaphone.vn/chatgpt-co-the-suy-luan-cac-chi-tiet-ca-nhan-tu-van-ban-an-danh.html

Đánh giá post