Saturday, June 24, 2017

Tấm ảnh chụp trên điện thoại tiết lộ gì về bạn?


Có bao người trong số chúng ta cầm điện thoại lên lúc đã tắt điện đi ngủ, và tình cờ bấm nhầm vào nút chụp ảnh. Kết quả như thể bạn chụp con mèo đen trong kho than, một hình chữ nhật đen xì. Đến lúc chuyển ảnh bằng thẻ nhớ, bạn cũng không buồn xóa nó đi, vì cho rằng dù có lọt ra ngoài, tấm hình ấy không hề chứa thông tin gì.

Đúng là tấm hình ấy không chứa thông tin gì thật không? Bài viết này hé lộ cho bạn một phần sự thật, về những thứ đang bị che giấu sau bức màn đen của công nghệ.


Là người chụp ảnh trên điện thoại và máy ảnh số, bạn chắc đã từng sử dụng thông tin EXIF của ảnh, dù bạn không biết nó gọi là EXIF. Rất đơn giản, khi bạn tìm vào phần thuộc tính của mỗi bức ảnh, hoặc biểu tượng chữ (i), bạn sẽ thấy hiện lên kích thước của ảnh (tính bằng số pixel), kich thước file (tính bằng MB), khẩu độ (ví dụ f/4), tốc độ màn trập, ISO … Hầu hết những thông tin này chỉ để mấy ông chơi ảnh mang ra khoe với nhau, và bạn cũng không cần để ý đến chúng. Đây chính là EXIF.

Nhưng bên cạnh đó, EXIF còn lưu nhiều thông tin khác. Nó lưu mẫu mã của máy ảnh (à há!), và trong trường hợp của bạn, là tên của chiếc điện thoại mà bạn đang sử dụng. Ví dụ nhìn vào EXIF, người ta biết rõ bạn dùng điện thoại Samsung S7 hay iPhone 6Plus, hay là một chiếc BPhone (lạy Chúa phù hộ cho BPhone!).

Và bạn đừng nghĩ nó chỉ lưu có mẫu mã không thôi, trên thực tế tùy hãng sản xuất, EXIF lưu cả số serial của máy ảnh đã chụp ra nó. Tôi biết là Canon và Nikon công khai thừa nhận điều này, và trên thực tế không có gì khó khăn về mặt kỹ thuật để các hãng khác cũng làm như vậy. Ngay cả khi bạn rà quét EXIF và không tìm thấy số serial của điện thoại, cũng  đừng vội mừng. Phần sau của bài viết này sẽ giải thích tại sao.

EXIF lưu ngày giờ chụp ảnh. Thôi thì cái này cũng chưa quan trọng lắm. Nhưng khi tổ hợp nó với thông tin Vị trí địa lý có trong EXIF, thì bạn coi chừng! Hầu hết các smartphone bây giờ đều có tính năng GPS, và mỗi khi bạn chụp ảnh, một nhãn geotag sẽ được dán vào EXIF, cho biết bạn vị trí thực sự của điện thoại lúc đó. Và người tình cờ đọc được EXIF sẽ nói cho bạn biết, lúc 11h đêm ngày ấy ngày nọ, bạn đang ở đâu, với địa chỉ chính xác đến cấp số nhà và ngõ, nếu bạn ở thành phố. Giờ thì bạn biết là chỉ cần bạn chịu khó chụp ảnh một chút, người ta hoàn toàn có thể dự đoán được sắp tới bạn định đi đâu, ví dụ sáng đi làm, trưa đi ăn, tối về nhà ngủ.

Thực ra còn có thể khai thác một số nội dung khác nữa. Ví dụ tên và đường dẫn file cho biết bạn lưu ảnh trên thẻ nhớ hay trong máy, cách đặt tên file cho biết bạn đã sử dụng máy đó khoảng bao nhiêu lâu (dựa trên số lượng ảnh trung bình mà một người chụp bằng điện thoại), thời điểm lưu ảnh lần cuối cho biết ảnh có bị chỉnh sửa so với ảnh gốc hay không …

Đọc đến đây, một số bạn có hiểu biết về công nghệ sẽ bảo, ngoài kia đầy phần mềm xóa EXIF. Chỉ cần chưa đến một nốt nhạc là xóa sạch bách toàn bộ các thể loại địa chỉ, thời gian, nhãn hiệu máy,  … Vâng, bạn nói đúng, nhưng có một điều bạn cần biết thêm, đó là nhà sản xuất đã có thể mã hóa những thông tin này lên các pixel. EXIF thực sự giờ đây là những chấm đen trên tấm hình của bạn.

Để hiểu được việc này, bạn sẽ cần nắm được một số khái niệm. Thứ nhất, làm cách nào lưu thông tin lên những "chấm đen".

Thực ra khá đơn giản. Bạn mở một file văn bản, gõ vào đó một số lượng tùy thích dấu cách, dấu Tab và dấu xuống dòng. Giờ đây bạn nhìn thấy gì – hoàn toàn là một văn bản trắng tinh đối với mắt thường. Nhưng máy tính có thể đếm chính xác số lượng dấu cách, và biết được sau bao nhiêu dấu cách lại đến một dấu Tab, và sau bao nhiêu dấu Tab thì đến một dấu xuống dòng. Đây chính là thông tin mà văn bản này truyền tải. Tương tự như thế, một cách thức mã màu sẽ cho phép ghi hai điểm ảnh cùng đen kịt đối với mắt thường, về thực chất là hai giá trị riêng biệt. Trong tình huống tối thiểu, điều này tương đương với một bit thông tin. Một điện thoại lắp camera 23 triệu pixel như của Sony sẽ cho bạn ghi khoảng gần 3 MB – hay là cỡ một bài hát ngắn dạng MP3 – mà vẫn hoàn toàn vô hình đối với mắt thường. Mở rộng ra, người ta có thể lưu thông tin trên pixel bất kỳ màu nào, không cứ phải là màu đen.

Thứ hai, liệu các hãng có ghi nội dung bí mật vào sản phẩm hay không?

Câu trả lời là Có. BBC ngày 21/6/2017 đã đưa tin về việc một người Mỹ bị FBI bắt dựa vào chứng cớ từ trang giấy in. Trang in đó chứa các chấm màu đặc biệt nhỏ, được thiết kế để không nhìn thấy bằng mắt thường, song mang nội dung về ngày giờ bản in được thực hiện, và số serial của chiếc máy in. Theo đó, người ta biết được rằng những trang giấy này được in ra từ một địa điểm bảo mật và tuồn ra ngoài.

Điều này đã được biết từ lâu. Người ta tin rằng ngày nay (2017) mọi hãng sản xuất máy in laser màu đều bí mật thêm các chấm – hầu hết không thể nhận biết bằng mắt thường – gọi là tracking dots. Dựa vào các chấm nhận dạng này, người ta có thể nói chính xác nhãn hiệu và số series của máy in, ngày giờ in. Từ năm 2005, trang web eff.org đã cố gắng lập nên danh sách những máy in có tracking dots, và cả những máy không có. Tuy nhiên, họ đã ngừng công việc này, có vẻ vì trên thị trường chỉ còn toàn máy có tracking dots !?

Trong các câu chuyện kể về hoạt động mật mã, điều này được gọi là kỹ thuật giấu tin. Buổi sơ khai, đó là những viên sáp có chứa mẩu giấy mang thông tin để người ta nuốt vào bụng. Đến Thế chiến 2 là thời của vi phim, giấu trong bì thư hoặc giấy viết thư bình thường. Với thời đại của ảnh kỹ thuật số và các phương tiện truyền tải nội dung trực tiếp, giấu tin lại càng phát triển mạnh để qua mặt các biện pháp giám sát. Một tin nhắn SMS dễ dàng mã được vào xấp xỉ một ngàn pixel, và khi trộn chúng lên một bức ảnh 20-30K pixel – thường bé như móng tay – thì chỉ có phân tích hình ảnh bằng máy mới họa chăng dò ra được.

Thứ ba, liệu các nhà sản xuất điện thoại có thực sự ghi nội dung vào pixel hay không?

Tôi không tìm thấy tài liệu nào khẳng định hay bác bỏ tuyệt đối, song xâu chuỗi những nội dung trên, tôi tin rằng điều đó có thật. Việc chèn các điểm ảnh mang tin quá dễ dàng, vì mắt thường không thể nào phát hiện ra chúng. Để lưu toàn bộ thông tin EXIF chỉ cần khoảng một phần mấy ngàn tổng số pixel của toàn bộ ảnh. Thậm chí, những thông tin được mã lên ảnh hoàn toàn độc lập với thông tin lưu trên EXIF. Người ta thừa sức mã cả số IMEI, số điện thoại, mã số IMSI của thẻ SIM, serial của máy, địa chỉ MAC của wifi, danh mục các cuộc gọi gần nhất … tóm lại là mọi thông tin để nhận biết nguồn gốc hình ảnh. Những nội dung này hoàn toàn không tồn tại trên EXIF.

Các bạn có thể cho rằng lập luận của tôi còn thiếu căn cứ và khá lỏng lẻo. Tuy nhiên, việc chèn nội dung bí mật vào các sản phẩm là điều hoàn toàn khả thi, và người ta đã thực hiện với các sản phẩm in ấn – vốn dễ lộ hơn sản phẩm hình ảnh rất nhiều. Tôi cho rằng các máy điện thoại chụp hình chắc chắn đã sử dụng kỹ thuật tương tự để xác định nguồn gốc ảnh, tôi chỉ không chắc về việc những thông tin nào đã được lựa chọn để định danh người chụp. Những người duy nhất có thể khẳng định danh mục thông tin này, tiếc thay lại là những người không thể lên tiếng.

Nếu là nhà sản xuất, thậm chí tôi có thể còn đẩy sự việc đi xa hơn nữa. Tôi sẽ kích hoạt và mã hóa tấm ảnh chụp bằng camera "trước" lên tấm ảnh chụp bằng camera "sau" của điện thoại, hai ảnh này được chụp cùng lúc. Đây là bằng chứng xác đáng nhất về tác giả của ảnh. Tất nhiên lượng thông tin từ ảnh mã sẽ rất thấp, để không làm ảnh hưởng đến ảnh gốc. Với một số phép thử/sai, tôi sẽ tìm ra được công thức tối ưu để nhận diện người chụp mà vẫn đảm bảo chất lượng ảnh gốc.

Bạn có thể hỏi, thế còn với các bức ảnh chụp bằng camera "trước" thì sao?

Thì người chụp tự selfie trên ảnh gốc rồi, tạo mã làm gì nữa cho mệt!



= = = = =
(*) Hiện nay, người ta đã công khai thừa nhận việc sử dụng nhận dạng các pixel hỏng của tấm ảnh để truy tìm máy đã chụp, một kiểu tương tự như giám định vết xước trên đầu đạn để tìm ra khẩu súng. Tuy nhiên cách này khá mất thời gian, vì phải giám định từng máy mới có thể xác nhận được. Kỹ thuật giấu tin trong ảnh giải quyết bài toán tương tự, với thời gian và chi phí thấp hơn rất nhiều.

No comments:

Post a Comment