Xử lý dữ liệu phân tán để dùng chung

Việt Nam đang tiến hành công cuộc chuyển đổi số toàn diện quốc gia với việc tập trung hoàn thiện kho dữ liệu số khổng lồ để đưa vào khai thác.

Tuy nhiên, các dữ liệu hầu hết còn nằm phân tán, rải rác tại các địa phương, bộ, ngành có chức năng quản lý.

Nguồn dữ liệu phân mảnh đã gây nên tình trạng thiếu đồng bộ trong chuyển đổi số, làm chậm tiến trình xây dựng chính quyền số, kinh tế số và xã hội số. Thực tế là kho dữ liệu có những thông tin chuyên ngành không thể chia sẻ rộng rãi. Vì vậy, cần có cơ quan quản lý cấp cao nhất của địa phương (ở đây là UBND tỉnh, thành) cũng như của Chính phủ quy định cụ thể và minh bạch những cơ sở dữ liệu (CSDL) có thể dùng chung, mức độ được truy cập theo từng cấp quản lý và thừa hành.

Trong tháng 10 vừa qua, Chủ tịch UBND TP HCM đã ban hành danh mục CSDL dùng chung của TP HCM. Theo đó, TP HCM có 45 CSDL dùng chung về nhiều lĩnh vực: đô thị, giao thông, y tế, giáo dục, môi trường, lao động - việc làm, hành chính, chính sách, viễn thông... Chúng được tích hợp về kho dữ liệu dùng chung thành phố để chia sẻ cho các đơn vị có nhu cầu khai thác và sử dụng. TP HCM đưa ra 3 tập thực thể quan trọng nhất là "người dân", "thửa đất" và "doanh nghiệp". Từ đó, TP HCM xây dựng 3 nhóm dữ liệu chính, là CSDL về đất đai - đô thị (bản đồ địa chính, quản lý đất đai, thông tin địa lý); CSDL người dân (thông tin nhân khẩu - cư trú, hộ tịch); CSDL tài chính - doanh nghiệp (đăng ký kinh doanh, người nộp thuế, xuất - nhập khẩu).

Tất nhiên, ngoài các kho dữ liệu dùng chung của cấp tỉnh thành và các bộ, ngành, cần có kho dữ liệu dùng chung cấp quốc gia. Trên quy mô quốc gia, kho dữ liệu dùng chung có nguồn từ các CSDL quốc gia và các tỉnh - thành, bộ - ngành. Với đặc thù của mình, CSDL quốc gia về dân cư do Bộ Công an quản lý là cái lõi của kho dữ liệu dùng chung quốc gia. Ngày 4-11-2022, Bộ Công an đã ban hành Thông tư số 46/2022/TT-BCA quy định về việc kết nối, chia sẻ và khai thác thông tin giữa CSDL quốc gia về dân cư với CSDL quốc gia, CSDL chuyên ngành và hệ thống thông tin khác. Nguyên tắc kết nối, chia sẻ và khai thác thông tin này phải tuân thủ quy định của pháp luật về bảo vệ dữ liệu cá nhân; bảo đảm các quy định về bảo mật, an ninh, an toàn thông tin mạng. Không làm ảnh hưởng đến quyền lợi và trách nhiệm của cơ quan, tổ chức, cá nhân liên quan, không được xâm phạm quyền về đời sống riêng tư, bí mật cá nhân, bí mật gia đình trừ trường hợp pháp luật có quy định.

CSDL dùng chung luôn phải dựa trên hạ tầng số đủ mạnh và an toàn. Hiện Việt Nam có các công nghệ phần cứng lẫn thuật toán hỗ trợ như trí tuệ nhân tạo, dữ liệu lớn, đám mây… Nhưng phải cần giải pháp cấp thiết xây dựng kho dữ liệu dùng chung để khai thác hiệu quả.