“Chóng mặt” với sự biến đổi của Vũ trụ Số
(ICTPress) - Vũ trụ số sẽ có quy mô 40 ZB vào năm 2020, tương đương với 5.247 GB dữ liệu trên mỗi đầu người trên thế giới, với mức tăng trưởng 50 lần tính từ đầu năm 2010. Chúng ta mới chỉ khai thác được một phần rất nhỏ tiềm năng của dữ liệu khổng lồ trên thế giới, mặc dù khối lượng dữ liệu hữu ích đang gia tăng.
Vũ trụ số đang “giãn nở” theo cấp số nhân
Tập đoàn EMC vừa công bố các kết quả của Nghiên cứu Vũ trụ Số của IDC do EMC tài trợ với tiêu đề: “Dữ liệu khổng lồ, Ảnh hưởng lớn hơn của dữ liệu số và tốc độ tăng trưởng cao nhất tại vùng Viễn Đông” (“Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East”). Đã được triển khai đến nay là năm thứ sáu, nghiên cứu này đo lường và dự báo khối lượng thông tin số được tạo ra và sao chép mỗi năm - bao gồm cả những phát hiện về “Những khiếm khuyết liên quan đến dữ liệu khổng lồ” (“Big Data Gap”) hay là những khiếm khuyết giữa lượng dữ liệu có giá trị tiềm ẩn và lượng giá trị thực sự thu được; cấp độ bảo mật dữ liệu cần thiết so với những gì được thực sự cung cấp cũng như những ý nghĩa về mặt địa lý của dữ liệu của thế giới.
Số liệu từ nghiên cứu này cho thấy, sự phổ biến của các thiết bị như PC và điện thoại thông minh trên toàn thế giới, mức độ truy cập Internet cao hơn tại các thị trường mới nổi và sự bùng nổ những dữ liệu từ những thiết bị máy móc như là camera giám sát an ninh hay công tơ điện, nước thông minh góp phần làm cho vũ trụ số mở rộng gấp đôi chỉ trong vòng 2 năm qua, lên tới một khối lượng khổng lồ là 2,8 ZB.
Vũ trụ Số: Sự gia tăng gấp 50 lần tính từ đầu năm 2010 đến cuối năm 2020 |
Theo dự báo của IDC, vũ trụ số sẽ có quy mô 40 ZB vào năm 2020, tương đương với 5.247 GB dữ liệu trên mỗi đầu người trên thế giới. Con số này vượt 14% so với con số dự báo trước đây, tương ứng với mức tăng trưởng 50 lần tính từ đầu năm 2010.
Như vậy, Vũ trụ số sẽ tăng gấp đôi sau mỗi năm từ nay đến năm 2020. Sẽ có bình quân khoảng 5.247 GB dữ liệu trên mỗi đầu người trên trái đất vào năm 2020. Một nhân tố chính đằng sau sự mở rộng của vũ trụ số là sự tăng trưởng của dữ liệu do máy móc tạo ra, từ 11% của vũ trụ số vào năm 2005 lên hơn 40% vào năm 2020. Dữ liệu do máy móc tạo ra sẽ có tốc độ tăng trưởng theo dự báo tới năm 2020 là 15 lần.
Tài nguyên số đang bị lãng phí
Nghiên cứu đã phát hiện ra rằng mặc dù có sự mở rộng chưa từng có của vũ trụ số do những khối lượng dữ liệu khổng lồ đang được tạo ra hàng ngày bởi con người và máy móc, nhưng theo ước tính của IDC, mới chỉ có 0,5% toàn bộ dữ liệu của thế giới được phân tích.
Khoảng cách dự liệu lớn chưa được đánh dấu (2012) |
Tiềm năng của Dữ liệu Khổng lồ nằm ở khả năng tạo ra được giá trị từ những kho dữ liệu lớn còn chưa được khai thác. Tuy nhiên, phần lớn dữ liệu mới vẫn là dữ liệu ở dưới dạng các file còn chưa được đánh dấu (tagged) và dữ liệu phi cấu trúc. Nói khác đi là chúng ta còn biết rất ít về những dữ liệu này.
Năm 2012, 23% (643 exabyte) dữ liệu trong vũ trụ số sẽ là hữu ích cho Dữ liệu Khổng lồ nếu được đánh dấu và phân tích. Tuy nhiên, hiện tại mới chỉ có 3% dữ liệu hàm chứa lợi ích tiềm ẩn được đánh dấu và mới chỉ có một số phần trăm dữ liệu nhỏ hơn được phân tích. Theo nghiên cứu này, sẽ có tới 2.8 ZB được tạo ra và sao chép trong năm 2012.
Khối lượng dữ liệu hữu ích đang gia tăng với sự mở rộng của vũ trụ số. Tới năm 2020, 33% dữ liệu trong vũ trụ số (hơn 13.000 exabytes) sẽ là Dữ liệu Khổng lồ có giá trị nếu được đánh dấu và phân tích.
Phần lớn vũ trụ số chưa được bảo vệ
Khối lượng dữ liệu cần được bảo vệ đang phát triển nhanh hơn là chính bản thân vũ trụ số, nhưng các biện pháp bảo vệ lại chưa theo kịp được với yêu cầu. Ở thời điểm năm 2010, chỉ có không đầy 1/3 vũ trụ số cần có các biện pháp bảo vệ dữ liệu, tuy nhiên tỷ lệ đó được dự báo vượt quá 40% vào năm 2020.
Năm 2012, mặc dù có khoảng 35% thông tin trong vũ trụ số đòi hỏi có một số biện pháp bảo vệ dữ liệu nhất định, mới chỉ có dưới 20% vũ trụ số thực sự có được những biện pháp bảo vệ này. Cấp độ bảo vệ là khác nhau tại các khu vực khác nhau. Tại khu vực các thị trường mới nổi, mức độ bảo vệ thấp hơn rất nhiều.
Dữ liệu chưa được bảo vệ (% dữ liệu được dự báo cần sự bảo vệ nhưng chưa được bảo vệ) |
Những thách thức như là các tấn công tinh vi (advanced threat), sự thiếu hụt các kỹ năng an ninh bảo mật và sự không tuân thủ các chuẩn mực về an ninh mạng của người dùng và doanh nghiệp sẽ tiếp tục làm cho vấn đề trở nên phức tạp.
Dự đoán về một sự hoán đổi vai trò địa lý
Nghiên cứu năm nay đánh dấu lần đầu tiên IDC có thể biết được dữ liệu trong vũ trụ số được thu thập hoặc sử dụng lần đầu tiên ở đâu, và qua đó cho thấy có một số thay đổi mạnh mẽ đang diễn ra.
Tỷ lệ phân chia vũ trụ số (Vàng: Mỹ, Đỏ: Tây Âu: Xanh nhạt: Trung Quốc, Xám: Ấn Độ, Xanh đen: Thế giới còn lại) |
Mặc dù ở vào những thời điểm ban đầu, vũ trụ số là một hiện tượng của thế giới phát triển, điều đó sẽ thay đổi khi dân số tại các thị trường mới nổi bắt đầu có những tác động lớn hơn. Các thị trường mới nổi chỉ chiếm 23% vũ trụ số ở thời điểm 2010, thị phần của họ đã tăng lên và đạt 36% vào năm 2012. Tới năm 2020, theo dự báo của IDC, 62% vũ trụ số sẽ thuộc về các thị trường mới nổi. Tỷ lệ phân chia vũ trụ số hiện tại là: Mỹ - 32%, Tây Âu - 19%, Trung Quốc - 13%, Ấn Độ - 4%, phần còn lại của thế giới - 32%. Tới năm 2020, theo dự báo, Trung Quốc sẽ tạo ra 22% dữ liệu của thế giới.
Tới năm 2020, các thị trường mới nổi sẽ thay thế cho thế giới phát triển để trở thành khu vực tạo ra phần lớn dữ liệu của thế giới.
Bùng nổ của điện toán đám mây
Khi cơ sở hạ tầng của vũ trụ số có mức độ kết nối cao hơn, thông tin sẽ không chỉ bó hẹp trong khu vực nơi nó được sử dụng, hoặc được yêu cầu. Tới năm 2020, IDC dự báo có gần 40% dữ liệu sẽ được “chạm đến” bởi điện toán đám mây (có thể là điện toán đám mây riêng và điện toán đám mây công cộng), có nghĩa là ở đâu đó trong quá trình từ lúc khởi tạo đến lúc sử dụng của một byte dữ liệu, nó sẽ được lưu trữ hoặc xử lý trong môi trường điện toán đám mây.
Vũ trụ số và đám mây (2020) (Vàng: Chưa được đám mây “chạm” tới (25.030 EB), Cam: Đã được lưu trữ trên đám mây (5.208 EB), Xanh đen: Sẽ được đám mây “chạm” thêm (9.788EB) (Được xử lý hoặc được truyền tải nhờ đám mây, nhưng chưa được lưu trữ) |
Số lượng máy chủ trên toàn thế giới được dự báo gia tăng thêm 10 lần và lượng thông tin được trực tiếp quản lý bởi các trung tâm dữ liệu doanh nghiệp sẽ tăng thêm 14 lần. Điện toán đám mây ngày càng đóng một vai trò quan trọng hơn trong việc quản lý dữ liệu khổng lồ.
Loại dữ liệu được lưu trữ trong môi trường điện toán đám mây cũng sẽ trải qua một sự thay đổi lớn trong vòng vài năm tới. Tới năm 2020, IDC dự báo có tới 46,7% dữ liệu trong môi trường điện toán đám mây là liên quan đến giải trí chứ không phải là dữ liệu doanh nghiệp. Dữ liệu từ camera giám sát an ninh, dữ liệu từ các thiết bị nhúng và dữ liệu y tế cũng như thông tin được tạo bởi máy tính, điện thoại và các thiết bị điện tử tiêu dùng sẽ chiếm phần còn lại.
Lượng thông tin được lưu trữ trong vũ trụ số về những người dùng cá nhân vượt quá lượng dữ liệu do chính bảo thân họ tạo ra. Tây Âu hiện đang có mức đầu tư lớn nhất để quản trị vũ trụ số, ở mức chi tiêu 2,49 đô la Mỹ trên mỗi GB dữ liệu. Mỹ đứng thứ hai với mức đầu tư 1,77 USD trên mỗi GB, theo sau là Trung Quốc với 1,31 USD trên mỗi GB và Ấn Độ ở mức 0,87 USD trên mỗi GB.
Đầu tư để quản lý Vũ trụ Số theo vùng (2012) (Theo thứ tự: Mỹ, Tây Âu, Trung Quốc, Ấn Độ) (Chi phí trên EB) |
Cùng với sự mở rộng mọi hướng của Vũ trụ số, việc đầu tư vào trang thiết bị phần cứng, phần mềm, dịch vụ CNTT, viễn thông và nhân viên, những phần được coi là “cơ sở hạ tầng” của vũ trụ số sẽ có tốc độ tăng trưởng 40% từ năm 2012 đến năm 2020. Việc đầu tư vào các lĩnh vực trọng tâm như là quản trị lưu trữ, an ninh, dữ liệu khổng lồ và điện toán đám mây sẽ gia tăng nhanh hơn nhiều.
Kết quả nghiên cứu của IDC cho thấy Vũ trụ Số đang “quay” với tốc độ chóng mặt, nhưng phần lớn “động năng” này đang bị lãng phí. Để tận dụng được “năng lượng”, biến nó trở nên hữu ích, các tổ chức, doanh nghiệp cần có chiến lược đầu tư thông minh vào hệ thống CNTT.
Phó Chủ tịch cao cấp phụ trách các Hoạt động và Marketing Sản phẩm Tập đoàn EMC Jeremy Burton chia sẻ: “Khi khối lượng và độ phức tạp của dữ liệu đi vào các doanh nghiệp từ mọi phương diện gia tăng, bộ phận CNTT có thể lựa chọn, hoặc là chấp nhận tình trạng mất kiểm soát do quá tải thông tin hoặc có thể triển khai những bước đi cần thiết để khai thác tiềm năng to lớn đi kèm theo tất cả những luồng dữ liệu đó. Nghiên cứu năm nay nhấn mạnh cơ hội to lớn dành cho những doanh nghiệp đang không chỉ hiểu rõ những lợi ích tiềm ẩn của vũ trụ số mà còn ý thức rõ ràng về tầm quan trọng của việc điều hướng trong vũ trụ đó với mức độ cân đối thích hợp giữa công nghệ, các hoạt động bảo mật dữ liệu và các kỹ năng CNTT”.
Mạnh Vỹ