TẠI SAO KHÔNG THỂ COI KHO DỮ LIỆU NHƯ LÀ KHO THÔNG TIN?
Nói nôm na, kho dữ liệu là kho lưu trữ lượng lớn dữ liệu còn kho thông tin là kho lưu trữ lượng lớn thông tin. Kho dữ liệu khác kho thông tin. Từ khái niệm trên mà nói dữ liệu không đồng nghĩa với thông tin. Thông tin thường được biểu thị qua dữ liệu, thông tin phải qua xâm nhập mới mang hình thức một loại dữ liệu nào đó và có ý nghĩa nhất định. Ví dụ: Một kỹ sư khí tượng dùng các loại máy móc để ghi những dữ liệu về hướng gió, lượng mưa, nhiệt độ, độ ẩm. . . rồi vẽ các biểu đồ khí tượng, từ đó mà có được các thông tin khí tượng để đưa ra những dự báo thông tin trời mưa hay nắng. Dữ liệu biểu thị thông tin, ở trong máy tính thì thông tin là những cụm chữ số, chữ cái hay dấu hiệu được xử lý qua máy tính.
Nhìn từ hình thức tổ chức mà nói, kho dữ liệu và kho thông tin cũng có những đặc điểm riêng biệt.
Đầu tiên là dữ liệu lưu trữ trong kho dữ liệu không bí trùng lặp: Ví dụ: Ngân hàng khi làm thủ tục gửi tiền, cho vay tiền... cần ghi vào giấy tờ này, như thế thì họ tên và địa chỉ của khách hàng này phải được lưu nhớ tới 3 lần. Nếu khách hàng này chuyển cư đến nơi khác thì phải sửa lại. địa chỉ của họ trong 3 bản khai trước. Nhưng khi thiết lập kho dữ liệu khách hàng thì địa chỉ, họ tên khách hàng chỉ cần lưu nhớ 1 lần, và khi cần sửa đổi thì cũng chỉ phải sửa có một lần. Do đó mà phương pháp dùng kho dữ liệu tránh được sự trùng lặp lưu trữ dữ liệu. Nhưng còn một lượng lớn thông tin trong kho thông tin có thể có những phần được lặp lại.
Thứ nữa là sự lưu trữ dữ liệu trong kho dữ liệu là độc lập, khi nhiều sử dụng khởi động chương trình ứng dụng, không nhất thiết phải biết dữ liệu lưu trữ ở đâu và lưu trữ như thế nào, tất cả những việc đó là nhiệm vụ của máy tính, như thế giúp cho người sử dụng chỉ việc tập chung vào thiết lập được một chương trình ứng dụng hay. Còn đối với những thông tin lưu trữ trong kho thông tin, người sử dụng cần phải biết chính xác từng loại thông tin được lưu trữ ở đâu sau đó mới có thể lấy ra những thông tin đó.
Cuối cùng là sự lưu trữ dữ liệu vào kho dữ liệu thì cần có cách thức nhất định, còn lưu trữ thông tin vào kho thông tin thì không cần cách thức gì cả, chỉ cần chú trọng đến các loại thiết bị lưu trữ thông tin ví dụ như: cuộn phim, bản vẽ, đĩa từ, đĩa chuyến đi. . . chỉ cần đảm bảo những thiết bị này tốt không hỏng thì có thể đảm bảo lưu giữ được thông tin.