HÃY NHẦM LẪN MỘT CÁCH CHÍNH XÁC
Để hiểu phải tính đếm các sai số ngẫu nhiên như thế nào ta phải tìm hiểu một khái niệm đã được đưa vào vật lý học từ những trò chơi may rủi: khái niệm xác suất, mà từ thế kỷ XIX đã có một vị trí chắc chắn trong các lý thuyết vật lý. Ta có thể thấy rõ điểm này trong ví dụ về con xúc xắc (một khối lập phương có ghi số điểm trên mỗi mặt). Người ta gọi sự xuất hiện các số từ 1 đến 6 mỗi lần thả là một biến cố hay một kết quả.
Khi số lần N thả con xúc xắc là đủ lớn thì số lần xuất hiện số l : Ni, xuất hiện số 2: N2, số 3: N3 v.v... thực tế là giống nhau (nếu con xúc xắc được làm từ một vật liệu đồng nhất). Số lần thả con xúc xắc (mẫu) càng lớn thì số lần xuất hiện các số khác nhau càng ít khác nhau. Các biến cố này được gọi là các biến cố đồng xác suất còn số p (Ni) = Ni /N được gọi là xác suất của biến cố i (khi số lần thả là lớn hay như người ta thường nói, khi số thống kê lớn). Trong trường hợp này, xác suất của một biến cố bất kỳ p = l /6. Nếu con xúc xắc là của bọn cờ gian bạc lận (nghĩa là một mặt nào đó được làm cho nặng hơn các mặt khác), thì tần suất xuất hiện các mặt khác nhau sẽ khác nhau, song tổng xác suất của tất cả các kết quả khả dĩ vẫn không đổi và bằng 1.
Định nghĩa xác suất như thế không hoàn toàn nghiêm ngặt nếu xét theo quan điểm toán học, song nó giúp ta hiểu được các quy tắc làm việc với các sai số ngẫu nhiên. Tuy nhiên nó không giúp ta xử lý dễ dàng hơn các kết quả thí nghiệm vì các kết quả đo thường không phải là một số nguyên mà là một số thập phân (số hữu tỷ): đại lượng đo được không gián đoạn mà lại liên tục. Sự lặp lại của các số trong các kết quả đo ít khi xẩy ra, và do vậy xác suất lặp lại một số liệu cụ thể nào đó là hết sức thấp (và giảm khi số mẫu tăng lên). Khi đó người ta nói đến xác suất p (x,x) của việc xuất hiện một số liệu - kết quả x trong một khoảng x nào đó (chẳng hạn từ 10,34 đến 10,35) và đưa vào khái niệm mật độ xác suất w(x) = p(x, x). Đó không còn là một số nữa mà là một hàm số.
Nếu biết được phân số xác suất p (Ni) đối với tất cả các kết quả khả dĩ hay là biết được w(x) đối với đại lượng biến đổi liên tục ta có thể tính được giá trị trung bình mà các giá trị thu được đều dao động xung quanh nó. Đó cũng là mục đích của chúng ta, giá trị đúng của một đại lượng - là kỳ vọng toán học của nó. Ở ví dụ về con xúc xắc có thể nhận thấy mối liên hệ thú vị giúp nhà nghiên cứu tránh được cái công việc vừa mất thì giờ vùa buồn tẻ là phải lấy tổng các kết quả của nhiều ''thí nghiệm'' khi đã biết được hàm phân bố xác suất. Thật vậy, số lần xuất hiện số l, số 2,.v.v… giống nhau và bằng 1/6 tổng số lần thả xúc xắc N, nghĩa là để xác định trung bình số học của tất cả các giá trị số xuất hiện ta chỉ cần tính giá trị của biểu thức:
= 3,5
Song số này bằng 1.p1 + 2.p2 + 3.p3 + 4.p4 + .5.p5 + 6.p6.
Trong trường hợp tổng quát, ngay cả nếu các xác suất không giống nhau kỳ vọng toán học sẽ bằng M = hay đối với một đại lượng liên tục
Kỳ vọng toán học không phải là đặc trưng duy nhất cho sự phân bố. Nếu trên mặt của con xúc xắc ta ghi ba mặt bằng số 3, ba mặt bằng số 4, thì giá trị trung bình của các điểm số xuất hiện cũng sẽ vẫn thế, tuy nhiên các kết quả của các lần thả riêng rẽ sẽ nằm xung quanh giá trị trung bình dầy đặc hơn. Độ rộng phân bố (mức độ ''phân tán'' của nó) được mô tả bằng giá trị bình phương trung bình của độ lệch khỏi kỳ vọng toán học (độ lệch được lấy bình phương để lấy tổng các số không âm và tổng thu được sẽ khác không). Đại lượng này được gọi là phương sai.
Hay
Căn bậc hai của phương sai được gọi là độ lệch tiêu chuẩn.