Tài liệu: Tại sao dùng cách thức nhập chữ Hán khác nhau có thể tìm thấy cùng một chữ Hán trong máy tính?

Tài liệu
Tại sao dùng cách thức nhập chữ Hán khác nhau có thể tìm thấy cùng một chữ Hán trong máy tính?

Nội dung

TẠI SAO DÙNG CÁCH THỨC NHẬP CHỮ HÁN KHÁC NHAU CÓ THỂ TÌM THẤY CÙNG MỘT CHỮ HÁN TRONG MÁY TÍNH

 

Hiện nay máy tính ở Trung Quốc có rất nhiều cách đánh chữ Hán, mỗi cách đánh khác nhau lại có những mã nhập khác nhau, nhưng chúng đều có thể tìm ra được cùng một chữ Hán. Ví dụ: sử dụng phiên âm đánh chữ ''ma'', hoặc dùng cách chọn 5 nét chữ thì nhập ''dcg'' hoặc khi dùng ''Mã Trịnh'' đánh ''gxv.v. . .'', đều có thể tìm ra được chữ mã.

Text Box:  Tại sao lại như thế?

Do các cách này đều theo một tiêu chuẩn chung, đó là mã nhập đánh trên bàn phím tự động chuyển đổi thành ''mã số trong” của máy tính. Đối lập với ''mã số trong” là ''mã số ngoài” là mã số nhập chữ Hán đánh trên bàn phím, ''mã số ngoài” là mã số đại diện cho chữ Hán được tạo ra để dễ nhớ và dễ thành thạo khi sử dụng.

GB2312 - 80 là một loại mã số chữ Hán trao đổi thông tin tiêu chuẩn quốc gia phỏng theo tiêu chuẩn chung này, gọi là mã đơn vị khu vực quốc tế hay mã trao đổi Hán tự. Hệ thống mã số này rảo khắp 94 khu vực, mỗi khu vực có 94 kí tự và 94 đơn vị. Bộ phận thứ nhất của mã này là mã khu vực và mã thứ hai là mã đơn vị, mã đơn vị và mã khu vực đều là những chữ số giới hạn đến 10, ví dụ chữ ''mã'' có mã đơn vị khu vực là 3475.

Mã này có quan hệ mật thiết với mã số quốc tế, nhưng mã quốc tế là mã mà có giới hạn đơn vị đến 16. Ví dụ: chữ ''mã'' có mã đơn vị khu vực là 3475 cần chuyển thành 224B (A, B, C, D, E, F trong giới hạn đến 16 tương đương với 10, 11, 12, 13, 14, 15 trong giới hạn đến 10), Vì thế khu vực có 00.20 trong mã quốc tế là khu vực trống, hay nói đúng hơn là mã số quốc tế bắt đầu từ khu vực 21 của giới hạn đến 16 mới thiết lập mã số. Do đó mà mã khu vực và mã đơn vị đều phải thêm mã số 20. Ví dụ: mã đơn vị khu vực của ''mã'' là 224B khi trở thành mã quốc tế sẽ là 224B+2020 tức là 426B: Byte của nó chia thành 42 và 6B.

Mã số nhớ trong máy tính không phải là mã đơn vị khu vực, cũng không phải là mã quan trọng, mà là mã số hán tự trong máy và có quan hệ mật thiết với hai mã số trên. Nhập thêm mã số 80 của giới hạn đến 16 vào mã quốc tế ta được mã số hán tự trong máy. Do đó, ''mã'' hiển thị trên màn hình. Khi sử dụng một phương pháp nhập chữ nào đó, cho dù là sử dụng phiên âm hay chọn nét chữ, thì mã số đánh ở bàn phím là mã số ngoài của Hán tự, rồi chúng chuyển thành mã số trong mới có thể lưu trữ và hiển thị. Mã số ngoài có thể là khác nhau, còn mã số trong là duy nhất.

Mã số Hán tự lấy ví dụ ở trên là mã số 2 byte, mã này có thể sử dụng loại mã 3 byte, 4 byte. Nhưng mọi con đường đều dẫn tới một cái đích chung, cho dù là có nhiều cách nhập mã khác nhau nhưng đều có thể tìm ra được một chữ Hán.




Nguồn: bachkhoatrithuc.vn/encyclopedia/211-26-633371152881616023/Cong-nghe-thong-tin/Tai-sao-dung-cach-thuc...


Chưa có phản hồi
Bạn vui lòng Đăng nhập để bình luận