Tài liệu: Sắp chữ bằng máy vi tính ở Trung Quốc

Tài liệu
Sắp chữ bằng máy vi tính ở Trung Quốc

Nội dung

SẮP CHỮ BẰNG MÁY VI TÍNH Ở TRUNG QUỐC

 

Kỹ thuật in bằng chữ rời do Tất Thắng phát minh ở Trung Quốc vào khoảng 1041 đến 1048 đã ra đời, chứ không phải đợi đến khi Johannes Gutenberg phát minh vào Thế kỷ XV ở Châu Âu như mọi người vẫn thường nghĩ. Con chữ mà Tất Thắng sử dụng được nặn bằng đất rồi đem nung; nhưng về sau ở Trung Quốc, người ta thường dùng con chữ bằng gỗ, sứ hoặc kim loại. Với sự xuất hiện con chữ bằng chì, phương pháp sắp chữ ''nóng'' tức đúc chữ bằng chì nấu chảy được dùng một cách phổ biến để sản xuất hàng loạt các ấn phẩm.

Chữ chì giá thành rẻ, có thể nấu lại sau khi đã sử dụng, có nghĩa là cùng một khối nguyên liệu ấy có thể dùng đi dùng lại mãi mãi khiến cho kỹ thuật này chiếm địa vị vững bền trong ngành in qua hàng bao thiêu Thế kỷ. Nhưng, với tiến bộ mau lẹ của kỹ thuật sắp chữ chụp và đặc biệt là kỹ thuật sắp chữ bằng máy tính điện tử trong tháng năm gần đây, việc ấn loát bằng con chữ chì hiển nhiên đã trở nên quá lỗi thời.

Ở Trung Quốc, việc sắp chữ rời bằng tay từ lâu đã là một công việc phức tạp và tốn công sức vì khối lượng khổng lồ của các con chữ trong tiếng Trung Quốc. Người thợ sắp chữ phải vất vả đi đi lại lại giữa năm sáu hộp chữ để lựa chọn cho được những chữ cần dùng.

Vấn để ấy được đặt ra dưới dạng hiện đại đối với kỹ thuật sắp chữ bằng máy tính điện tử. Một bàn phím thông thường có thể đủ để đưa vào máy tính toàn bộ những con chữ trong các ngôn ngữ phương Tây, nhưng lại có quá ít phím tiếp nhận hàng nghìn con chữ Trung Quốc. Có hai phương pháp để giải quyết vấn đề. Một là làm một bàn phím cực lớn, mỗi phím cho một chữ Hán. Việc lựa chọn chữ và đưa vào máy sẽ do người điều khiển thực hiện. Phương pháp này lợi thế là người điều khiển có thể nhìn thấy con chữ mà mình đưa vào máy. Cái bất lợi là bàn phím sẽ phải hết sức lớn và việc sắp đặt các phím sẽ rất phức tạp. Người điều khiển sẽ phải tốn rất nhiều thì giờ để học thuộc lòng vị trí mỗi phím, và việc lần tìm chữ giữa hàng loạt phím ấy quả thực là một công việc vất vả.

Phương pháp thứ hai là chỉ dùng một bàn phím cỡ thông thường, nhưng cho phép đưa mỗi chữ Hán vào máy bằng cách sử dụng lần lượt nhiều phím khác nhau theo một đề án phản ánh kết cấu của chữ đó. Nhiều hệ thống đã được đề xuất theo nguyên lý này, tất cả đều hoạt động dựa trên kết cấu ngữ âm hoặc kết cấu hình dạng của các chữ.

Trong hệ thống dựa trên kết cấu ngữ âm, chữ Hán phải được phiên ra hệ thống mẫu âm trước khi đưa vào máy. Thí dụ, với từ “Trung Quốc” vốn được viết bằng hai chữ Hán, cần phải gõ những phím thể hiện kết cấu ngữ âm Trung Quốc. Sử dụng hệ thống này có cái tiện là chỉ cần một sự hiểu biết đơn giản cách đọc chính xác các từ và có thể không cần huấn luyện trước. Điểm bất lợi của hệ thống này là, nó có thể tạo ra rất nhiều sự trùng lặp mã chữ bởi trong tiếng Trung Quốc có quá nhiều từ đồng âm.

Nhiều phương pháp khác nhau sẽ sử dụng đến các đặc điểm của chữ Hán. Tất cả các chữ Hán được phân tích thành một số yếu tố cơ bản (nét). Những nét này nếu được sắp xếp theo một cách thích đáng trên bàn phím, thì ta có thể tập hợp chúng lại để biểu thị bất cứ một chữ Hán nào. Thí dụ chữ: . . . (quốc = nước) bao gồm . . . . và . . . . số phím cần có để đưa chữ vào máy và số mã chữ có thể trùng lặp đều có thể giảm xuống mức tối thiểu nếu chữ đó được phân tích thành các thành tố một cách chính xác. Và trong trường hợp đó, người điều khiển máy chẳng cần phải biết cách đọc chính xác của chữ. Đó là một điều rất thuận lợi vì ở Trung Quốc vốn có rất nhiều tiếng địa phương, có khi những người sinh sống cách nhau có mươi mười lăm kilômét cũng không hiểu tiếng nói của nhau.

Người ta cũng thường sử dụng một phím cho cả một từ hoặc một câu thông dụng nhằm rút ngắn quá trình thao tác vận hành máy. Một vấn đề khác nữa là văn bản chữ Hán có thể xếp theo dòng ngang cũng như dòng dọc (một số tạp chí dùng cả hai lối xếp); do đó, một hệ thống sắp chữ hoàn hảo cần phải( thích ứng với tình hình nói trên. Ngoài ra, không ít tạp Chí Trung Quốc in những bài có xen kẽ một vài từ ngữ hoặc cả một đoạn bằng tiếng nước ngoài; vì vậy chỉ cần có một hệ thống là có thể sắp được cả chữ của các văn bản tiếng Châu Âu cũng như các văn bản tiếng Trung Quốc.

Hiện nay, vấn đề lớn nhất là làm sao có thể ứng phó được với khối lượng dữ liệu đồ sộ liên quan đến việc xử lý một số lượng chữ Hán cực lớn mà mỗi chữ, đều chuyển thành ngôn ngữ của máy tính điện tử; cần có một lượng tin cao hơn gấp nhiều lần lượng tin chứa đựng trong một chữ Latinh. Nhiều biện pháp đã được nghĩ tới nhằm dồn nén lượng thông tin này dưới dạng thật ngắn gọn, sao cho bộ nhớ của máy tính khỏi bị quá tải. Đây là lĩnh vực cần phải đi sâu nghiên cứu thiều hơn nữa.

Sắp bản in tiếng trung Quốc bằng máy tính điện tử đã đạt được những tiến bộ đáng kể. Khi nó thay thế được việc dùng con chữ, chắc chắn nó sẽ có được địa vị ngày càng quan trọng trong công nghiệp ấn loát của Trung Quốc.

XU LIANSHENG[1]




Nguồn: bachkhoatrithuc.vn/encyclopedia/157-02-633386020832656250/Lich-su-Nghe-in-va-Xuat-ban/Sap-chu-bang-m...


Chưa có phản hồi
Bạn vui lòng Đăng nhập để bình luận